Каталог вибіркових навчальних дисциплін
Технології інтелектуального аналізу даних
Кафедра, яка викладає навчальну дисципліну:
Викладач
Короткий опис навчальної дисципліни
В дисциплині розглядаються основи сучасної обробки даних – інтелектуального аналізу даних
(Data Mining, Knowledge Discovery in Data), аналітичного дослідження великих масивів інформації з метою виявлення нових раніше невідомих, практично корисних знань і закономірностей, необхідних для прийняття рішень; методи, програмні продукти і різні інструментальні засоби, які використовуються Data Mining. Курс розрахований на слухачів з базовими навиками розробки програмного забезпечення, роботи з БД (SQL) та високим рівнем підготовки з математичної статистики, теорії ймовірності тощо.
Цілі та задачі навчальної дисципліни
Метою навчальної дисципліни є ознайомлення із основними методами інтелектуального аналізу даних та технологіями їх застосування.
Задачею навчальної дисципліни є засвоєння технологій, що застосовуютсья на всіх етапах етапів інтелектуального аналізу даних, таких як: очистка даних, аналіз даних та візуалізація даних.
Результати навчання
В результаті вивчення дисципліни здобувач опанує основні технології інтелектуального аналізу даних
-кластерний аналіз
-классифікацію
-пошук асоціативних правил
Перелік тем
ТЕМА 1. Методи та технології Data Mining
Визначення даніх, вибірка, залежна і незалежна змінна.
ETL процес, стадії та етапи. Інструментарій ЕTL.
Стадії Data Mining і дії, що виконуються в рамках цих стадій.
Класифікації методів Data Mining. Порівняльна характеристика методів, заснована на їх властивості.
Суть завдань Data Mining і їх класифікація. Поняття «інформація», «знання».
ТЕМА 2. Засоби інтелектуального аналізу даних
Архітектура СУБД Microsoft SQL Server та аналітичні служби, а також способи їх взаємодії із зовнішніми програмами.
Перелік алгоритмів інтелектуального аналізу, що входять в SQL Server Analysis Service, відмінності між версіями СУБД.
Послідовність етапів вирішення задачі інтелектуального аналізу даних.
ТЕМА 3. Алгоритми інтелектуального аналізу даних
Алгоритму взаємозв'язків і алгоритмів кластеризації послідовностей.
Алгоритм Байєса, алгоритми дерев рішень і лінійної регресії.
Алгоритми часових рядів.
Алгоритм нейронних мереж та логістичної регресії.
Особливості реалізації алгоритмів ІАД у SQL Server.
Система оцінювання
Система оцінювання рейтингова. Максимальна кількість балів 100. 80 балів лабораторні роботи + СРС. 20 балів - підсумковий тест.
Форма контролю
залік