UA / EN
Освіта

Каталог вибіркових навчальних дисциплін


Програмування мовою R

Кафедра, яка викладає навчальну дисципліну:
Кафедра комп'ютерних наук
Короткий опис навчальної дисципліни
Одним з основних інструментів пізнання світу є обробка даних, які людина одержує з різних джерел. Суть сучасного статистичного аналізу полягає в інтерактивному процесі, що складається з дослідження, візуалізації та інтерпретації потоків інформації, що надходять із зовні. R – це мова програмування й середовище для статистичних обчислень і графічного аналізу із відкритим кодом, яка підтримується великою та активною дослідницькою спільнотою у всьому світі. Дисципліна включає лекції, лабораторні роботи, модульні контрольні роботи та самостійну роботу.
Цілі та задачі навчальної дисципліни
Ціллю навчальної дисципліни є надання студентам теоретичних знань та практичних навичок з використання мови програмування R для статистичного аналізу, прогнозування та візуалізації даних. Основні задачі дисципліни - оволодіння студентами сучасними методами та засобами проведення аналізу даних, технологіями візуалізації даних.
Результати навчання
Набуття студентом наступних компетентностей: • загальні компетентності ЗК1. Здатність до абстрактного мислення, аналізу та синтезу. ЗК2. Здатність застосовувати знання у практичних ситуаціях. ЗК3. Знання та розуміння предметної області та розуміння професійної діяльності. ЗК6. Здатність вчитися й оволодівати сучасними знаннями. ЗК7. Здатність до пошуку, оброблення та аналізу інформації з різних джерел. ЗК8. Здатність генерувати нові ідеї (креативність). ЗК11. Здатність приймати обґрунтовані рішення. ЗК12. Здатність оцінювати та забезпечувати якість виконуваних робіт. • спеціальні (фахові, предметні) компетентності СК1. Здатність до математичного формулювання та досліджування неперервних та дискретних математичних моделей, обґрунтовування вибору методів і підходів для розв’язування теоретичних і прикладних задач у галузі комп’ютерних наук, аналізу та інтерпретування. СК2. Здатність до виявлення статистичних закономірностей недетермінованих явищ, застосування методів обчислювального інтелекту, зокрема статистичної, нейромережевої та нечіткої обробки даних, методів машинного навчання та генетичного програмування тощо. СК7. Здатність застосовувати теоретичні та практичні основи методології та технології моделювання для дослідження характеристик і поведінки складних об'єктів і систем, проводити обчислювальні експерименти з обробкою й аналізом результатів. СК11. Здатність до інтелектуального аналізу даних на основі методів обчислювального інтелекту включно з великими та погано структурованими даними, їхньої оперативної обробки та візуалізації результатів аналізу в процесі розв’язування прикладних задач.
Перелік тем
Модуль 1. Вступ до аналізу даних. Змістовий модуль 1. Що таке аналіз даних. Як пов’язана статистика з аналізом даних – типи даних, рівні виміру даних, матриці даних. Встановлення середовища RStudio. Основні операції на R. Типи даних в R. Змістовий модуль 2. Частотні таблиці, опис центральної тенденції, квартилі та інтерквартильний розмах, дисперсія та середньоквадратичне відхилення. Типи R об’єктів. Модуль 2. Описова статистика. Огляд основних понять. Очищення даних з допомогою R. Змістовий модуль 3. Візуальний аналіз даних. Трактування результатів. Парадокс Сімпсона. Змістовий модуль 4. Матриця даних. Центральна тенденція (середнє значення, медіана, мода). Квартилі та інтерквартильний розмах. Коробчата діаграма на мові R. Змістовий модуль 5. Дисперсія та середньоквадратичне відхилення. Використання бібліотек dplyr та ggplot2 у середовищі RStudio. Імпорт даних та дослідження даних (кількість вимірів, відображення першої та останньої частин об’єкта, імен об’єкта) на мові R. Модуль 3. Основи теорії ймовірностей. Класичні розподіли. Кореляція та регресія. Змістовий модуль 6. Основні поняття теорії ймовірності (випробування, подія, ймовірність). Ймовірність кількох подій (сумісні та несумісні події, залежні та незалежні події). Дерева прийняття рішень. Трансформація даних на мові R. Змістовий модуль 7. Теорема Байеса. Візуалізація даних на мові R (діаграми). Змістовий модуль 8. Класичні розподіли. Біноміальний розподіл. Нормальний розподіл. Візуалізація біноміального та нормального розподілів на мові R. Змістовий модуль 9. Ймовірність отримання конкретного z-значення (алгоритм та його реалізація на мові R). Змістовий модуль 10. Розподіл Пуассона. Геометричний розподіл. Рівномірний розподіл. Експоненціальний розподіл. Приклади реалізації вказаних розподілів на мові R. Змістовий модуль 11. Коваріація та кореляція. Їх приклади на мові R. Екстрополяція. Змістовий модуль 12. Лінійна регресія. Модуль 4. Вивідна статистика. Центральна гранична теорема. Побудова довірчих інтервалів. Змістовий модуль 13. Описова та вивідна статистика. Генеральна сукупність, вибірка. Репрезентативна та нерепрезентативна вибірки. Змістовий модуль 14. Центральна гранична теорема. Застосування центральної граничної теореми на мові R. Змістовий модуль 15. Довірчий інтервал. Рівень довіри. Розмір вибірки. Приклади на мові R. Змістовий модуль 16. Довірчий інтервал для середнього значення. План побудови довірчого інтервалу. Приклади на мові R.
Система оцінювання
Лаборатоні роботи – 8 балів (8 л.р. х 8 балів = 64 бала), Модульна контрольна робота – 10 балів (2 м.к.р. х 10 балів = 20 балів), Самостійна робота – 16 балів.
Форма контролю
екзамен