UA / EN
Освіта

Каталог вибіркових навчальних дисциплін


Програмування мовою R

Кафедра, яка викладає навчальну дисципліну:
Кафедра комп'ютерних наук
Короткий опис навчальної дисципліни

Метою викладання навчальної дисципліни «Програмування мовою R» є надання студентам теоретичних знань та практичних навичок з мови програмування R, що призначена для статистичного аналізу, прогнозування та візуалізації даних.

Цілі та задачі навчальної дисципліни

Цілі та задачі вивчення навчальної дисципліни є:

  • ознайомлення з поняттям «аналіз даних», зв’язком статистики з аналізом даних – типи даних, рівні виміру даних, матриці даних, частотні таблиці, опис центральної тенденції, квартилі та інтерквартильний розмах, дисперсія та середньоквадратичне відхилення в мові програмування R;
  • реалізація основних питань теорії ймовірності та аналізу даних (ймовірність настання подій, теорема Байеса,  класичні розподіли  (біномінальний та нормальний розподіли)) в мові програмування R;
  • коваріація та кореляція, лінійна регресія в R;
  • описова статистика в R;
  • вивідна статистика в R;
  • центральна гранична теорема в R;
  • довірчі інтервали та розмір вибірки в R;
  • візуалізація даних в R;
  • прогнозування даних в R.
Результати навчання

Здатність до абстрактного мислення, аналізу та синтезу.

Здатність застосовувати знання у практичних ситуаціях.

Знання та розуміння предметної області та розуміння професійної діяльності.

Здатність вчитися й оволодівати сучасними знаннями.

Здатність до пошуку, оброблення та аналізу інформації з різних джерел.

Здатність генерувати нові ідеї (креативність).

Здатність приймати обґрунтовані рішення.

Здатність оцінювати та забезпечувати якість виконуваних робіт.

Здатність до математичного формулювання та досліджування неперервних та дискретних математичних моделей, обґрунтовування вибору методів і підходів для розв’язування теоретичних і прикладних задач у галузі комп’ютерних наук, аналізу та інтерпретування.

Здатність до виявлення статистичних закономірностей недетермінованих явищ, застосування методів обчислювального інтелекту, зокрема статистичної, нейромережевої та нечіткої обробки даних, методів машинного навчання та генетичного програмування тощо.

Здатність застосовувати теоретичні та практичні основи методології та технології моделювання для дослідження характеристик і поведінки складних об'єктів і систем, проводити обчислювальні експерименти з обробкою й аналізом результатів.

Здатність до інтелектуального аналізу даних на основі методів обчислювального інтелекту включно з великими та погано структурованими даними, їхньої оперативної обробки та візуалізації результатів аналізу в процесі розв’язування прикладних задач.

Перелік тем

Модуль 1. Вступ до аналізу даних.

Змістовий модуль 1. Що таке аналіз даних. Як пов’язана статистика з аналізом даних – типи даних, рівні виміру даних, матриці даних. Встановлення середовища RStudio. Основні операції на R. Типи даних в R.

Змістовий модуль 2. Частотні таблиці, опис центральної тенденції, квартилі та інтерквартильний розмах, дисперсія та середньоквадратичне відхилення. Типи R об’єктів.

 

Модуль 2. Описова статистика. Огляд основних понять. Очищення даних з допомогою R.

Змістовий модуль 3. Візуальний аналіз даних. Трактування результатів. Парадокс Сімпсона.

Змістовий модуль 4. Матриця даних. Центральна тенденція (середнє значення, медіана, мода). Квартилі та інтерквартильний розмах. Коробчата діаграма на мові R.

 

Змістовий модуль 5. Дисперсія та середньоквадратичне відхилення. Використання бібліотек dplyr та ggplot2 у середовищі RStudio. Імпорт даних та дослідження даних (кількість вимірів, відображення першої та останньої частин об’єкта, імен об’єкта) на мові R.

 

Модуль 3. Основи теорії ймовірностей. Класичні розподіли. Кореляція та регресія.

Змістовий модуль 6. Основні поняття теорії ймовірності (випробування, подія, ймовірність). Ймовірність кількох подій (сумісні та несумісні події, залежні та незалежні події). Дерева прийняття рішень. Трансформація даних на мові R.

Змістовий модуль 7. Теорема Байеса. Візуалізація даних на мові R (діаграми).

Змістовий модуль 8. Класичні розподіли. Біноміальний розподіл. Нормальний розподіл. Візуалізація біноміального та нормального розподілів на мові R.

Змістовий модуль 9. Ймовірність отримання конкретного z-значення (алгоритм та його реалізація на мові R).

Змістовий модуль 10. Розподіл Пуассона. Геометричний розподіл. Рівномірний розподіл. Експоненціальний розподіл. Приклади реалізації вказаних розподілів на мові R.

Змістовий модуль 11. Коваріація та кореляція. Їх приклади на мові R. Екстрополяція.

Змістовий модуль 12. Лінійна регресія.

 

Модуль 4. Вивідна статистика. Центральна гранична теорема. Побудова довірчих інтервалів.

Змістовий модуль 13. Описова та вивідна статистика. Генеральна сукупність, вибірка. Репрезентативна та нерепрезентативна вибірки.

Змістовий модуль 14. Центральна гранична теорема. Застосування центральної граничної теореми на мові R.

Змістовий модуль 15. Довірчий інтервал. Рівень довіри. Розмір вибірки. Приклади на мові R.

Змістовий модуль 16. Довірчий інтервал для середнього значення. План побудови довірчого інтервалу. Приклади на мові R.

Система оцінювання

Поточне тестування та самостійна робота

КР

Сума

модуль 1

модуль 2

модуль 3

модуль 4

Т1

Т2

Т3

Т4

Т5

Т6

Т7

Т8

Т9

Т10

Т11

Т12

Т13

Т14

Т15

Т16

 

 

5

5

5

5

5

5

5

5

5

5

5

5

5

5

5

5

20

100

Форма контролю
залік