Каталог вибіркових навчальних дисциплін
Комп'ютерний аналіз текстових даних
Вивчення дисципліни «Комп’ютерний аналіз текстових даних» дозволяє сформувати у здобувачів вищої освіти компетенції, необхідні для рішення складних задач професійної діяльності, пов’язаної з використанням та розробкою програмних систем для розв’язання типових задач прикладної лінгвістики, що виникають при аналізі текстових даних. Розглядає методи і прийоми автореферування та проведення SEO-аналізу текстів, перевірки на відповідність вимогам пошукових систем та особливості їх алгоритмів. Дозволяє оволодіти засобами мови Python для аналізу текстових даних.
Завданнями вивчення навчальної дисципліни є:
- ознайомити студентів з наявним програмним забезпеченням для аналізу текстової інформації;
- розвинути практичні навички студентів в оптимізації Інтернет-пошуку;
- ознайомити студентів з функціоналом бібліотек Python для обробки природної мови;
- створювати візуальне представлення результатів аналізу текстів;
- сформувати навички написання програм для автоматичної нормалізації, векторизації, визначення ключових слів та тональності текстів;
- сформувати навички розробки і написання комп’ютерних програм для аналізу природної мови.
В результаті вивчення дисципліни студенти отримають знання і практичні навички які дозволять:
- забезпечувати лінгвістичний супровід інформаційних систем;
- використовувати програмне забезпечення для автоматизованої обробки текстової інформації;
- розуміти та вміло використовувати лінгвістичні, математичні та числові методи для рішення професійних задач;
- аналізувати мовні одиниці, визначати їхню взаємодію та характеризувати мовні явища і процеси, що їх зумовлюють в контексті розробки штучного інтелекту;
- розв’язувати завдання в галузі обробки інформації;
- створювати електронні мовні ресурси: корпуси, словники;
- створювати веб-контент інтерфейсів програмного забезпечення;
- здійснювати автоматизовану обробку текстових даних;
- на основі знання мов, методів та технологій проектування та програмування брати участь у розробці програмного забезпечення.
Тема 1. Аналіз текстової інформації. Text Mining.
Тема 2. Автоматизовані системи аналізу текстових даних.
Тема 3. Методи та засоби проведення SEO-аналізу тексту.
Тема 4. Автоматизовані системи реферування та анотування текстів.
Тема 5. Аналіз текстової інформації засобами мови Python.
100 балів за виконання лабораторних завдань, або 100 балів - екзамен