2. Випускник ТНТУ ім. І. Пулюя.
Аспірантура за напрямом «Математичне
моделювання та обчислювальні методи».
Менеджер підрозділу лінгвістики.
Розвиваю напрям автоматичного аналізу
текстів, зокрема Opinion Mining та
Sentiment Analysis.
Маю практичний досвід реалізації
DataMining систем та BI рішень.
bogdan.khomiv@gmail.com
facebook.com/bogdan.khomiv
ua.linkedin.com/in/bogdankhomiv
Богдан Хомів
3. • Проблематика 1
Занадто багато ручної роботи для задач класифікації текстів /
оцінки тональності (із досвіду роботи на ринку СНГ).
Доказом є факт ручної розмітки тональності на масиві повідомлень із
твіттера на одній із доріжок SentiRuEval.
• Проблематика 2
Формування навчальних вибірок для класифікації повідомлень у
заздалегідь невідомій предметній області.
• Проблематика 3
Масштабованість та багатомовність. Вихід на міжнародний ринок
та аналіз повідомлень, написаних на різних мовах.
• Мета. Звести ручну роботу за допомогою методів машинного
навчання до мінімуму, або позбутись її взагалі. Запропонувати
підходи, котрі б дозволили входити в предметну область без
попередніх знань про неї.
Проблематика
4. • Синтактико-семантичний аналіз речень.
• Класифікація повідомлень на базі Rule Based підходу.
• Автоматизація генерування правил для класифікації.
• Формування навчальних вибірок методами кластеризації.
Пропоноване вирішення
* для інших мов, котрі ще не мають вирішення для синтактико-семантичного аналізу використовувати
SVM або інші методи машинного навчання.
5. • Аналітичні компанії,
котрі займаються аналізом даних
• Соц. мережі,
для розуміння, що відбувається всередині
• Стартапи,
з метою масштабування виходу на ринок
Для кого це потрібно