2. ЗАЩО?
• Големи
количества Класифициране на текстове
Индексиране на големи текстове
информация Автоматичен превод
Разпознаване на реч
Извличане на информация
• Програми за обработка на Автоматично обобщение
голямо количество текстове Отговаряне на въпроси
Диалози
4. ЛИПСА НА ЗНАНИЯ
• Машините виждат “текстовете”, така както вие предишния
• Хората нямат проблем с разбирането, защото знаят за
неща с близък смисъл, опит и доводи
• Машините незнанят нито неща с близък смисъл, нито имат
опит, нито пък доводи
5. НИВО НА АНАЛИЗ
• Звукове, букви, произношение
• Морфология
• Синтаксис
• Семантика
7. СЕМАНТИКА
• Разбиране на езика! Как?
• Думи с много значения
• Семантиката
е важна при машинния превод, извличането
на информация
8. ОЩЕ ЗА СЕМАТИКАТА
• Как да разбираме значението на думите?
• От речниците?
• Той е син на човека. Този вид хартия е син.
9. ..СЕМАНТИКА
• Наличието на 100 изречения, които предварително са
тагнати от човек
• Обучаване на учещ се алгоритъм
• Как да се избере този алгоритъм?
• От къде да се намерят тези примери?
10. УЧЕЩА СЕ СЕМАНТИКА
• Голямо количество обработен текст = обучени
• Обучаванеот предишен опит/обучение/ за класифициране
на нов информация
• Дървете на решенията, учене на базата на памет, невронни
мрежи
11. ИЗВЛИЧАНЕ
• “Имаше група от около 8-9 човека близо до изхода на
София”
• Кой? - “8-9 човека”
• Къде? - “изхода на София”
• Ивличане на информация
• Откриване на нови смислови групи
12. ВРЪЩАНЕ
• Главно - голяма база с текстове и заявки
• Задача - да се намери документ подобен на даден
• Как? Ще се направи индекс както в книга?
• Векторни или булеви модели?
• Примери: Google, Yahoo
13. ВРЪЩАНЕ
• Връщане на точно определена информация
• Отговор на въпрос
• “Колко е висок Еверест?”
• 8853м
14. ...ВРЪЩАНЕ
• Намиране на информация в различни езици
• “Кога започваш училище в Англия?”
• Търсене в английската база за “When do you start school?”
15. МАШИНЕН ПРЕВОД
• Дума по дума работи - синтаксис, смисъл
• Учене от предишно преведени изречения
• Смислени преводи
16. ОЩЕ МНОГО
• Обобщение
• Тематика и обобщен анализ
• Генериране на текст, диалог
• Добиване на опит - близкосмислени изрази
• Реч