SlideShare a Scribd company logo
1 of 17
Download to read offline
NATURAL LANGUAGE
   PROCESSING
    Димитър Вулджев
ЗАЩО?

• Големи
       количества             Класифициране на текстове
                              Индексиране на големи текстове
 информация                   Автоматичен превод
                              Разпознаване на реч
                              Извличане на информация
• Програми за обработка на    Автоматично обобщение
 голямо количество текстове   Отговаряне на въпроси
                              Диалози
ТЕКСТ?!

• kJfmmfj   mmmvvv nnnffn3333

• Uj   oifds ellle mesad vensi credur

• Baboi   oi cestnitze

• Cooveoel2&     E;/ dasd??

• dasdfsdf   asdasdds khjoi
ЛИПСА НА ЗНАНИЯ


• Машините   виждат “текстовете”, така както вие предишния

• Хората нямат проблем с разбирането, защото знаят за
 неща с близък смисъл, опит и доводи

• Машините  незнанят нито неща с близък смисъл, нито имат
 опит, нито пък доводи
НИВО НА АНАЛИЗ


• Звукове, букви, произношение

• Морфология

• Синтаксис

• Семантика
СИНТАКСИСЪТ



• Идентифициране   на частите на речта /95%/

• Идентифициране   на collocations
СЕМАНТИКА


• Разбиране   на езика! Как?

• Думи   с много значения

• Семантиката
            е важна при машинния превод, извличането
 на информация
ОЩЕ ЗА СЕМАТИКАТА


• Как   да разбираме значението на думите?

• От    речниците?

• Той   е син на човека. Този вид хартия е син.
..СЕМАНТИКА

• Наличието на 100 изречения, които предварително са
 тагнати от човек

• Обучаване    на учещ се алгоритъм

• Как   да се избере този алгоритъм?

• От    къде да се намерят тези примери?
УЧЕЩА СЕ СЕМАНТИКА


• Голямо   количество обработен текст = обучени

• Обучаванеот предишен опит/обучение/ за класифициране
 на нов информация

• Дървете   на решенията, учене на базата на памет, невронни
 мрежи
ИЗВЛИЧАНЕ

• “Имаше    група от около 8-9 човека близо до изхода на
 София”

• Кой?   - “8-9 човека”

• Къде?   - “изхода на София”

• Ивличане    на информация

• Откриване    на нови смислови групи
ВРЪЩАНЕ

• Главно   - голяма база с текстове и заявки

• Задача   - да се намери документ подобен на даден

• Как?   Ще се направи индекс както в книга?

• Векторни    или булеви модели?

• Примери: Google, Yahoo
ВРЪЩАНЕ


• Връщане   на точно определена информация

• Отговор   на въпрос

• “Колко   е висок Еверест?”

• 8853м
...ВРЪЩАНЕ


• Намиране    на информация в различни езици

• “Кога   започваш училище в Англия?”

• Търсене   в английската база за “When do you start school?”
МАШИНЕН ПРЕВОД


• Дума   по дума работи - синтаксис, смисъл

• Учене   от предишно преведени изречения

• Смислени   преводи
ОЩЕ МНОГО

• Обобщение

• Тематика   и обобщен анализ

• Генериране   на текст, диалог

• Добиване   на опит - близкосмислени изрази

• Реч
КРАЙ
Малко, но от сърце!

More Related Content

Featured

Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationErica Santiago
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellSaba Software
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming LanguageSimplilearn
 
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...Palo Alto Software
 
9 Tips for a Work-free Vacation
9 Tips for a Work-free Vacation9 Tips for a Work-free Vacation
9 Tips for a Work-free VacationWeekdone.com
 

Featured (20)

Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming Language
 
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
The Pixar Way: 37 Quotes on Developing and Maintaining a Creative Company (fr...
 
9 Tips for a Work-free Vacation
9 Tips for a Work-free Vacation9 Tips for a Work-free Vacation
9 Tips for a Work-free Vacation
 

Natural Language Processing

  • 1. NATURAL LANGUAGE PROCESSING Димитър Вулджев
  • 2. ЗАЩО? • Големи количества Класифициране на текстове Индексиране на големи текстове информация Автоматичен превод Разпознаване на реч Извличане на информация • Програми за обработка на Автоматично обобщение голямо количество текстове Отговаряне на въпроси Диалози
  • 3. ТЕКСТ?! • kJfmmfj mmmvvv nnnffn3333 • Uj oifds ellle mesad vensi credur • Baboi oi cestnitze • Cooveoel2& E;/ dasd?? • dasdfsdf asdasdds khjoi
  • 4. ЛИПСА НА ЗНАНИЯ • Машините виждат “текстовете”, така както вие предишния • Хората нямат проблем с разбирането, защото знаят за неща с близък смисъл, опит и доводи • Машините незнанят нито неща с близък смисъл, нито имат опит, нито пък доводи
  • 5. НИВО НА АНАЛИЗ • Звукове, букви, произношение • Морфология • Синтаксис • Семантика
  • 6. СИНТАКСИСЪТ • Идентифициране на частите на речта /95%/ • Идентифициране на collocations
  • 7. СЕМАНТИКА • Разбиране на езика! Как? • Думи с много значения • Семантиката е важна при машинния превод, извличането на информация
  • 8. ОЩЕ ЗА СЕМАТИКАТА • Как да разбираме значението на думите? • От речниците? • Той е син на човека. Този вид хартия е син.
  • 9. ..СЕМАНТИКА • Наличието на 100 изречения, които предварително са тагнати от човек • Обучаване на учещ се алгоритъм • Как да се избере този алгоритъм? • От къде да се намерят тези примери?
  • 10. УЧЕЩА СЕ СЕМАНТИКА • Голямо количество обработен текст = обучени • Обучаванеот предишен опит/обучение/ за класифициране на нов информация • Дървете на решенията, учене на базата на памет, невронни мрежи
  • 11. ИЗВЛИЧАНЕ • “Имаше група от около 8-9 човека близо до изхода на София” • Кой? - “8-9 човека” • Къде? - “изхода на София” • Ивличане на информация • Откриване на нови смислови групи
  • 12. ВРЪЩАНЕ • Главно - голяма база с текстове и заявки • Задача - да се намери документ подобен на даден • Как? Ще се направи индекс както в книга? • Векторни или булеви модели? • Примери: Google, Yahoo
  • 13. ВРЪЩАНЕ • Връщане на точно определена информация • Отговор на въпрос • “Колко е висок Еверест?” • 8853м
  • 14. ...ВРЪЩАНЕ • Намиране на информация в различни езици • “Кога започваш училище в Англия?” • Търсене в английската база за “When do you start school?”
  • 15. МАШИНЕН ПРЕВОД • Дума по дума работи - синтаксис, смисъл • Учене от предишно преведени изречения • Смислени преводи
  • 16. ОЩЕ МНОГО • Обобщение • Тематика и обобщен анализ • Генериране на текст, диалог • Добиване на опит - близкосмислени изрази • Реч