SlideShare a Scribd company logo
1 of 17
NATURAL LANGUAGE
   PROCESSING
    Димитър Вулджев
ЗАЩО?

• Големи
       количества             Класифициране на текстове
                              Индексиране на големи текстове
 информация                   Автоматичен превод
                              Разпознаване на реч
                              Извличане на информация
• Програми за обработка на    Автоматично обобщение
 голямо количество текстове   Отговаряне на въпроси
                              Диалози
ТЕКСТ?!

• kJfmmfj   mmmvvv nnnffn3333

• Uj   oifds ellle mesad vensi credur

• Baboi   oi cestnitze

• Cooveoel2&     E;/ dasd??

• dasdfsdf   asdasdds khjoi
ЛИПСА НА ЗНАНИЯ


• Машините   виждат “текстовете”, така както вие предишния

• Хората нямат проблем с разбирането, защото знаят за
 неща с близък смисъл, опит и доводи

• Машините  незнанят нито неща с близък смисъл, нито имат
 опит, нито пък доводи
НИВО НА АНАЛИЗ


• Звукове, букви, произношение

• Морфология

• Синтаксис

• Семантика
СИНТАКСИСЪТ



• Идентифициране   на частите на речта /95%/

• Идентифициране   на collocations
СЕМАНТИКА


• Разбиране   на езика! Как?

• Думи   с много значения

• Семантиката
            е важна при машинния превод, извличането
 на информация
ОЩЕ ЗА СЕМАТИКАТА


• Как   да разбираме значението на думите?

• От    речниците?

• Той   е син на човека. Този вид хартия е син.
..СЕМАНТИКА

• Наличието на 100 изречения, които предварително са
 тагнати от човек

• Обучаване    на учещ се алгоритъм

• Как   да се избере този алгоритъм?

• От    къде да се намерят тези примери?
УЧЕЩА СЕ СЕМАНТИКА


• Голямо   количество обработен текст = обучени

• Обучаванеот предишен опит/обучение/ за класифициране
 на нов информация

• Дървете   на решенията, учене на базата на памет, невронни
 мрежи
ИЗВЛИЧАНЕ

• “Имаше    група от около 8-9 човека близо до изхода на
 София”

• Кой?   - “8-9 човека”

• Къде?   - “изхода на София”

• Ивличане    на информация

• Откриване    на нови смислови групи
ВРЪЩАНЕ

• Главно   - голяма база с текстове и заявки

• Задача   - да се намери документ подобен на даден

• Как?   Ще се направи индекс както в книга?

• Векторни    или булеви модели?

• Примери: Google, Yahoo
ВРЪЩАНЕ


• Връщане   на точно определена информация

• Отговор   на въпрос

• “Колко   е висок Еверест?”

• 8853м
...ВРЪЩАНЕ


• Намиране    на информация в различни езици

• “Кога   започваш училище в Англия?”

• Търсене   в английската база за “When do you start school?”
МАШИНЕН ПРЕВОД


• Дума   по дума работи - синтаксис, смисъл

• Учене   от предишно преведени изречения

• Смислени   преводи
ОЩЕ МНОГО

• Обобщение

• Тематика   и обобщен анализ

• Генериране   на текст, диалог

• Добиване   на опит - близкосмислени изрази

• Реч
КРАЙ
Малко, но от сърце!

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Natural Language Processing

  • 1. NATURAL LANGUAGE PROCESSING Димитър Вулджев
  • 2. ЗАЩО? • Големи количества Класифициране на текстове Индексиране на големи текстове информация Автоматичен превод Разпознаване на реч Извличане на информация • Програми за обработка на Автоматично обобщение голямо количество текстове Отговаряне на въпроси Диалози
  • 3. ТЕКСТ?! • kJfmmfj mmmvvv nnnffn3333 • Uj oifds ellle mesad vensi credur • Baboi oi cestnitze • Cooveoel2& E;/ dasd?? • dasdfsdf asdasdds khjoi
  • 4. ЛИПСА НА ЗНАНИЯ • Машините виждат “текстовете”, така както вие предишния • Хората нямат проблем с разбирането, защото знаят за неща с близък смисъл, опит и доводи • Машините незнанят нито неща с близък смисъл, нито имат опит, нито пък доводи
  • 5. НИВО НА АНАЛИЗ • Звукове, букви, произношение • Морфология • Синтаксис • Семантика
  • 6. СИНТАКСИСЪТ • Идентифициране на частите на речта /95%/ • Идентифициране на collocations
  • 7. СЕМАНТИКА • Разбиране на езика! Как? • Думи с много значения • Семантиката е важна при машинния превод, извличането на информация
  • 8. ОЩЕ ЗА СЕМАТИКАТА • Как да разбираме значението на думите? • От речниците? • Той е син на човека. Този вид хартия е син.
  • 9. ..СЕМАНТИКА • Наличието на 100 изречения, които предварително са тагнати от човек • Обучаване на учещ се алгоритъм • Как да се избере този алгоритъм? • От къде да се намерят тези примери?
  • 10. УЧЕЩА СЕ СЕМАНТИКА • Голямо количество обработен текст = обучени • Обучаванеот предишен опит/обучение/ за класифициране на нов информация • Дървете на решенията, учене на базата на памет, невронни мрежи
  • 11. ИЗВЛИЧАНЕ • “Имаше група от около 8-9 човека близо до изхода на София” • Кой? - “8-9 човека” • Къде? - “изхода на София” • Ивличане на информация • Откриване на нови смислови групи
  • 12. ВРЪЩАНЕ • Главно - голяма база с текстове и заявки • Задача - да се намери документ подобен на даден • Как? Ще се направи индекс както в книга? • Векторни или булеви модели? • Примери: Google, Yahoo
  • 13. ВРЪЩАНЕ • Връщане на точно определена информация • Отговор на въпрос • “Колко е висок Еверест?” • 8853м
  • 14. ...ВРЪЩАНЕ • Намиране на информация в различни езици • “Кога започваш училище в Англия?” • Търсене в английската база за “When do you start school?”
  • 15. МАШИНЕН ПРЕВОД • Дума по дума работи - синтаксис, смисъл • Учене от предишно преведени изречения • Смислени преводи
  • 16. ОЩЕ МНОГО • Обобщение • Тематика и обобщен анализ • Генериране на текст, диалог • Добиване на опит - близкосмислени изрази • Реч