SlideShare a Scribd company logo
1 of 63
Основи на обработка на
естествен език (NLP),
Google ъпдейти и
добри практики за съдържание
LinkedIn - Калоян Димитров
LinkedIn - Димитър Карамаринов
Основи в NLP
Latent Semantic
Indexing (LSI)
● Технология от 80-те;
● Базиранa на синоними и
прилики;
● LSI етикетът се използва
до наши дни, но с общо
значение;
Word Vectors
king — man + woman = queen
Базови методи на NLP
https://cloud.google.com/natural-language/
Токенизация
Разбиване по части от речта
Омоними =
Лематизация
Коса - коса
Кола - кола
Съд - съд
Казана - казана
Река - река
Взаимозависимост на думите
(граматика)
● amod: adjectival modifier - модификатор на прилагателно
● nsubj: nominal subject - номинален субект
● prep: preposition - предлог
● pobj: object of a preposition - обект на предлога
За любознателните - тук другите видове зависимости.
Разбор по смислова зависимост
Екстракция на “познати обекти”
(entities)
Salience / “Aboutness” - Конкретност
очебийност, бележитост, относителност и т.н.
Определяне на чувство, мнение, отношение
(Sentiment)
Категоризация
https://cloud.google.com/natural-language/docs/categories
Класификация на текст според функцията му
Класификация по тип съдържание
● Събитие
● Рецепта
● Продукт
● Новина
● Други
Значение на текста спрямо неговата структура
● Заглавия
● Параграфи
● Списъци
● Размер шрифт
● Отстояния
● Изображения
● Цветове
● Класация
● Процес
● Номерация+ +
Google ъпдейти през 2018
Какво означава широк ъпдейт на
ядрото на алгоритъма?
Broad Core Algorithm
● Повече от една промяна
● Претегляне на различни
фактори
● Подсилване ролята на
намерение зад търсенето
(т.е. query intent)
Февруари 2018:
Двоен снипет за едно
търсене
Март 2018:
“Първи” широк ъпдейт на ядрото
People also ask - +35%
23.07.2018:
Вече панела присъства в повече от 50% от всички търсения
1 Август 2018 - Medical update
“Втори” широк ъпдейт на ядрото
Август 2018:
Подтеми в
Knowledge panel
Септември 2018:
Каруселни и IQ снипети
Topical layer /
Neural matching
Goodbye Medical Update, Hello Query
Intent Update
Тясно профилиране на страници и сайтове
Ядосан Google!Цел на уебсайта Съдържание на
уебсайта
Микс от фактори за
различните типове
намерение
Корелации на ранкинг фактори
базирани на проучване на 600 000
сайта афектирани от медицинския
ъпдейт
Ранкинг фактори с положителна корелация:
● Дизайн
● Дизайн
● Скорост
Ранкинг фактори с положителна корелация:
● Дизайн
● Скорост
● Дължина на съдържанието
Ранкинг фактори с положителна корелация:
● Дизайн
● Скорост
● Дължина на съдържанието
● Мобилно преживяване
Ранкинг фактори с положителна корелация:
● Дизайн
● Скорост
● Дължина на съдържанието
● Мобилно преживяване
● Рекламно преживяване
Ранкинг фактори с положителна корелация:
● Дизайн
● Скорост
● Дължина на съдържанието
● Мобилно преживяване
● Рекламно преживяване
● About us страница
Ранкинг фактори с положителна корелация:
● Дизайн
● Скорост
● Дължина на съдържанието
● Мобилно преживяване
● Рекламно преживяване
● About us страница
● Качество на съдържанието
Ранкинг фактори с положителна корелация:
● Авторски профилни страници
● Линкове към социалните профили на авторите от сайта ви
● Авторски препоръки
● Страница за контакти
Ранкинг фактори с отрицателна корелация:
Любопитен факт 1:
За кратко през август,
Google сервира резултати базирани на
Имената на автор, представени като
“interesting finds”.
Любопитен факт 2: Линк балони??!
Насоки за създаване на
съдържание в контекста на
обработка на естествен език
UX + SEO
Информационното
съдържание на сайта ви
е добре да бъде
структурирано начин,
спомагащ цялостния
“път” на потребителя.
Свържете твърдение с
факт.
Basic Format:
[Question] is [Entity]
Snippet:
[Entity] is [Answer].
Внимавайте за комбинации от думи.
Не увъртайте!
Бъдете ясни и точни.
Избягвайте двусмислието.
Подсилете “конкретността” на текста.
Мислете за повече от
един верен прочит на
търсенето.
ВРЕМЕ ЗА ВЪПРОСИ
Благодарим за вниманието!

More Related Content

Similar to Димитър Карамаринов. Калоян Димитров. "Обработка на естествен език (NLP), Google ъпдейти и добри практики за съдържание"

Трафиково SEO — преход от позиции към трафик
Трафиково SEO — преход от позиции към трафикТрафиково SEO — преход от позиции към трафик
Трафиково SEO — преход от позиции към трафикNetpeak
 
Content strategy - via Dido Grigorov - Head of SEO at Serpact
Content strategy  - via Dido Grigorov - Head of SEO at SerpactContent strategy  - via Dido Grigorov - Head of SEO at Serpact
Content strategy - via Dido Grigorov - Head of SEO at SerpactNikola Minkov
 
Дигитална Работилница 2014 - SEO за Онлайн Магазини
Дигитална Работилница 2014 - SEO за Онлайн МагазиниДигитална Работилница 2014 - SEO за Онлайн Магазини
Дигитална Работилница 2014 - SEO за Онлайн МагазиниInbound.BG
 
Тенденции в SEO през 2014
Тенденции в SEO през 2014Тенденции в SEO през 2014
Тенденции в SEO през 2014NetpeakBG
 
Тенденции в SEO през 2014
Тенденции в SEO през 2014Тенденции в SEO през 2014
Тенденции в SEO през 2014Netpeak
 
SEO BG Site 2009
SEO BG Site 2009SEO BG Site 2009
SEO BG Site 2009SEOM
 
Задълбочена семантика и работа върху структура на сайт
Задълбочена семантика и работа върху структура на сайтЗадълбочена семантика и работа върху структура на сайт
Задълбочена семантика и работа върху структура на сайтNetpeakBG
 
Задълбочена семантика и работа върху структура на сайт
Задълбочена семантика и работа върху структура на сайтЗадълбочена семантика и работа върху структура на сайт
Задълбочена семантика и работа върху структура на сайтNetpeak
 
IAB Digital marketing masterclass 7th of June 2020/ Stasi
IAB Digital marketing masterclass 7th of June 2020/ StasiIAB Digital marketing masterclass 7th of June 2020/ Stasi
IAB Digital marketing masterclass 7th of June 2020/ StasiNetpeak
 
Google Cloud Natural Language for SEO
Google Cloud Natural Language for SEO  Google Cloud Natural Language for SEO
Google Cloud Natural Language for SEO Netpeak
 
Успешен сайт за успешен бизнес - SEO семинар
Успешен сайт за успешен бизнес - SEO семинарУспешен сайт за успешен бизнес - SEO семинар
Успешен сайт за успешен бизнес - SEO семинарMariela Koleva
 
Мартин Желязков (Netpeak).pptx
Мартин Желязков (Netpeak).pptxМартин Желязков (Netpeak).pptx
Мартин Желязков (Netpeak).pptxOctopus Events
 
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...NetpeakBG
 
Владимир Драгиев. SEO предизвикателствата стоящи пред големите проекти.
Владимир Драгиев. SEO предизвикателствата стоящи пред големите проекти.Владимир Драгиев. SEO предизвикателствата стоящи пред големите проекти.
Владимир Драгиев. SEO предизвикателствата стоящи пред големите проекти.Octopus Events
 
Content Marketing and Semantic Content Optimization with Semrush in 2018 - Di...
Content Marketing and Semantic Content Optimization with Semrush in 2018 - Di...Content Marketing and Semantic Content Optimization with Semrush in 2018 - Di...
Content Marketing and Semantic Content Optimization with Semrush in 2018 - Di...Borislav Arapchev
 
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...Netpeak
 
Nikolay Galinov - SEO Link Building for "Ecommerce Success Program"
Nikolay Galinov - SEO Link Building for "Ecommerce Success Program"Nikolay Galinov - SEO Link Building for "Ecommerce Success Program"
Nikolay Galinov - SEO Link Building for "Ecommerce Success Program"Netpeak
 
Николай Кръстев (NT WEBSITES).pdf
Николай Кръстев (NT WEBSITES).pdfНиколай Кръстев (NT WEBSITES).pdf
Николай Кръстев (NT WEBSITES).pdfOctopus Events
 

Similar to Димитър Карамаринов. Калоян Димитров. "Обработка на естествен език (NLP), Google ъпдейти и добри практики за съдържание" (20)

Трафиково SEO — преход от позиции към трафик
Трафиково SEO — преход от позиции към трафикТрафиково SEO — преход от позиции към трафик
Трафиково SEO — преход от позиции към трафик
 
Content strategy - via Dido Grigorov - Head of SEO at Serpact
Content strategy  - via Dido Grigorov - Head of SEO at SerpactContent strategy  - via Dido Grigorov - Head of SEO at Serpact
Content strategy - via Dido Grigorov - Head of SEO at Serpact
 
Дигитална Работилница 2014 - SEO за Онлайн Магазини
Дигитална Работилница 2014 - SEO за Онлайн МагазиниДигитална Работилница 2014 - SEO за Онлайн Магазини
Дигитална Работилница 2014 - SEO за Онлайн Магазини
 
Тенденции в SEO през 2014
Тенденции в SEO през 2014Тенденции в SEO през 2014
Тенденции в SEO през 2014
 
Тенденции в SEO през 2014
Тенденции в SEO през 2014Тенденции в SEO през 2014
Тенденции в SEO през 2014
 
Seo за начинаещи
Seo за начинаещиSeo за начинаещи
Seo за начинаещи
 
SEO BG Site 2009
SEO BG Site 2009SEO BG Site 2009
SEO BG Site 2009
 
Задълбочена семантика и работа върху структура на сайт
Задълбочена семантика и работа върху структура на сайтЗадълбочена семантика и работа върху структура на сайт
Задълбочена семантика и работа върху структура на сайт
 
Задълбочена семантика и работа върху структура на сайт
Задълбочена семантика и работа върху структура на сайтЗадълбочена семантика и работа върху структура на сайт
Задълбочена семантика и работа върху структура на сайт
 
IAB Digital marketing masterclass 7th of June 2020/ Stasi
IAB Digital marketing masterclass 7th of June 2020/ StasiIAB Digital marketing masterclass 7th of June 2020/ Stasi
IAB Digital marketing masterclass 7th of June 2020/ Stasi
 
Google Cloud Natural Language for SEO
Google Cloud Natural Language for SEO  Google Cloud Natural Language for SEO
Google Cloud Natural Language for SEO
 
Успешен сайт за успешен бизнес - SEO семинар
Успешен сайт за успешен бизнес - SEO семинарУспешен сайт за успешен бизнес - SEO семинар
Успешен сайт за успешен бизнес - SEO семинар
 
SEO копирайтинг
SEO копирайтингSEO копирайтинг
SEO копирайтинг
 
Мартин Желязков (Netpeak).pptx
Мартин Желязков (Netpeak).pptxМартин Желязков (Netpeak).pptx
Мартин Желязков (Netpeak).pptx
 
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
 
Владимир Драгиев. SEO предизвикателствата стоящи пред големите проекти.
Владимир Драгиев. SEO предизвикателствата стоящи пред големите проекти.Владимир Драгиев. SEO предизвикателствата стоящи пред големите проекти.
Владимир Драгиев. SEO предизвикателствата стоящи пред големите проекти.
 
Content Marketing and Semantic Content Optimization with Semrush in 2018 - Di...
Content Marketing and Semantic Content Optimization with Semrush in 2018 - Di...Content Marketing and Semantic Content Optimization with Semrush in 2018 - Di...
Content Marketing and Semantic Content Optimization with Semrush in 2018 - Di...
 
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
SEO Работилница #1: семантика и Prodvigator.bg за анализ на ключови думи и ко...
 
Nikolay Galinov - SEO Link Building for "Ecommerce Success Program"
Nikolay Galinov - SEO Link Building for "Ecommerce Success Program"Nikolay Galinov - SEO Link Building for "Ecommerce Success Program"
Nikolay Galinov - SEO Link Building for "Ecommerce Success Program"
 
Николай Кръстев (NT WEBSITES).pdf
Николай Кръстев (NT WEBSITES).pdfНиколай Кръстев (NT WEBSITES).pdf
Николай Кръстев (NT WEBSITES).pdf
 

More from DariaShalahinova

Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...DariaShalahinova
 
Alex Danilin. ''Insights from 1M websites audit'
Alex Danilin. ''Insights from 1M websites audit'Alex Danilin. ''Insights from 1M websites audit'
Alex Danilin. ''Insights from 1M websites audit'DariaShalahinova
 
Никола Минков. "SEO - Still Loving You!"
Никола Минков. "SEO - Still Loving You!" Никола Минков. "SEO - Still Loving You!"
Никола Минков. "SEO - Still Loving You!" DariaShalahinova
 
Петър Николов. "Mobile Ecommerce Technical Performance"
Петър Николов. "Mobile Ecommerce Technical Performance"Петър Николов. "Mobile Ecommerce Technical Performance"
Петър Николов. "Mobile Ecommerce Technical Performance"DariaShalahinova
 
Simeon Emanuilov. "Mobile First Indexing - мобилната версия с приоритет"
Simeon Emanuilov. "Mobile First Indexing - мобилната версия с приоритет"Simeon Emanuilov. "Mobile First Indexing - мобилната версия с приоритет"
Simeon Emanuilov. "Mobile First Indexing - мобилната версия с приоритет"DariaShalahinova
 
Кристиан Димитров. "Стратегии и канали на PCStore: как го правим и какви резу...
Кристиан Димитров. "Стратегии и канали на PCStore: как го правим и какви резу...Кристиан Димитров. "Стратегии и канали на PCStore: как го правим и какви резу...
Кристиан Димитров. "Стратегии и канали на PCStore: как го правим и какви резу...DariaShalahinova
 
Кристиян Димитров. "Работи ли моят маркетинг?"
Кристиян Димитров. "Работи ли моят маркетинг?"Кристиян Димитров. "Работи ли моят маркетинг?"
Кристиян Димитров. "Работи ли моят маркетинг?"DariaShalahinova
 
Благовест Йорданов. "Какво правят Вашите потребители в ABV?"
Благовест Йорданов. "Какво правят Вашите потребители в ABV?"Благовест Йорданов. "Какво правят Вашите потребители в ABV?"
Благовест Йорданов. "Какво правят Вашите потребители в ABV?"DariaShalahinova
 
Любомир Попов. "Колко изкуствен е изкуственият интелект на Google?"
Любомир Попов. "Колко изкуствен е изкуственият интелект на Google?"Любомир Попов. "Колко изкуствен е изкуственият интелект на Google?"
Любомир Попов. "Колко изкуствен е изкуственият интелект на Google?"DariaShalahinova
 
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...DariaShalahinova
 
Катя Тодорова. "Дигитализация в хотела у нас – ефект, резултати, възвръщаемос...
Катя Тодорова. "Дигитализация в хотела у нас – ефект, резултати, възвръщаемос...Катя Тодорова. "Дигитализация в хотела у нас – ефект, резултати, възвръщаемос...
Катя Тодорова. "Дигитализация в хотела у нас – ефект, резултати, възвръщаемос...DariaShalahinova
 
Александър Георгиев. Васил Банков. "Case study Мебели Банко: как да подобрим ...
Александър Георгиев. Васил Банков. "Case study Мебели Банко: как да подобрим ...Александър Георгиев. Васил Банков. "Case study Мебели Банко: как да подобрим ...
Александър Георгиев. Васил Банков. "Case study Мебели Банко: как да подобрим ...DariaShalahinova
 
Драгомир Драганов. Георги Кандев. "3 задължителни стъпки, с които да се подго...
Драгомир Драганов. Георги Кандев. "3 задължителни стъпки, с които да се подго...Драгомир Драганов. Георги Кандев. "3 задължителни стъпки, с които да се подго...
Драгомир Драганов. Георги Кандев. "3 задължителни стъпки, с които да се подго...DariaShalahinova
 
Иво Тодоров. "Sport Depot: как дигитализираме търговията"
Иво Тодоров. "Sport Depot: как дигитализираме търговията"Иво Тодоров. "Sport Depot: как дигитализираме търговията"
Иво Тодоров. "Sport Depot: как дигитализираме търговията"DariaShalahinova
 
Геновева Петрова. "История на развитието на Remix"
Геновева Петрова. "История на развитието на Remix"Геновева Петрова. "История на развитието на Remix"
Геновева Петрова. "История на развитието на Remix"DariaShalahinova
 
Дацко Дацев. "5+ performance стратегии от MyMall"
Дацко Дацев. "5+ performance стратегии от MyMall"Дацко Дацев. "5+ performance стратегии от MyMall"
Дацко Дацев. "5+ performance стратегии от MyMall"DariaShalahinova
 
Димитър Димитров. "Успешна миграция на нова eCommerce платформа "
Димитър Димитров. "Успешна миграция на нова eCommerce платформа "Димитър Димитров. "Успешна миграция на нова eCommerce платформа "
Димитър Димитров. "Успешна миграция на нова eCommerce платформа "DariaShalahinova
 
Олег Поддубный. "Полезные советы по товарным кампаниям в Google Adwords"
Олег Поддубный. "Полезные советы по товарным кампаниям в Google Adwords"Олег Поддубный. "Полезные советы по товарным кампаниям в Google Adwords"
Олег Поддубный. "Полезные советы по товарным кампаниям в Google Adwords"DariaShalahinova
 
Олег Поддубный. Полезные советы по товарным кампаниям в Google Adwords.
Олег Поддубный. Полезные советы по товарным кампаниям в Google Adwords.Олег Поддубный. Полезные советы по товарным кампаниям в Google Adwords.
Олег Поддубный. Полезные советы по товарным кампаниям в Google Adwords.DariaShalahinova
 
Оксана Верлан и Юлия Морарь. Как продать 50 тыс билетов на концерт и не облаж...
Оксана Верлан и Юлия Морарь. Как продать 50 тыс билетов на концерт и не облаж...Оксана Верлан и Юлия Морарь. Как продать 50 тыс билетов на концерт и не облаж...
Оксана Верлан и Юлия Морарь. Как продать 50 тыс билетов на концерт и не облаж...DariaShalahinova
 

More from DariaShalahinova (20)

Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
 
Alex Danilin. ''Insights from 1M websites audit'
Alex Danilin. ''Insights from 1M websites audit'Alex Danilin. ''Insights from 1M websites audit'
Alex Danilin. ''Insights from 1M websites audit'
 
Никола Минков. "SEO - Still Loving You!"
Никола Минков. "SEO - Still Loving You!" Никола Минков. "SEO - Still Loving You!"
Никола Минков. "SEO - Still Loving You!"
 
Петър Николов. "Mobile Ecommerce Technical Performance"
Петър Николов. "Mobile Ecommerce Technical Performance"Петър Николов. "Mobile Ecommerce Technical Performance"
Петър Николов. "Mobile Ecommerce Technical Performance"
 
Simeon Emanuilov. "Mobile First Indexing - мобилната версия с приоритет"
Simeon Emanuilov. "Mobile First Indexing - мобилната версия с приоритет"Simeon Emanuilov. "Mobile First Indexing - мобилната версия с приоритет"
Simeon Emanuilov. "Mobile First Indexing - мобилната версия с приоритет"
 
Кристиан Димитров. "Стратегии и канали на PCStore: как го правим и какви резу...
Кристиан Димитров. "Стратегии и канали на PCStore: как го правим и какви резу...Кристиан Димитров. "Стратегии и канали на PCStore: как го правим и какви резу...
Кристиан Димитров. "Стратегии и канали на PCStore: как го правим и какви резу...
 
Кристиян Димитров. "Работи ли моят маркетинг?"
Кристиян Димитров. "Работи ли моят маркетинг?"Кристиян Димитров. "Работи ли моят маркетинг?"
Кристиян Димитров. "Работи ли моят маркетинг?"
 
Благовест Йорданов. "Какво правят Вашите потребители в ABV?"
Благовест Йорданов. "Какво правят Вашите потребители в ABV?"Благовест Йорданов. "Какво правят Вашите потребители в ABV?"
Благовест Йорданов. "Какво правят Вашите потребители в ABV?"
 
Любомир Попов. "Колко изкуствен е изкуственият интелект на Google?"
Любомир Попов. "Колко изкуствен е изкуственият интелект на Google?"Любомир Попов. "Колко изкуствен е изкуственият интелект на Google?"
Любомир Попов. "Колко изкуствен е изкуственият интелект на Google?"
 
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
Станислав Димитров. "10 супер полезни Google Ads техники, които да опитате пр...
 
Катя Тодорова. "Дигитализация в хотела у нас – ефект, резултати, възвръщаемос...
Катя Тодорова. "Дигитализация в хотела у нас – ефект, резултати, възвръщаемос...Катя Тодорова. "Дигитализация в хотела у нас – ефект, резултати, възвръщаемос...
Катя Тодорова. "Дигитализация в хотела у нас – ефект, резултати, възвръщаемос...
 
Александър Георгиев. Васил Банков. "Case study Мебели Банко: как да подобрим ...
Александър Георгиев. Васил Банков. "Case study Мебели Банко: как да подобрим ...Александър Георгиев. Васил Банков. "Case study Мебели Банко: как да подобрим ...
Александър Георгиев. Васил Банков. "Case study Мебели Банко: как да подобрим ...
 
Драгомир Драганов. Георги Кандев. "3 задължителни стъпки, с които да се подго...
Драгомир Драганов. Георги Кандев. "3 задължителни стъпки, с които да се подго...Драгомир Драганов. Георги Кандев. "3 задължителни стъпки, с които да се подго...
Драгомир Драганов. Георги Кандев. "3 задължителни стъпки, с които да се подго...
 
Иво Тодоров. "Sport Depot: как дигитализираме търговията"
Иво Тодоров. "Sport Depot: как дигитализираме търговията"Иво Тодоров. "Sport Depot: как дигитализираме търговията"
Иво Тодоров. "Sport Depot: как дигитализираме търговията"
 
Геновева Петрова. "История на развитието на Remix"
Геновева Петрова. "История на развитието на Remix"Геновева Петрова. "История на развитието на Remix"
Геновева Петрова. "История на развитието на Remix"
 
Дацко Дацев. "5+ performance стратегии от MyMall"
Дацко Дацев. "5+ performance стратегии от MyMall"Дацко Дацев. "5+ performance стратегии от MyMall"
Дацко Дацев. "5+ performance стратегии от MyMall"
 
Димитър Димитров. "Успешна миграция на нова eCommerce платформа "
Димитър Димитров. "Успешна миграция на нова eCommerce платформа "Димитър Димитров. "Успешна миграция на нова eCommerce платформа "
Димитър Димитров. "Успешна миграция на нова eCommerce платформа "
 
Олег Поддубный. "Полезные советы по товарным кампаниям в Google Adwords"
Олег Поддубный. "Полезные советы по товарным кампаниям в Google Adwords"Олег Поддубный. "Полезные советы по товарным кампаниям в Google Adwords"
Олег Поддубный. "Полезные советы по товарным кампаниям в Google Adwords"
 
Олег Поддубный. Полезные советы по товарным кампаниям в Google Adwords.
Олег Поддубный. Полезные советы по товарным кампаниям в Google Adwords.Олег Поддубный. Полезные советы по товарным кампаниям в Google Adwords.
Олег Поддубный. Полезные советы по товарным кампаниям в Google Adwords.
 
Оксана Верлан и Юлия Морарь. Как продать 50 тыс билетов на концерт и не облаж...
Оксана Верлан и Юлия Морарь. Как продать 50 тыс билетов на концерт и не облаж...Оксана Верлан и Юлия Морарь. Как продать 50 тыс билетов на концерт и не облаж...
Оксана Верлан и Юлия Морарь. Как продать 50 тыс билетов на концерт и не облаж...
 

Димитър Карамаринов. Калоян Димитров. "Обработка на естествен език (NLP), Google ъпдейти и добри практики за съдържание"

Editor's Notes

  1. М: Днес ще ви представим няколко тези - първо - ще говорим за базови концепции при обработка на естествен език, за да ги свържем с последните Google updates, и накрая ще ви представим добри практики как да създавате съдържание в контекста на обработка на естествен език.
  2. М: Започваме с два метода, които полагат основите на обработка на естествен език - LSI и Word Vectors.
  3. М: Реално, това е технология, развита през края на 80 години, в отговор на по-ранните технологии, които не са успявали да разберат добре синоними, както на изображението: pictures & photos. Общо-взето, LSi e било супер метод, но за ранните търсачки. Хубаво е да се има предвид откъде идва и какво означава, тъй като “LSI” се използва в много по-широк смисъл в наши дни.
  4. М: Следваща стъпка в развитието на обработката на естествен език е т.нар. векторна дума. “Word vector” изразяват взаимовръзките м/у отделни думи. Сходните думи имат близки вектори. Тук сме дали едни от най-простите примери: king - man + woman = queen. На 2рата картинка можем да видим как се измерват като стойности.
  5. М: На тази картинка искаме да онагледим как в един куп от думи, както навярно се случва и при Гугъл, се образуват групички. По-късно ще видим докъде това е стигнало в наше време а именно Topical layer-а, knowledge graph, featured snippets и т.н.
  6. М: Това бяха два по-стари метода, като предстоят други, взети от свободно-достъпния ни към днешна дата, инструмент за “Cloud Natural Language” processing.
  7. К: Какво се случва първо - Google разбива изречението на отделни части. Това се нарича токенизация. А след това класифицира отделните думи като части на речта - съществително, прилагателно, глагол, предлог, и пунктуация.
  8. К: Гугъл стига до там да разбира еднакви думи с различно значение и да ги идентифицира правилно, а именно омоними. Това е лематизация.
  9. К: Следва определяне взаимозависимостта на думите спрямо граматика. Гугъл определя връзки м/у думите в едно изречение.
  10. К: След като установи връзките между думите, Гугъл прави разбор по смисловата зависимост. Коя дума е обект на действието. коя на предлог, коя модификатор на прилагателно и т.н.
  11. К: В следващата стъпка, Гугъл създава своеобразно досие на всяко понятие, т.е. т.нар. обект или “entity”. Entities могат да бъдат личности, животински видове, локации, термини, разбира се, брандови имена. В този пример се виждат “brown fox” и “dog”.
  12. К: Гугъл научава все повече и повече за нашия свят и разбира, че освен животното лисица, има и друго “entity” - американската компания Fox.
  13. М: Следващият метод е определяне на т.нар. “Salience” или още “aboutness”. Google дава оценка доколко един текст или в случая това изречение, се отнася към конкретна дума или тема. В примера “The Top Gear show featured Bмв, AUDI, MERCEDES and a truck” става въпрос тв шоу на първо място, след това кое е това шоу - Top Gear, следва “камион”, защото предаването е за превозни средства, и накрая са трите бранда. И все пак това е само микро пример. В действителност този инструмент се използва за анализиране на цели документи, форуми, уеб страници и т.н., не за отделни изречения само. Практично приложение е да се изследва един форум за технология например, или SEO, и да се анализира за потенциални трендове или дори настроения на хората.
  14. М: Следва определяне на позитивно или отрицателно настроение за entities или цяла статия или сайт. Наскоро попаднахме на впечатляващо case study, в което бе извършен анализ на хиляди заглавия свързани с Тесла и Елън Мъск, в който анализ негативните заглавия бяха по-малко, но имаха повече сигнали като споделянки и линкове. Тезата бе, че негативното отношение е предпочитано от потребителите и затова преобладаващите резултати за определен период от време са с негативна емоция зад тях.
  15. М: Следващ прочит, който прави Гугъл е да категоризира съдържанието. Това е и на практика, формиране на т.н. topical authority, която намира отражение и в наскоро-обявения “topical layer”. Скрийншотът е само на първите 20на в публикуван от Гугъл списък, като на практика, сигурно са стотици и хиляди такива категории.
  16. К: Този скрийншот е от научна публикация на Гугъл. Тук търсачката класифицира текста според неговата функция, а именно, въпрос, отговор, хвалба, хумор, допълнение, обида и т.н.
  17. К: : Гугъл може да класифицира съдържание И според неговия тип - събитие, рецепта, продукт, новина, дори и без наличие на Schema.org markup. Гугъл използва HTML форматиране и типът данни (дата, локация, URL адрес и други).
  18. К: Нo структурата на текста може да променя неговото значение. А именно, заглавия, списъци, отстояния, цветове, изображения и др. Например ако даден текст е структуриран като html ordered list, или присъстват заглавия с номерация, Google може да разбере, че текстът е за процес или класация.
  19. К: Тук имаме два примера. В първата статия присъстват само заглавия с номерация, които гугъл разбира като класация, а във втория резултат имаме HTML ordered list, който Гугъл разбира като процес.
  20. М: Това са само някои от базовите похвати, с които роботите на Гугъл анализират и разбират съдържанието в мрежата, като както можем да си представим, такива има още много и много по-сложни. Благодарение на тези похвати, търсачката има възможност постоянно да подобрява своите умения, за да разбира човек и съдържание. След като направихме базов преглед на тези похвати, ще може да разберем и по-добре драстичните промени в алгоритмите и съответно динамичните резултати в SERP-a.
  21. К: Може да се каже че тази година е най-динамичната по отношение на промени в алгоритъма на търсачката. Като основна роля за това имат т.нар. Широки ъпдейти на ядрото на алгоритъма.
  22. К: И ако до тук SEO-тата бяхме свикнали на единични алгоритми, които таргетират конкретен аспект като съдържание, линкове и т.н., вече не се взема предвид само един фактор, а множество такива едновременно.
  23. К: Тези фактори са качество на уебсайта, възприятие на потребителя, взаимодействие със сайта, линкове, история, ранк брейн и много други фактори, базирани на технологията machine-learning. Това означава, че се случват много промени в претеглянето на различни фактори и основно се засилва ролята на т.н. “намерение зад търсенето” или “intent”.
  24. К: Какво дава индикации, да смятаме така? През 2018-та се случиха редица нововъведения. Всички целящи да избистрят представата на Google за намерението на потребителите зад тяхното търсене. Ще ги разгледаме набързо по дати.
  25. М: През февруари започнаха да излизат снипети с 2 отговора за едно търсене. Това дава индикации, Google да разбира част от търсенията на потребителите, като такива с повече от едно намерение. Тоест за едно търсене, може да има повече от един верен прочит. Примерът от скрийншотът е за това дали градина се нуждае от постоянно огряване от слънцето а резултатите са: веднъж: кои растения се нуждаят от такова и две: какво представлява постоянното огряване от слънцето.
  26. М: При мартенския ъпдейт за пръв път се заговори за намерение зад търсенето на потребителя, както и за по-големите възможности на Гугъл да разбира съдържание.
  27. М: Седмица преди следващият голям трус от август, Гугъл увеличава с повече от 35% резултатите, които включват панел “People also ask”, което прави присъствието му в повече от 50% от всички търсения. По този на§ин гугъл се старае още по добре да избистри намерението зад всяко търсене.
  28. К: На първи август бе вторият масивен широк ъпдейт на алгоритъма, по-известен като Медикал ъпдейт-а, тъй като удари много сайтове на здравословна тематика. Тогава популярност доби и абревиатурата E.A.T. или т.е. Expertise, Authority, Trust. Оттук-нататък ще използваме за кратко EAT. Този ъпдейт бе изключително турбулентен, защото Гугъл вече може да разбира централното базово намерение на един уебсайт. Повече детайли след малко.
  29. М: Гугъл въведе подтеми в knowledge panel-a, като показаните тук. С други думи Google разбира че зад всяко entity (обект) има различни свързани подтеми, които потребителят може да иска да научи, за да бъде напълно задоволен.
  30. М: През семптември 2018 Гугъл започна да показва и т.нар. каруселни снипети наричани още IQ bubble snippet-и, които са поредните способи за сондиране на намерение на търсенето (intent).
  31. М: Логично е драстичните промени в органичните резултати, измененията във featured snippets & knowledge graph, people also ask, authorship, за който ще споменем по-късно, всички да са свързани с един и същ компонент.
  32. К: Новият изкуствен интелект още се нарича “neural matching” или “тематичен слой” (topical layer) бе официално обявен през септември като много важен, или даже основен анонс от страна на Гугъл. Технологията позволява разбиране на отделните думи не само по значение, но и отношение към цялостни концепции, идеи и тези. Това позволява да се свърже още по-точно търсенето по даден ключова дума със правилната концепция и съответно резултати. Това се нарича “neural matching”.
  33. М: Чао медицински ъпдейт, здравей ъпдейт за намерението на търсене или какво означава това?
  34. М: Индикациите сочат, че след медицинския ъпдейт от 1ви август, Гугъл вече е способен да разбира централното / базово намерение / или т.е. целта зад един уебсайт и да го сравни с това зад съдържанието на същия. Когато двете се разминават, Гугъл не е доволен. Много от потърпевшите уебсайтове падат точно под това определение. Един сайт не трябва да “заблуждава” в своята цел. Ако е магазин, трябва да изглежда и да има поведение на магазин. Ако е информационнен, да бъде такъв, а не да продава продукти и реклами.
  35. К: Това е един от ярките примери. Bodybuilding.com се самоопределя като “образователен и информационен сайт”, докато на практика има поведение на магазин. Пълен е с реклами, а когато си на сайта не може да разбереш дали е информационен или магазин.
  36. К: Докато PopSugar UK ясно заявяват естеството на своя сайт.
  37. M: Идеята на това изображение е, да онагледи евентуалния различен микс на факторите, влияещи на ранкинга в тези три типа интент: новини, навигация и пазаруване.
  38. М: Ако през юли миксът от фактори за сайт на здравословна тематика е бил този в ляво, то през август, вече миксът е променен и включва нов фактор или няколко - trust, website profile & profile match, user satisfaction или други.
  39. К: Сега ще представим данни от изследване направено в/у 600 000 сайта афектирани от медицинския ъпдейт.
  40. К: Успешните сайтове след ъпдейта са лесни за употреба, имат свеж, елегантен и модерен интерфейс като взема предвид сигнали като цветова гама, постоянство в дизайна, стилизации, бяло пространство, визуална йерархия и т.н. Хубаво е да се спомене, че освен това развиващо се умение, Гугъл има още доста фактори, по които да оцени и награди тези сайтове, като линкове, интеракция и бранд метрики и навярно те се вземат предвид пряко.
  41. К: Има съвсем малка корелация между ранкингите и скоростта на сайтовете, повлияни от ъпдейта, и макар и малка, си струва да се спомене тази закономерност.
  42. М: Макар да не е еднозначна и задължителна, дължината на съдържание има позитивна корелация с покачване на ранкингите след ъпдейта. И все пак, не са нужни 5000 думи, за да получиш отговор на въпроса “Кога е финалът на Шампионска лига?”. Тази корелация може да се обясни с това, че голяма част от засегнатите сайтове са във вертикали като финанси и здраве, където изчерпателно съдържание е за предпочитане.
  43. М: Макар и изключително субективен фактор, сайтове със добро мобилно преживяване се радват на подобрения. Това са размер на фонт, контраст, подредба, структура, както и размер на бутони.
  44. М: В много от потърпевшите сайтове се наблюдават т.н. “Заблуждаващи реклами” омесени със основното съдържание. За много от най-драматичните случаи, заблуждаващите реклами изпъкват със своето присъствие.
  45. К: Тунинговането на “About us” страницата със препоръки, сертификати и доказателства за авторитет е едно от най-препоръчваните от лагера на EAT почитателите, но макар и малка, положителна зависимост с покачване на ранкинги е на лице. Да се погрижите за страницата е прекрасно, но това надали е пряк ранкинг фактор, тъй като има и “печеливши” домейни без такива. Най-малкото, манипулацията тук е възможна и лесна. Гугъл наистина се интересуват от вашата експертиза и авторитет, но имат много други оффсайт сигнали, с които да ги определят - като беклинкове, бранд меншъни, търсенето на бранда ви.
  46. К: Не е изненада, че в цитираната извадка от 600 000 сайта се наблюдава корелация между качественото съдържание и по-добри ранкинги. Хубаво е да се отбележи, че много сайтове с висококачествено съдържание все пак преживяват големи спадове. Качеството на съдържанието само по себе си не е фактор а комбинация от много други. Какво характеризира печелившите сайтове? Богато на визуално съдържание - видео и изображения. Добре-структурирано съдържание, включая списъци, цитати, метадата и т.н. Богати на препратки към външни ресурси.
  47. К: Любопитен аспект на качеството на съдържание е тонът. И макар NLP да се развива с бясни темпове, все пак ще е трудно да се определи до колко една статия е увлекателна, полезна в действителност или интересна, но със сигурност Гугъл може да различи лежерният тон (блогъри) от този на професионален журналист или учен.
  48. М: Следните фактори нямат значение за ранкингите на изследваните 600 000 сайта - наличието на авторски профилни страници, линкове към социалните профили на авторите от сайта ви, препоръки, или страница с контакти. Ако все пак държите на тази идея, имайте предвид, че много сайтове, които предоставят съмнителна информация не са пострадали от ъпдейта. И все пак, да обогатите такива страници е повече от прекрасно, но не би било единственото лекарство ако сте пострадали от ъпдейтите. Често-срещана препоръка от почитателите на ЕАТ е добавянето на информация за контакт на всяка страница или най-малкото да имате изчерпателна ‘Contact us” страница. Като идея, това звучи прекрасно, но както всяко локално SEO ще ви каже, т.н. “Identity layer”, или т.е. Пласт на идентичност се определя от доста offsite фактори. Според цитираната извадка обаче, няколко големи екомерс сайта извън US, все пак търпят спадове.
  49. К: За кратък период от около 2 седмици, през август Google сервира “Interesting finds” панел при търсене на имена на автор, но от тогава такива не са налични. Споменаваме този факт, защото очевидно Google все още работи в посока authorship.
  50. М: Често срещан феномен е сайтове от една и съща сфера да линкват интензивно помежду си. Например, противниците на ваксините са по-гласни и активни, в сравнение с тези, които подкрепят ваксинацията. Това довежда до повече дискусии, активност, повече линкове и повече съдържание вътре в обществото на противници. С поредицата от ъпдейти, изглежда, че Гугъл се стреми да изолира и намали ефекта от този феномен. Също така, ъпдейтът цели и да намали предимството на големите издатели, които притежават голям брой от сайтове, които отногов активно линкват помежду си.
  51. К
  52. K: Информационото съдържание може да служи както за SEO, така и за преживяването на потребителя. А именно след идентифициране на тематики да се създават т.нар. поддържащи страници, базирани на семантика и търсене, или само на семантика. По този начин може да се обособи тематичен слой в самия сайт, откъдето и вътрешни връзки с контролиран енкър текст. Изчерпателният тематичен слой от такива поддържащи страници спомага и информационното пътуване. На практика това означава, че с правилно подбрани тематики вашият сайт може намери място в някое от многото нововъведения в SERP-a. Това са стандартните single featured snippets, double featured snippets, IQ bubble snippets, people also ask boxes и knowledge panel-a.
  53. К: Ключът към добре оптимизираното съдържание е проста структура на самото изречение, особено когато отговаряме на въпрос. Превърнете въпроса в твърдение и добавете отговора.
  54. К: При оптимизация за NLP внимавайте отговорите на въпроси да включват информация, която върви ръка за ръка с отговора. Пример: ако търсите дължина на title tag - обикновено в сайтовете, форумите и т.н. където се намира отговоа, той върви ръка за ръка с characters/pixels, а не със cm или mm.
  55. К: В конкретния пример, сайтът който държеше позиция 0 преди нас не отговаряше така конкретно на въпроса
  56. М: Ако се върнем към примера с предаването Top Gear - ако пишете за Top Gear и искате търсачката да разбере, че текста ви се отнася за него, можете да добавите имената на водещите, от коя до коя година е продуцирано, каналът по който е излъчвано и т.н. Целта не е да ранкнете за тези думи, а за да подсилите конкретността на текста.
  57. М: В нашата практика се стараем винаги да изчерпваме всеки възможен прочит на темата. В конкретния пример това беше информация за всички фази: преди, по време и след боядисване.
  58. М