11. ● amod: adjectival modifier - модификатор на прилагателно
● nsubj: nominal subject - номинален субект
● prep: preposition - предлог
● pobj: object of a preposition - обект на предлога
За любознателните - тук другите видове зависимости.
Разбор по смислова зависимост
18. Класификация по тип съдържание
● Събитие
● Рецепта
● Продукт
● Новина
● Други
19. Значение на текста спрямо неговата структура
● Заглавия
● Параграфи
● Списъци
● Размер шрифт
● Отстояния
● Изображения
● Цветове
● Класация
● Процес
● Номерация+ +
43. ● Дизайн
● Скорост
● Дължина на съдържанието
Ранкинг фактори с положителна корелация:
44. ● Дизайн
● Скорост
● Дължина на съдържанието
● Мобилно преживяване
Ранкинг фактори с положителна корелация:
45. ● Дизайн
● Скорост
● Дължина на съдържанието
● Мобилно преживяване
● Рекламно преживяване
Ранкинг фактори с положителна корелация:
46.
47.
48.
49. ● Дизайн
● Скорост
● Дължина на съдържанието
● Мобилно преживяване
● Рекламно преживяване
● About us страница
Ранкинг фактори с положителна корелация:
50. ● Дизайн
● Скорост
● Дължина на съдържанието
● Мобилно преживяване
● Рекламно преживяване
● About us страница
● Качество на съдържанието
Ранкинг фактори с положителна корелация:
51.
52. ● Авторски профилни страници
● Линкове към социалните профили на авторите от сайта ви
● Авторски препоръки
● Страница за контакти
Ранкинг фактори с отрицателна корелация:
53. Любопитен факт 1:
За кратко през август,
Google сервира резултати базирани на
Имената на автор, представени като
“interesting finds”.
М: Днес ще ви представим няколко тези - първо - ще говорим за базови концепции при обработка на естествен език, за да ги свържем с последните Google updates, и накрая ще ви представим добри практики как да създавате съдържание в контекста на обработка на естествен език.
М: Започваме с два метода, които полагат основите на обработка на естествен език - LSI и Word Vectors.
М: Реално, това е технология, развита през края на 80 години, в отговор на по-ранните технологии, които не са успявали да разберат добре синоними, както на изображението: pictures & photos. Общо-взето, LSi e било супер метод, но за ранните търсачки. Хубаво е да се има предвид откъде идва и какво означава, тъй като “LSI” се използва в много по-широк смисъл в наши дни.
М: Следваща стъпка в развитието на обработката на естествен език е т.нар. векторна дума. “Word vector” изразяват взаимовръзките м/у отделни думи. Сходните думи имат близки вектори. Тук сме дали едни от най-простите примери: king - man + woman = queen. На 2рата картинка можем да видим как се измерват като стойности.
М: На тази картинка искаме да онагледим как в един куп от думи, както навярно се случва и при Гугъл, се образуват групички. По-късно ще видим докъде това е стигнало в наше време а именно Topical layer-а, knowledge graph, featured snippets и т.н.
М: Това бяха два по-стари метода, като предстоят други, взети от свободно-достъпния ни към днешна дата, инструмент за “Cloud Natural Language” processing.
К: Какво се случва първо - Google разбива изречението на отделни части. Това се нарича токенизация. А след това класифицира отделните думи като части на речта - съществително, прилагателно, глагол, предлог, и пунктуация.
К: Гугъл стига до там да разбира еднакви думи с различно значение и да ги идентифицира правилно, а именно омоними. Това е лематизация.
К: Следва определяне взаимозависимостта на думите спрямо граматика. Гугъл определя връзки м/у думите в едно изречение.
К: След като установи връзките между думите, Гугъл прави разбор по смисловата зависимост. Коя дума е обект на действието. коя на предлог, коя модификатор на прилагателно и т.н.
К: В следващата стъпка, Гугъл създава своеобразно досие на всяко понятие, т.е. т.нар. обект или “entity”. Entities могат да бъдат личности, животински видове, локации, термини, разбира се, брандови имена. В този пример се виждат “brown fox” и “dog”.
К: Гугъл научава все повече и повече за нашия свят и разбира, че освен животното лисица, има и друго “entity” - американската компания Fox.
М: Следващият метод е определяне на т.нар. “Salience” или още “aboutness”. Google дава оценка доколко един текст или в случая това изречение, се отнася към конкретна дума или тема. В примера “The Top Gear show featured Bмв, AUDI, MERCEDES and a truck” става въпрос тв шоу на първо място, след това кое е това шоу - Top Gear, следва “камион”, защото предаването е за превозни средства, и накрая са трите бранда. И все пак това е само микро пример. В действителност този инструмент се използва за анализиране на цели документи, форуми, уеб страници и т.н., не за отделни изречения само. Практично приложение е да се изследва един форум за технология например, или SEO, и да се анализира за потенциални трендове или дори настроения на хората.
М: Следва определяне на позитивно или отрицателно настроение за entities или цяла статия или сайт. Наскоро попаднахме на впечатляващо case study, в което бе извършен анализ на хиляди заглавия свързани с Тесла и Елън Мъск, в който анализ негативните заглавия бяха по-малко, но имаха повече сигнали като споделянки и линкове. Тезата бе, че негативното отношение е предпочитано от потребителите и затова преобладаващите резултати за определен период от време са с негативна емоция зад тях.
М: Следващ прочит, който прави Гугъл е да категоризира съдържанието. Това е и на практика, формиране на т.н. topical authority, която намира отражение и в наскоро-обявения “topical layer”. Скрийншотът е само на първите 20на в публикуван от Гугъл списък, като на практика, сигурно са стотици и хиляди такива категории.
К: Този скрийншот е от научна публикация на Гугъл. Тук търсачката класифицира текста според неговата функция, а именно, въпрос, отговор, хвалба, хумор, допълнение, обида и т.н.
К: : Гугъл може да класифицира съдържание И според неговия тип - събитие, рецепта, продукт, новина, дори и без наличие на Schema.org markup. Гугъл използва HTML форматиране и типът данни (дата, локация, URL адрес и други).
К: Нo структурата на текста може да променя неговото значение. А именно, заглавия, списъци, отстояния, цветове, изображения и др. Например ако даден текст е структуриран като html ordered list, или присъстват заглавия с номерация, Google може да разбере, че текстът е за процес или класация.
К: Тук имаме два примера. В първата статия присъстват само заглавия с номерация, които гугъл разбира като класация, а във втория резултат имаме HTML ordered list, който Гугъл разбира като процес.
М: Това са само някои от базовите похвати, с които роботите на Гугъл анализират и разбират съдържанието в мрежата, като както можем да си представим, такива има още много и много по-сложни. Благодарение на тези похвати, търсачката има възможност постоянно да подобрява своите умения, за да разбира човек и съдържание.
След като направихме базов преглед на тези похвати, ще може да разберем и по-добре драстичните промени в алгоритмите и съответно динамичните резултати в SERP-a.
К: Може да се каже че тази година е най-динамичната по отношение на промени в алгоритъма на търсачката. Като основна роля за това имат т.нар. Широки ъпдейти на ядрото на алгоритъма.
К: И ако до тук SEO-тата бяхме свикнали на единични алгоритми, които таргетират конкретен аспект като съдържание, линкове и т.н., вече не се взема предвид само един фактор, а множество такива едновременно.
К: Тези фактори са качество на уебсайта, възприятие на потребителя, взаимодействие със сайта, линкове, история, ранк брейн и много други фактори, базирани на технологията machine-learning. Това означава, че се случват много промени в претеглянето на различни фактори и основно се засилва ролята на т.н. “намерение зад търсенето” или “intent”.
К: Какво дава индикации, да смятаме така? През 2018-та се случиха редица нововъведения. Всички целящи да избистрят представата на Google за намерението на потребителите зад тяхното търсене. Ще ги разгледаме набързо по дати.
М: През февруари започнаха да излизат снипети с 2 отговора за едно търсене. Това дава индикации, Google да разбира част от търсенията на потребителите, като такива с повече от едно намерение. Тоест за едно търсене, може да има повече от един верен прочит. Примерът от скрийншотът е за това дали градина се нуждае от постоянно огряване от слънцето а резултатите са: веднъж: кои растения се нуждаят от такова и две: какво представлява постоянното огряване от слънцето.
М: При мартенския ъпдейт за пръв път се заговори за намерение зад търсенето на потребителя, както и за по-големите възможности на Гугъл да разбира съдържание.
М: Седмица преди следващият голям трус от август, Гугъл увеличава с повече от 35% резултатите, които включват панел “People also ask”, което прави присъствието му в повече от 50% от всички търсения. По този на§ин гугъл се старае още по добре да избистри намерението зад всяко търсене.
К: На първи август бе вторият масивен широк ъпдейт на алгоритъма, по-известен като Медикал ъпдейт-а, тъй като удари много сайтове на здравословна тематика. Тогава популярност доби и абревиатурата E.A.T. или т.е. Expertise, Authority, Trust. Оттук-нататък ще използваме за кратко EAT. Този ъпдейт бе изключително турбулентен, защото Гугъл вече може да разбира централното базово намерение на един уебсайт. Повече детайли след малко.
М: Гугъл въведе подтеми в knowledge panel-a, като показаните тук. С други думи Google разбира че зад всяко entity (обект) има различни свързани подтеми, които потребителят може да иска да научи, за да бъде напълно задоволен.
М: През семптември 2018 Гугъл започна да показва и т.нар. каруселни снипети наричани още IQ bubble snippet-и, които са поредните способи за сондиране на намерение на търсенето (intent).
М: Логично е драстичните промени в органичните резултати, измененията във featured snippets & knowledge graph, people also ask, authorship, за който ще споменем по-късно, всички да са свързани с един и същ компонент.
К: Новият изкуствен интелект още се нарича “neural matching” или “тематичен слой” (topical layer) бе официално обявен през септември като много важен, или даже основен анонс от страна на Гугъл. Технологията позволява разбиране на отделните думи не само по значение, но и отношение към цялостни концепции, идеи и тези. Това позволява да се свърже още по-точно търсенето по даден ключова дума със правилната концепция и съответно резултати. Това се нарича “neural matching”.
М: Чао медицински ъпдейт, здравей ъпдейт за намерението на търсене или какво означава това?
М: Индикациите сочат, че след медицинския ъпдейт от 1ви август, Гугъл вече е способен да разбира централното / базово намерение / или т.е. целта зад един уебсайт и да го сравни с това зад съдържанието на същия. Когато двете се разминават, Гугъл не е доволен. Много от потърпевшите уебсайтове падат точно под това определение. Един сайт не трябва да “заблуждава” в своята цел. Ако е магазин, трябва да изглежда и да има поведение на магазин. Ако е информационнен, да бъде такъв, а не да продава продукти и реклами.
К: Това е един от ярките примери. Bodybuilding.com се самоопределя като “образователен и информационен сайт”, докато на практика има поведение на магазин. Пълен е с реклами, а когато си на сайта не може да разбереш дали е информационен или магазин.
К: Докато PopSugar UK ясно заявяват естеството на своя сайт.
M: Идеята на това изображение е, да онагледи евентуалния различен микс на факторите, влияещи на ранкинга в тези три типа интент: новини, навигация и пазаруване.
М: Ако през юли миксът от фактори за сайт на здравословна тематика е бил този в ляво, то през август, вече миксът е променен и включва нов фактор или няколко - trust, website profile & profile match, user satisfaction или други.
К: Сега ще представим данни от изследване направено в/у 600 000 сайта афектирани от медицинския ъпдейт.
К: Успешните сайтове след ъпдейта са лесни за употреба, имат свеж, елегантен и модерен интерфейс като взема предвид сигнали като цветова гама, постоянство в дизайна, стилизации, бяло пространство, визуална йерархия и т.н. Хубаво е да се спомене, че освен това развиващо се умение, Гугъл има още доста фактори, по които да оцени и награди тези сайтове, като линкове, интеракция и бранд метрики и навярно те се вземат предвид пряко.
К: Има съвсем малка корелация между ранкингите и скоростта на сайтовете, повлияни от ъпдейта, и макар и малка, си струва да се спомене тази закономерност.
М: Макар да не е еднозначна и задължителна, дължината на съдържание има позитивна корелация с покачване на ранкингите след ъпдейта. И все пак, не са нужни 5000 думи, за да получиш отговор на въпроса “Кога е финалът на Шампионска лига?”. Тази корелация може да се обясни с това, че голяма част от засегнатите сайтове са във вертикали като финанси и здраве, където изчерпателно съдържание е за предпочитане.
М: Макар и изключително субективен фактор, сайтове със добро мобилно преживяване се радват на подобрения. Това са размер на фонт, контраст, подредба, структура, както и размер на бутони.
М: В много от потърпевшите сайтове се наблюдават т.н. “Заблуждаващи реклами” омесени със основното съдържание. За много от най-драматичните случаи, заблуждаващите реклами изпъкват със своето присъствие.
К: Тунинговането на “About us” страницата със препоръки, сертификати и доказателства за авторитет е едно от най-препоръчваните от лагера на EAT почитателите, но макар и малка, положителна зависимост с покачване на ранкинги е на лице.
Да се погрижите за страницата е прекрасно, но това надали е пряк ранкинг фактор, тъй като има и “печеливши” домейни без такива. Най-малкото, манипулацията тук е възможна и лесна.
Гугъл наистина се интересуват от вашата експертиза и авторитет, но имат много други оффсайт сигнали, с които да ги определят - като беклинкове, бранд меншъни, търсенето на бранда ви.
К: Не е изненада, че в цитираната извадка от 600 000 сайта се наблюдава корелация между качественото съдържание и по-добри ранкинги. Хубаво е да се отбележи, че много сайтове с висококачествено съдържание все пак преживяват големи спадове.
Качеството на съдържанието само по себе си не е фактор а комбинация от много други.
Какво характеризира печелившите сайтове?
Богато на визуално съдържание - видео и изображения.
Добре-структурирано съдържание, включая списъци, цитати, метадата и т.н.
Богати на препратки към външни ресурси.
К: Любопитен аспект на качеството на съдържание е тонът.
И макар NLP да се развива с бясни темпове, все пак ще е трудно да се определи до колко една статия е увлекателна, полезна в действителност или интересна, но със сигурност Гугъл може да различи лежерният тон (блогъри) от този на професионален журналист или учен.
М: Следните фактори нямат значение за ранкингите на изследваните 600 000 сайта - наличието на авторски профилни страници, линкове към социалните профили на авторите от сайта ви, препоръки, или страница с контакти. Ако все пак държите на тази идея, имайте предвид, че много сайтове, които предоставят съмнителна информация не са пострадали от ъпдейта. И все пак, да обогатите такива страници е повече от прекрасно, но не би било единственото лекарство ако сте пострадали от ъпдейтите. Често-срещана препоръка от почитателите на ЕАТ е добавянето на информация за контакт на всяка страница или най-малкото да имате изчерпателна ‘Contact us” страница. Като идея, това звучи прекрасно, но както всяко локално SEO ще ви каже, т.н. “Identity layer”, или т.е. Пласт на идентичност се определя от доста offsite фактори. Според цитираната извадка обаче, няколко големи екомерс сайта извън US, все пак търпят спадове.
К: За кратък период от около 2 седмици, през август Google сервира “Interesting finds” панел при търсене на имена на автор, но от тогава такива не са налични. Споменаваме този факт, защото очевидно Google все още работи в посока authorship.
М: Често срещан феномен е сайтове от една и съща сфера да линкват интензивно помежду си. Например, противниците на ваксините са по-гласни и активни, в сравнение с тези, които подкрепят ваксинацията. Това довежда до повече дискусии, активност, повече линкове и повече съдържание вътре в обществото на противници. С поредицата от ъпдейти, изглежда, че Гугъл се стреми да изолира и намали ефекта от този феномен. Също така, ъпдейтът цели и да намали предимството на големите издатели, които притежават голям брой от сайтове, които отногов активно линкват помежду си.
К
K: Информационото съдържание може да служи както за SEO, така и за преживяването на потребителя. А именно след идентифициране на тематики да се създават т.нар. поддържащи страници, базирани на семантика и търсене, или само на семантика. По този начин може да се обособи тематичен слой в самия сайт, откъдето и вътрешни връзки с контролиран енкър текст. Изчерпателният тематичен слой от такива поддържащи страници спомага и информационното пътуване. На практика това означава, че с правилно подбрани тематики вашият сайт може намери място в някое от многото нововъведения в SERP-a. Това са стандартните single featured snippets, double featured snippets, IQ bubble snippets, people also ask boxes и knowledge panel-a.
К: Ключът към добре оптимизираното съдържание е проста структура на самото изречение, особено когато отговаряме на въпрос. Превърнете въпроса в твърдение и добавете отговора.
К: При оптимизация за NLP внимавайте отговорите на въпроси да включват информация, която върви ръка за ръка с отговора. Пример: ако търсите дължина на title tag - обикновено в сайтовете, форумите и т.н. където се намира отговоа, той върви ръка за ръка с characters/pixels, а не със cm или mm.
К: В конкретния пример, сайтът който държеше позиция 0 преди нас не отговаряше така конкретно на въпроса
М: Ако се върнем към примера с предаването Top Gear - ако пишете за Top Gear и искате търсачката да разбере, че текста ви се отнася за него, можете да добавите имената на водещите, от коя до коя година е продуцирано, каналът по който е излъчвано и т.н. Целта не е да ранкнете за тези думи, а за да подсилите конкретността на текста.
М: В нашата практика се стараем винаги да изчерпваме всеки възможен прочит на темата. В конкретния пример това беше информация за всички фази: преди, по време и след боядисване.