Your SlideShare is downloading. ×
SEO курс 2014, лекция 1 - Основи на търсенето
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

SEO курс 2014, лекция 1 - Основи на търсенето

1,117

Published on

SEO курс 2014, лекция 1 - Основи на търсенето

SEO курс 2014, лекция 1 - Основи на търсенето

Published in: Marketing
0 Comments
6 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,117
On Slideshare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
26
Comments
0
Likes
6
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. SEO курс Лекция 1 Основи на търсенето Лили Грозева allviaweb.com
  • 2. Основи на търсенето
  • 3. 1.1 От какво се състои WWW Мрежата е съвкупност от страници и файлове свързани, чрез сложен набор от хиперлинкове. ● Изображения ● Видео ● PDF документи ● Flash видеа ● Javascript
  • 4. 1.2 История и предназначение на търсачките. ● първите търсачки с хипертекст датират от 1945 ● мейнстрим интернетa е от около 20 години ● първите търсачки - 1993/4 - Excite, Altavista, Yahoo! ● Google стартира през 1996 като Backrub
  • 5. 1.3 трите стъпки на търсенето: обхождане, индексиране и позициониране ● Обхождане (намиране) - С този процес търсачките намират ново съдържание. Използват сложни машини, които посещават страниците и следват линковете в тях, за да го намерят. ● Индексиране (съхранение) - Търсачките поддържат “копие” на всяка страница, която посещават. Тази база данни от страници (индекс) се съхранява на огромен брой компютри по такъв начин, че може да се търси в нея много бързо. ● Позициониране (сортиране) - Когато потребителя търси, търсачката използва ‘рецепта’, известна като алгоритъм за да подреди намерените страници в съответствие с търсенето, и така образува класация по съответствие.
  • 6. How search engines work?
  • 7. 1.4 последни разработки на търсачките ● Социални мрежи - уебсасайтове като Facebook и Twitter помагат на търсачките да разберат кои страници са популярни и се споделят. Тази информация се добавя към алгоритъма на търсачките, и се взима предвид в позиционирането. ● Персонализирано търсене - по подобен начин, търсачките използват информация от социалната активност на потребителите и историята на търсенията им, за да определят какво е важно за всеки търсещ. Това означава, че двама потребители, търсещи с една и съща дума, могат да виждат различни резултати.
  • 8. 1.4 последни разработки на търсачките ● Google Suggest - стартира през август 2008, и използва сложни алгоритми за да предвиди какво търси потребителя. С набирането на думата, Google предлага допълнителни думи за да определи по-точно намерението на търсещия, или да му направи нови предложения, преди той да е натиснал enter. ● Google Instant - стартира през септември 2010, и значително променя начина по който търсят потребителите, като показва динамични резултати още преди потребителя да е натиснал enter.
  • 9. Използване на търсачка
  • 10. 2.1 видове резултати ● изображения ● местни бизнеси ● marked up резултати (т.е. звездички/рейтинг) ● продукти ● видео ● one-box резултати (knowledge graph)
  • 11. 2.2 ползи от оптимизацията за блендираните резултати ● възможност за повече видимост в страницата с резултати (SERP) ● възможност за предлагане на по-смилаеми формати ● трупане на червени точки пред Google - използвате техните продукти, използвате форматите на “бъдещето”
  • 12. 2.3 използване на оператори за търсене Оператора за търсене, позволява да се филтрира набор от резултати, чрез добавяне на параметри и информация. ● можете да използвате повече от един в заявка ● варират в различните търсачки, но най-популярните са еднакви
  • 13. 2.4 оператори за търсене за напреднали Web Search: allinanchor:, allintext:, allintitle:, allinurl:, cache:, define:, filetype:, id:, inanchor:, info:,intext:, intitle:, inurl:, link:, related:, site: Image Search: allintitle:, allinurl:, filetype:, inurl:, intitle:, site: Groups: allintext:, allintitle:, author:, group:, insubject:, intext:, intitle: Directory: allintext:, allintitle:, allinurl:, ext:, filetype:, intext:, intitle:, inurl: News: allintext:, allintitle:, allinurl:, intext:, intitle:, inurl:, location:, source: Product Search: allintext:, allintitle:
  • 14. 2.5 приложение на операторите за SEO ● SEO одити за проверки на индексираните страници, двойно съдържание, структура на уеб адресите, мапиране на ключови думи в заглавия и др. ● при линк билдинг за намиране на сайтове с тематично съдържание, гест постове
  • 15. 2.6 опции за ограничаване и филтриране на търсенията: вертикали ● уеб страници ● изображения ● новини ● видео ● книги ● блогове ● дискусии ● приложения ● патенти
  • 16. 2.6 опции за ограничаване и филтриране на търсенията: филтри ● време на публикация ● достъпност и ползваемост ● местоположение
  • 17. Обхождане (crawling)
  • 18. 3.1 какво представлява обхождането Обхождането се случва с програми, които преминават от линк на линк и събират информация като: ● откриват нови страници, които са с важно съдържание и биха показали на потребителите ● следят когато страниците, които вече са обходени и са в индекса се опресняват с ново съдържание
  • 19. 3.1 важно е да се има предвид: ● обхождането стартира от robots.txt файлът ● честотата на обхождане зависи от навиците ви за поддръжка на съдържанието ● често кролерите четат първото и последното изречение в body text на индексирана страница, за да видят дали има промени преди да я обходят ● линковете се обхождат в последователността, в която са в HTML файла на страницата, а не както са визуализирани за крайния потребител
  • 20. 3.2 възможни препятствия пред кролерите: използвани уеб технологии: ● Javascript ● AJAX ● Flash Важно!: В SEO понякога се използват точно тези технологии, за реализацията на текстове или линкове, които искаме да забраним за индексиране.
  • 21. 3.2 възможни препятствия пред кролерите: използвани уеб технологии: ● Javascript ● AJAX ● Flash За любознателните: Intro to Javascript on W3Schools, Intro to AJAX on W3Schools, Wikipedia article on Adobe Flash
  • 22. 1.3.2 възможни препятствия пред кролерите: видове съдържание ● изображения ● видео
  • 23. 3.3 видове кролери Какво е user agent? User agent е програма, която действа от нечие име под формата на client (в конфогурацията клиент - сървър). Например, user agent Googlebot, което е официалното име на кролерите, са програми, които действат от името на Google като client Google, викайки заявки от сървъра на който са намира уебсайта.
  • 24. 3.3 видове кролери Освен краткото си име всички кролери имат и дълго, което съдържа информация за произхода и версията им. Важно!: не само търсачките са user agents. Такива са всички програми, които имат достъп до информацията в сайта, например браузърите. Например, така изглежда user agent Google Chrome:
  • 25. 3.3 видове кролери Търсачките обикновено имат повече от един вид кролери, според предназначението им: ● Googlebot ● Googlebot-News (Googlebot) ● Googlebot-Image (Googlebot) ● Googlebot-Video (Googlebot) ● Googlebot-Mobile ● Googlebot-Mobile (smartphone) ● Mediapartners-Google (за AdSense) ● AdsBot-Google (проверява качеството на ландинг страницата)
  • 26. 3.3 видове кролери Mozilla Mozilla, като наименование което можете да видите така: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.47 Safari/536.11 не е браузъра Mozilla, а термин описващ технология в браузърите, въведена от Netscape, и в момента използван от всички видове браузъри, включително последната версия на Google Chrome.
  • 27. Индексиране
  • 28. 4.1 какво е уеб индекс Уеб индекс е база данни със страници, които в случая на търсачките съдържат милиарди страници, съхранявани на хиляди сървъри по целия свят, и много бързо достъпни при търсене. Информацията, която се съхранява за всяка страница е придобита в предходната стъпка - обхождане с кролер. Когато търсите с ключова дума, търсачката търси в индекса си страници които съдържат тази или близка до нея дума.
  • 29. 4.2 достигане до информация За да намери такива страници, търсачката използва няколко алгоритъма: ● наличие на думата в страницата ● честота на ключовата дума в страницата ● свързани ключови фрази (намиране на тематично обвързани страници) ● тематично моделиране (намиране на страници по същата тема)
  • 30. 4.2 достигане до информация Наличие на думата в страницата: търсачките преглеждат само повърхностно съдържанието за да видят дали страницата съдържа думата на търсене. Това е най-несъвършения начин за намиране подходящи на търсенето страници.
  • 31. Дума на търсене: бизнес услуги Съдържание А: Един от най-добрите методи за пестене на средства в кризата са аутсорсинг услугите. Това е един по- особен вид бизнес услуги, които позволяват значителна част от разходите на която и да е компания, в който и да е бизнес да се съкратят чувствително. Съдържание Б: Консултантски услуги в областта на: разработване и внедряване на системи за управление; разработване и внедряване на стандарти за продуктова сертификация; Разработване и управление на проекти по различни финансиращи програми; Обучение В този случай търсачката би показала Съдържание А, независимо че по всяка вероятност за търсещият би бил по-полезен втория материал. Изборът се определя от това, че думата “бизнес услуги” се съдържа в текста на А, но не и на Б.
  • 32. 4.2 достигане до информация Честота на ключовата дума в страницата: в този модел, търсачката търси в индекса си страници, в които тази дума се повтаря често. Важно!: този модел търсачките използват само когато фразите не са често срещани.
  • 33. Дума на търсене: фелпс олимпиада Съдържание А: Със спечелването на 8 златни медала на Олимпиадата в Пекин през 2008 г.Фелпс спечелва рекорда за най-много първи места в рамките на едно първенство. Съдържание Б: Второто издание на Зелената олимпиада приключи успешно. В нея взеха участие над 5000 деца от цялата страна. 29% от участниците решиха ... В този случай търсачката отново би показала Съдържание А, но този път причината е, че ’фелпс’ е много по-рядко срещан термин от ‘олимпиада’ и всички резултати на първа страница гравитират около тази дума.
  • 34. 4.2 достигане до информация Свързани ключови фрази: От огромното количество информация с която разполагат, търсачките ‘знаят’ че понякога определени думи често се използват заедно. Затова, когато се използва една от думите, търсачката може да покаже страници, съдържащи и другата дума.
  • 35. Дума на търсене: батман Съдържание А: Батман е най-популярния и любим супергерой създаван някога. Съдържание Б: Крисчън Бейл играе Батман в последните три филма от поредицата от 2008. В този случай търсачката би избрала да покаже Съдържание Б, защото [крисчън бейл] е често употребяван термин заедно с [батман], докато в първия текст има само едно споменаване, което не е достатъчно за машината да е сигурна, че това е най-подходящата страница и наистина се има предвид супергероя.
  • 36. 4.2 достигане до информация Тематично моделиране: Това е най-сложният модел от четирите. Чрез изследване на по-сложни взаимовръзки между различните ключови думи и тяхната честота, търсачките се опитват да разберат коя е темата на страниците. Това е базовата версия на семантичното търсене. Важно!: Търсачките използват комбинации от много други фактори (200+), за да преценят показването или позицията на дадена страница, примерите в урока са опростени и напълно теоритични.
  • 37. Дума на търсене: ски Съдържание А: Спускайки се по почти вертикалния участък, мъжът отмести щеките си в хоризонтално положение и така избегна удар с дърво. Съдържание Б: Той се взираше в монитора на телевизора, обхванат от тежка депресия. Погледна през прозореца, решен да сложи край на живота си, но бързо се уплаши при вида на вертикалния участък. За човешкото око е очевидно, че в Съдържание А темата е ски, докато в Съдържание Б съвсем не е. За търсачките обаче, това е много трудна задача, особено ако разполага само с горните три модела и те няма как да се ориентират само по думата [вертикален участък], която инак е популарна в ски дисциплините.
  • 38. 4.3 какво е каширане и как да проверим кашето на уеб страница За да оптимизират ресурсите си, търсачките използват каширани версии (опростени, обикновено текстови копия) на страниците в индекса си. Каширана версия е тази която се използва при горните модели. Обикновено кашето е на няколко часа или няколко дни, и това означава че решението за позициониране на дадена страница, може да не се базира на текущото й съдържание.
  • 39. 4.3 проверка на каше За да не сте зависими от версията и вида на браузъра си, най- универсалният вариант е през самата търсачка:
  • 40. Позициониране (ranking)
  • 41. 5.1 какво се случва при търсене Когато потребителят търси с ключова дума, търсачката проверява индекса си за страници, които съдържат или са най- близо до тази дума. Тогава всяка от тези страници получава оценка (ранк), базиран на стотици фактори асоциирани със самата страница. След оценяването, страниците се подреждат в страницата с резултати на база ранка си.
  • 42. 5.1 какво се случва при търсене Важно!: ● диаграмата горе е изключително опростена за да е по- нагледна. Реално механизмите по които се случват процесите са много по-сложни ● в реалните търсения, Google използва както потребителското онлайн поведение, така и статистики от ползването, асоциирани към страниците от сайта, които взема от Google Analytics (и затова е безплатен :))
  • 43. 5.2 как персонализираното търсене влияе на позициите Търсачките често използват потребителското поведение, за да преценят колко са доволни от резултатите. Те не използват тези данни само за цялостното им глобално подобрение, но и за да показват персонализирани, по-качествени резултати на индивидуалния потребител. (В някои страни, Google имат легални проблеми с нивото на лични данни които те събират за това персонализиране.)
  • 44. 5.2 как персонализираното търсене влияе на позициите Ако сте логнати в Google Account, Google ще използва историята на сайтовете които сте посещавали, и ще ви ги показва по-високо в резултатите. Ако не сте логнати в Google Account, Google пак ще се опита да ви ги персонализира, но този път на база cookie, което е прикачено към браузъра ви за 180 дни.
  • 45. 5.3 как персонализираното търсене влияе на SEO целите ви ● софтуера за следене на позициите в Google до голяма степен се обезсмисля ● важността от доброто потребителско преживяване се увеличава ● от януари 2012, Google агресивно налагат използването на Google+, която видимо променя резултатите за всеки потребител ● когато проверявате позиции на уебсайт, трябва да използвате браузър без уеб история (като например Incognito Mode на Google Chrome)
  • 46. Упражнения § Дискусия
  • 47. ● Назовете 5 вида файлове, които биха били трудни за обхождане от търсачките. ● Кои са трите основни стъпки, които използват търсачките при търсене? ● Назовете два начина, по които персонализираното търсене се отразява на SEO. ● Какъв оператор за търсене бихте използвали за да проверите приблизителния брой страници индексирани от Google?
  • 48. ● Опитайте се да изведете новинарски модул в резултатите на Google. ● Опитайте се да изведете блендирано търсене ● Опитайте се да изведете резултати със страници, които съдържат думата [Google search] в заглавието си. ● намерете user agent на текущата версия на браузъра си ● намерете пример за уебсайт, който не може да бъде добре индексиран, защото използва Flash на 100% ● проверете cache на уебсайт с Google и Bing. Сравнете кашетата с реалните версии на сайта и се опитайте да установите какво липсва. ● Отворете два браузър прозореца. Логнете се в Google Account с единия, но не и с другия. Търсете с една и съща дума и сверете резултатите.
  • 49. Допълнителни ресурси: ● Facts about Google and Competition ● Web Developer’s SEO Cheat Sheet ● Search Operators ● The Anatomy of a Large-Scale Hypertextual Web Search Engine ● Controlling Crawling and Indexing

×