Лекция 5. Поисковые системы.

1,117 views

Published on

Основы работы в интернет

  • Be the first to comment

  • Be the first to like this

Лекция 5. Поисковые системы.

  1. 1. Национальный аэрокосмический университетим. Н.Е.Жуковского «ХАИ»ОСНОВЫ РАБОТЫ В ИНТЕРНЕТ.ЛЕКЦИЯ №5.Поисковые системы.Принцип работы поисковой системы.Фурманов Алексей Аркадиевич
  2. 2. Популярные поисковые системыАнглоязычные:1. http://google.com2. http:// yahoo.com3. http:// bing.com (msn.com)4. первая была – http://altavista.comРусскоязычные:1. http:// yandex.ru2. http:// rambler.ruУкраиноязычные:1. http:// meta.ua
  3. 3. Поисковые системы FTPАнглоязычные:1. http://globalfilesearch.com2. http://www.filesearching.com/Русскоязычные:1. http://www.mmnt.ru2. http://files.ru
  4. 4. Структурируемые тематическиекаталогиКаталог — «собрание сайтов,сгруппированных по различным тематикам,вся информация в каталогахобрабатывается вручную. Для добавлениянового сайта в раздел каталога необходимоотправить заявку, после обработки которойсотрудник решает вопрос о его добавлениив каталог.
  5. 5. Поисковая системаПоисковая система — полностьюавтоматизированная структура, состоящаяиз поисковой машины (робот, паук) и базыданных ссылок.
  6. 6. Основные понятия поисковых системИндексация — это процесс сбораинформации в интернете поисковоймашиной, путём перехода между ссылками,указывающими на сайты.Релевантность – это уровень логическогосоответствия каждой найденной страницыпоисковому запросу.
  7. 7. Недостатки поисковых системОсновной недостаток — частое нахождениеинформации неверное по логическомусмыслу. Этот недостаток связан савтоматизированным подходом квычислению релевантности.
  8. 8. Регистрация в поисковых машинахУ большинства поисковых систем существуетстраница добавления сайта на индексацию.Срок индексации зависит от поисковой машины(Яндекс ~ 1 неделя).Google не позволяет добавлять сайт наидексацию, а начинает индексировать сайттолько при условии, что на него есть хотя быодна ссылка на сайте, присутствующем в базеданных сайтов.
  9. 9. Устройство ПС Google
  10. 10. Алгоритм работы ПС Google : 1I. Сбор информации1) Роботы сканируют содержимоесайтов в Интернет (1)2) И затем размещают собраннуюинформацию на серверахиндексов (2)…3) и серверах документов (3)
  11. 11. Алгоритм работы ПС Google : 2I. Выдача результатов поискового запроса1) Web-клиент посылает запрос на один из Web-серверов Google (4)2) Web-сервер трансформирует запрос в вид,пригодный для сервера индекса и посылает его (5)3) Сервер индексов формирует запрос для серверадокументов пользуясь алгоритмами вычислениярелевантности и собственными базами индексов4) По полученным результатам сервер индексовобращается к серверам документов (6) дляполучения фрагментов документов, после чегоотдаёт готовый результат Web-серверу (7)5) Web-сервер отдаёт результат Web-клиенту (8)

×