SlideShare a Scribd company logo
ПОИСК ИНФОРМАЦИИ В
 ИНТЕРНЕТЕ ПРИ
 ПОМОЩИ ПОИСКОВЫХ
 СИСТЕМ, КАТАЛОГОВ И
 ПОРТАЛОВ

В. Рогалевич, Информационный поиск:
источники и методы 2012
АВТОМАТИЗАЦИЯ ПОИСКА
    Большие массивы информации и системы ее




                                                      Информационный поиск: источники и методы, 2012

    поиска существовали задолго до появления
    интернета
   Чтобы отыскать нужное, требовалась помощь
    специалиста
   Первые автоматизированные поисковые системы
    появились в 50-60-е годы 20 века (искали только
    текст)
   В начале 1990-х стали появляться первые
    поисковые системы в сети интернет
   Интернет - неструктурированный источник
    информации, за которым отсутствует общий
    контроль,не обязательно выявлена орфография.
   Тем не менее и здесь возможен эффективный поиск
    нужной информации при помощи различных
    механизмов и методов.                             2
СРЕДСТВА ПОИСКА ИНФОРМАЦИИ
В ИНТЕРНЕТЕ




                                                                     Информационный поиск: источники и методы, 2012
                      Средства поиска информации в
                                интернете




Индексирующие поисковые       Тематические каталоги
                                                       Порталы
 системы (Google, Yahoo)     (http://www.dmoz.org/ )




                                                                 3
ИНДЕКСИРУЮЩИЕ ПОИСКОВЫЕ
СИСТЕМЫ ИЛИ ПОИСКОВИКИ




                                                     Информационный поиск: источники и методы, 2012
 Поисковые системы (information retrieval
  systems, search engines) - основные средства
  поиска информации в интернете
 в индексирующей поисковой системе нет
  структурированного списка ссылок или
  рубрикаций
 огромные базы данных, состоящие из
  различных веб-страниц, которые
  индексируются только при помощи
  компьютеров (программ-роботов, «пауков»)
                                                 4
 «Пауки» постоянно ищут в интернете новые веб-




                                                       Информационный поиск: источники и методы, 2012
  сайты, отправляют их индексаторам, затем
  продолжают поиск, двигаясь по ссылкам этих
  сайтов все глубже и дальше;
 Программы-индексаторы определяют основные
  признаки, ссылки и тематику сайтов и сохраняют
  их в файлы;
 Ключевые слова берутся из URL-адреса
  страницы, из названия страницы, из заголовков
  в HTML-коде страницы из основного текста
 Поиск проводится в базе данных конкретного
  поисковика                                       5
ПОИСКОВЫЙ ЗАПРОС

 Запрос - слово или фраза, по которй
  поисковая система будет искать требующиеся
  веб-сайты (ключевые слова),




                                                 методы, 2012
                                                 Информационный поиск: источники и
 Запрос вводится в строку поиска поисковика,
 Затем содержимое запроса сопоставляется с
  веб-страницами, находящимися в базе
  данных поисковой системы,
 При наличии там нужного или фразы, эти
  страницы добавляются в список результатов
  поиска
 ! В список результатов попадают не сами веб-
  сайты, а их немного устаревшие копии,
  находящиеся в сервере поисковика               6
ИТАК:




                                                Информационный поиск: источники и методы, 2012
                         Программное
   Паук     Индексатор
                         обеспечение
 (spider)    (index)
                         search engine
                            software




                           Интерфейс
                         поисковика (user
                            interface)



                                            7
ИНДЕКСИРУЮЩИЕ ПОИСКОВЫЕ
СИСТЕМЫ ИСПОЛЬЗУЮТСЯ
КОГДА:




                                                           Информационный поиск: источники и методы, 2012
   пользователь может точно сформулировать свой
    запрос;
   нужно сэкономить время, нужное для поиска
    информации;
   нужна свежая и актуальная информация, касающаяся
    какого-либо события или явления;
   нужно, чтобы информация искалась во всех доступных
    местах интернета (форумы, блоги, группы новостей);
   есть время и желание выбирать нужную информацию
    из огромного массива найденных материалов;
   пользователь гогтов сам оценивать качество
    найденных веб-страниц.                             8
ПОИСКОВЫЕ СИСТЕМЫ НЕ ИЩУТ:




                                                 Информационный поиск: источники и методы, 2012
 информацию во внутренних сетях Интранет,
 сайты, предлагающие узкий круг услуг,

 сайты, требующие регистрирования и
  динамические сайты (базы данных),
 быстро стареющие и теряющие актуальность
  сайты (новости),
 сайты, в HTML-заглавиях которых имеется
  запрет на индексирование,
 а также сайты с отдаленными, непрямыми
  адресами.
                                             9
НЕГАТИВНЫЕ СТОРОНЫ




                                                 Информационный поиск: источники и методы, 2012
 Составление наиболее точного запроса, чтобы
  количество ответов было минимальным;
 Отсутствует контроль за качеством
  информации;
 Не слишком частое обновление базы данных;

 Разные поисковые системы используют разные
  методы индексации и потому дают разные
  результаты запроса;
 Мало информации касательно найденного
  документа;
 Базы данных поисковых систем содержат лишь
                                                10
  малую часть ресурсов интернета.
КЛАССИФИКАЦИЯ ПОИСКОВЫХ
    СИСТЕМ
    SEARCHENGINEWATCH.COM




                                                            Информационный поиск: источники и методы, 2012
   Основные или универсальные системы, например
    Google, Bing, Yahoo, Altavista, Ask.com, AOL
   Детские системы, http://kids.yahoo.com/,
    http://www.askkids.com, http://www.agakids.ru,
    http://kids.quintura.ru
   Поисковые системы новостей, Yahoo News, Google News,
    http://www.topix.net/
   Мультимедийные системы (аудио/видео/иллюстрации):
    http://www.findsounds.com/, http://www.blinkx.com/
   Специализированные системы: http://www.scirus.com
   Скачиваемые программы, Copernic, Quintura
   Метапоисковые системы, Metacrawler, Dogpile, Mamma     11
   Региональные системы, Neti.ee, www.ee, www.yandex.ru
НЕМНОГО СТАТИСТИКИ:
ИСПОЛЬЗОВАНИЕ ПОИСКОВЫХ СИСТЕМ В
2011Г




                             Информационный поиск: источники и методы, 2012
                            12
Информационный поиск: источники и методы, 2012
                                                   13
В РОССИИ
Информационный поиск: источники и методы, 2012
                                                    14
В МИРЕ
ПОИСКОВЫЕ СИСТЕМЫ
                   СЕМАНТИЧЕСКОГО
                   ПОИСКА




                                                              Информационный поиск: источники и методы, 2012
 Такие системы зачастую имеют людей-редакторов.
 Система дает ответы на запрос на естественном
  языке, причем вопрос должен быть на английском
  языке.
 Запрос может простым словом, вопросом или
  предложением, не нужно точно знать правила
  составления запроса
 Если программа правильно интерпретирует
  вопрос, то результат будет более релевантным и
  точным, чем в других поисковых системах.
   http://www.lexxe.com/ , http://www.wolframalpha.com/ ,   15
    http://www.hakia.com , http://asknet.ru/
RSS-АГРЕГАТОРЫ




                                                    Информационный поиск: источники и методы, 2012
 Приложения, собирающие и обрабатывающие
  информацию RSS-каналов
 Веб-агрегаторы, - сайты по сбору и
  отображению RSS-потоков, такие как
  Яндекс.Лента (http://lenta.yandex.ru/) ,
  Google Reader, Netvibes, Pageflakes, Bloglines
 Некоторые поисковые системы уже включают в
  себе RSS-агрегаторы, например
  http://www.webalta.ru/ , http://www.aol.com/
 Многие современные браузеры и почтовые
  клиенты также умеют работать с RSS-лентами
                                                   16
ГЛУБОКАЯ ПАУТИНА




                                                 Информационный поиск: источники и методы, 2012
 также известна как невидимая паутина (англ.
  invisible web, - множество веб-страниц
  Всемирной паутины, неиндексируемых
  поисковыми системами.
 Наиболее значительной частью глубокой
  паутины является глубинный веб (от англ.
  deep web, hidden web), состоящий из веб-
  страниц, динамически-генерируемых по
  запросам к онлайн базам данных
 также сайты, доступ к которым открыт только
  для зарегистрированных пользователей
                                                17
ГЛУБОКАЯ ПАУТИНА
 значительная часть
  Всемирной паутины
  оказывается скрыта от




                                                          методы, 2012
                                                          Информационный поиск: источники и
  поисковых роботов
 Доступная информация –всего
  лишь верхушка айсберга все
  информации, имющейся в сети
 http://www.deeppeep.org/

 http://www.incywincy.com/

 http://www.management.com.ua/ims/ims172.html
     (статья )
   http://rus.ruvr.ru/2009/01/14/910608.html (Подкаст)   18
КАК ИСКАТЬ: ТАКТИКА И
СТРАТЕГИЯ ПОИСКА




                                                  Информационный поиск: источники и методы, 2012
 Поисковый запрос нужно формулировать
  достаточно четко и конкретно, чаще всего это
  словосочетание (например: клеить обои,
  биография Пушкина).
 Обязательно проверяйте орфографию
  поисковых слов!
 Для более конкретного поиска информации
  поисковые системы предлагают расширенные
  возможности поиска (Advanced Search,
  Täpsustatud otsing)
 У каждой системы свой выбор параметров
                                                 19
ЛОГИЧЕСКИЙ ЯЗЫК ЗАПРОСОВ
 Для быстрого нахождения нужной информации




                                                      Информационный поиск: источники и методы, 2012
  специалисты советуют пользоваться логическим
  языком запроса
 Это допольнительные служебные команды,
  уточняющие требования запроса
 Например: нужно искать веб-страницы, в которых
  есть слово «деньги» или «долги»
 искать страницы, где есть слово «деньги», но не
  встречается «долги».
 Логические операции И, ИЛИ, НО НЕ
  ВСТРЕЧАЕТСЯ в каждой системе выполняются
  по определенным командам. Список находится в
  справочном разделе поисковой системы. (&, ~ , !)   20
ЛОГИЧЕСКИЕ                             George
                                       Boole
ОПЕРАТОРЫ БУЛЯ




                                                              Информационный поиск: источники и методы, 2012
 При поиске в БД часто
  используются англоязычные
  логические операторы: AND,
  OR, NOT, NEAR.
 http://lib.colostate.edu/tutorials/advboolean.html


   http://guides.rusarchives.ru/help/query.html;jsessionid=lMmr

   В настоящее время они уже
    встроены в систему поиска и
    их следует просто выбрать
                                                         21
ФОРМИРОВАНИЕ ЗАПРОСА В
РАСШИРЕННОМ ПОИСКЕ GOOGLE




                                     методы, 2012
                                     Информационный поиск: источники и
                  Операторы Буля в
                  встроенном виде




                                     22
ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ




                                                     Информационный поиск: источники и методы, 2012
 У многих поисковых систем имеется целый ряд
  дополнительных услуг и возможностей
 Поиск мультимедийных файлов, перевод и тд в
  Google: http://www.google.ee/about/products/
 Доп. услуги Google
  http://www.google.ee/intl/et/help/features.html
 Поиск материалов, защищенных лицензией
  Creative Commons:
  http://search.creativecommons.org/
 В Google – в расширенном поиске можно также
  указать лицензию веб-документов                   23
Информационный поиск: источники и
                            методы, 2012
                                                                24
ПОИСК ЧЕРЕЗ САЙТ CREATIVE
COMMONS
Информационный поиск: источники и
методы, 2012
                                    25
МЕТАПОИСКОВЫЕ СИСТЕМЫ
    Поисковые механизмы, которые посылают запрос




                                                              21.5.12

    пользователя другим поисковым системам и базам
    данных




                                                      методы 2012
                                                      Информационный поиск: источники и
   У метапоисковых систем обычно нет собственной
    базы данных
   Результаты запроса обьединяются, повторяющиеся
    материалы исключаются из списка найденных
    страниц.
   Время, затраченное на поиск информации
    значительно сокращается, но ответы на запрос
    очень похожи и повторяются.
   довольно гибкие системы, т.к. ищут информацию и
                                                      26
    в каталогах и в индексрующих системах.
Информационный поиск: источники и
                          21.5.12
                                    методы 2012
                                                                        27
СТРУКТУРА МЕТАПОИСКОВЫХ
СИСТЕМ
Информационный поиск: источники и
                       методы, 2012
                                                           28
ПРИМЕР МЕТАПОИСКОВОЙ
СИСТЕМЫ
КОГДА ИСПОЛЬЗОВАТЬ?
  когда нужно быстро узнать, есть ли в




                                                       21.5.12

  интернете информация, касающаяся какой-
  нибудь специфической темы,




                                               методы 2012
                                               Информационный поиск: источники и
 результаты запроса таким системам в
  основном общие и поверхностные
 для сокращения времени поиска
  просматривается всего 10% результатов.
 при уточнении запроса система может прийти
  в замешательство, поскольу у разных
  поисковых систем разные языки запроса
                                               29
ПРИМЕРЫ
 http://www.exactus.ru/ метапоиск и




                                                          21.5.12
  интеллектуальный (семантический) поиск +
  поиск в Википедии




                                                  методы 2012
                                                  Информационный поиск: источники и
 http://nigma.ru/ интеллектуальная поисковая
  система, первая кластеризирующая и
  метапоисковая система в Рунете, создана при
  поддержке МГУ им. М. В. Ломоносова и Stanford
  University
 http://www.dogpile.com/

 http://www.ixquick.com/ (не сохраняет
  информацию о пользователе)
 http://www.mamma.com/                           30

 http://www.webcrawler.com/
«УМНЫЕ» МЕТАПОИСКОВЫЕ
МЕХАНИЗМЫ (SMART
METASEARCH ENGINES)
 Выполняют кластерный и лингвистический




                                                        21.5.12
  анализ результатов темы запроса, также
  анализ текста




                                                методы 2012
                                                Информационный поиск: источники и
 Позволяют заглянуть чуть глубже в
  полученные результаты
 Однако, ни одна из этих технологий не
  превосходит качество БД поисковых систем,
  откуда они берут информацию
 Поэтому метапоиск советуется, когда нужно
  проводить более широкий поиск, искать общую
  информацию
 Примеры «умных» систем:
  http://www.surfwax.com/, nigma.ru ,           31

  http://search.yippy.com/
ТЕМАТИЧЕСКИЕ КАТАЛОГИ
 схожи по принципу своей работы с




                                                       21.5.12
  традиционными бумажными каталогами
 Чтобы найти сайт по определенной тематике,




                                               методы 2012
                                               Информационный поиск: источники и
  необходимо ознакомиться с содержанием
  каталога
 Иерархическая система организации
  информации: основные рубрики (напр.
  Экономика, Отдых, Спорт), подтемы и тд
 составляются специалистами в области
  информационной науки или в области
  конкретной тематики
 все выбранные в каталог страницы заранее
  оценены и сравнительно релевантны            32
Информационный поиск: источники и
                       методы, 2012
                                                           33
ПРИМЕР ТЕМАТИЧЕСКОГО
КАТАЛОГА
ТЕМАТИЧЕСКИЕ КАТАЛОГИ
  Каталоги составляются на основе




                                                        21.5.12

  предложений, советов и оценок пользователей




                                                методы 2012
                                                Информационный поиск: источники и
 База данных у каталогов намного меньше ,
  чем у поисковых систем
 Многие тематические каталоги оснащены
  поисковыми системами, которые проводят
  поиск вне каталога (в случае, если в базе
  данных каталога не было найдено достаточное
  количество ответов на запрос)
 советуют использовать на самом первом этапе
  поиска информации для общего ознакомления
                                                34
  с конкретной тематикой
КОГДА ИСПОЛЬЗОВАТЬ?
    когда нужно найти качественную и предварительно




                                                                   21.5.12

    оцененную специалистами информацию;
    когда ищется информация на какую-либо общую,




                                                           методы 2012
                                                           Информационный поиск: источники и

    широкую тему;
   когда надо уточнить какую-то тему и получить общий,
    систематический обзор;
   в случае, если пользователь владеет некоторыми
    иностранными языками;
   когда пользователь желает получить разумное (т.е. не
    очень большое) количество ответов.
   Отрицательные черты: большое количество
    устаревшей информации и выборочность                   35
    информации.
ПРИМЕРЫ
  http://www.dmoz.org/ (Open Directory Project,




                                                          21.5.12

  самый популярный и обширный каталог,
  мультиязыковой)




                                                  методы 2012
                                                  Информационный поиск: источники и
 http://botw.org/ (Best of the Web Directory )

 http://www.stpt.com/directory/

 http://dir.yahoo.com/ ,

 http://yaca.yandex.ru/




                                                  36
ИНТЕРНЕТ-ПОРТАЛЫ (WEB
PORTALS)
 Портал – в переводе означает «двери»,




                                                         21.5.12
  «ворота».
 веб-сайт, предоставляющий пользователю




                                                 методы 2012
                                                 Информационный поиск: источники и
  Интернета различные интерактивные сервисы,
  работающие в рамках одного веб-сайта, такие
  как почта, поиск, погода, новости, форумы,
  обсуждения, голосования и т.д (iGoogle, MSN)
 Горизонтальные порталы: охватывающие
  много тем и услуг , в т.ч. поиск — Yahoo,
  Яндекс;
 Вертикальные порталы: специализированные
  тематические порталы (портал альпинистов,
  образовательный портал, филологический
  портал: http://www.philology.ru/ )             37
Информационный поиск: источники и
                 методы, 2012
                                                     38
ПРИМЕР ПОРТАЛА
КАРТЫ И АТЛАСЫ В ИНТЕРНЕТЕ
 Атласы в интернете позволяют с легкостью
  найти нужный населенный пункт или объект




                                                           21.5.12
  при помощи строки поиска




                                                   методы 2012
                                                   Информационный поиск: источники и
 Также можно проложить маршрут из пункта А
  в пункт Б (на автомобиле)
 http://maps.google.com/ (Возможность
  трехмерного просмотра Google Street View)
 http://maps.yandex.ru/ (есть т.н. Народная
  карта, где пользователи сами добавляют места
  и обьекты)
 http://www.bing.com/maps/ (карты NASA)

 http://maps.yahoo.com (использует карты Nokia)
                                                   39
 Интерактивная карта Таллинна
GOOGLE STREET VIEW ПО АДРЕСУ
ТАЛЛИННСКОГО УНИВЕРСИТЕТА




                               методы, 2012
                               Информационный поиск: источники и
                               40

More Related Content

What's hot

Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)
Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)
Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)
Julia Glavcheva
 
информационный поиск в интернет
информационный поиск в интернет информационный поиск в интернет
информационный поиск в интернет
Savua
 
20150129 минобороны презентация v02
20150129 минобороны презентация v0220150129 минобороны презентация v02
20150129 минобороны презентация v02
finnopolis
 
поиск информации с использованием компьютера на зачёт
поиск информации с использованием компьютера на зачётпоиск информации с использованием компьютера на зачёт
поиск информации с использованием компьютера на зачётvfhbzgjnfgrbyf123456
 
Разновидности поисковых систем в Интернете
Разновидности поисковых систем в ИнтернетеРазновидности поисковых систем в Интернете
Разновидности поисковых систем в Интернете
obstinate
 
поиск в интернете
поиск в интернетепоиск в интернете
поиск в интернете
solodmar
 
Поиск информации в Интернете
Поиск информации в ИнтернетеПоиск информации в Интернете
Поиск информации в Интернете
Дарья
 
[2011] seo коротко о главном
[2011] seo коротко о главном[2011] seo коротко о главном
[2011] seo коротко о главном
IRCIT
 
методы поиска инф. в интернет
методы поиска инф. в интернетметоды поиска инф. в интернет
методы поиска инф. в интернет
Olena Bashun
 
Algorithms overview for content discovery and distribution (on russian)
Algorithms overview for content discovery and distribution (on russian) Algorithms overview for content discovery and distribution (on russian)
Algorithms overview for content discovery and distribution (on russian) Alexander Petrov
 
Ispras (трудаков, коршунов)
Ispras (трудаков, коршунов)Ispras (трудаков, коршунов)
Ispras (трудаков, коршунов)
Andzhey Arshavskiy
 
Digital Society Laboratory (Аршавский)
Digital Society Laboratory (Аршавский)Digital Society Laboratory (Аршавский)
Digital Society Laboratory (Аршавский)
Andzhey Arshavskiy
 
лекция информационные ресурсы
лекция информационные ресурсылекция информационные ресурсы
лекция информационные ресурсы
Tatjana Reichert
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернете
Olena Bashun
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетеLibrary Franko
 
информатика
информатикаинформатика
информатикаPR15049455
 
Современное программное обеспечение в работе психолога
Современное программное обеспечение в работе психологаСовременное программное обеспечение в работе психолога
Современное программное обеспечение в работе психолога
Kyrylo Zakharov
 
работа в интернет
работа в интернетработа в интернет
работа в интернетNatalyaSH
 

What's hot (19)

Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)
Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)
Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)
 
информационный поиск в интернет
информационный поиск в интернет информационный поиск в интернет
информационный поиск в интернет
 
лекция 5
лекция 5лекция 5
лекция 5
 
20150129 минобороны презентация v02
20150129 минобороны презентация v0220150129 минобороны презентация v02
20150129 минобороны презентация v02
 
поиск информации с использованием компьютера на зачёт
поиск информации с использованием компьютера на зачётпоиск информации с использованием компьютера на зачёт
поиск информации с использованием компьютера на зачёт
 
Разновидности поисковых систем в Интернете
Разновидности поисковых систем в ИнтернетеРазновидности поисковых систем в Интернете
Разновидности поисковых систем в Интернете
 
поиск в интернете
поиск в интернетепоиск в интернете
поиск в интернете
 
Поиск информации в Интернете
Поиск информации в ИнтернетеПоиск информации в Интернете
Поиск информации в Интернете
 
[2011] seo коротко о главном
[2011] seo коротко о главном[2011] seo коротко о главном
[2011] seo коротко о главном
 
методы поиска инф. в интернет
методы поиска инф. в интернетметоды поиска инф. в интернет
методы поиска инф. в интернет
 
Algorithms overview for content discovery and distribution (on russian)
Algorithms overview for content discovery and distribution (on russian) Algorithms overview for content discovery and distribution (on russian)
Algorithms overview for content discovery and distribution (on russian)
 
Ispras (трудаков, коршунов)
Ispras (трудаков, коршунов)Ispras (трудаков, коршунов)
Ispras (трудаков, коршунов)
 
Digital Society Laboratory (Аршавский)
Digital Society Laboratory (Аршавский)Digital Society Laboratory (Аршавский)
Digital Society Laboratory (Аршавский)
 
лекция информационные ресурсы
лекция информационные ресурсылекция информационные ресурсы
лекция информационные ресурсы
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернете
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернете
 
информатика
информатикаинформатика
информатика
 
Современное программное обеспечение в работе психолога
Современное программное обеспечение в работе психологаСовременное программное обеспечение в работе психолога
Современное программное обеспечение в работе психолога
 
работа в интернет
работа в интернетработа в интернет
работа в интернет
 

Similar to Поиск информации в интернете при помощи поисковых систем

Prezent puti interneta_neispovedimi
Prezent puti interneta_neispovedimiPrezent puti interneta_neispovedimi
Prezent puti interneta_neispovedimirinto2
 
Puple's presentation
Puple's presentationPuple's presentation
Puple's presentation
Kuznecov
 
Поиск информации
Поиск информацииПоиск информации
Поиск информации
НБ МДУ
 
Медиаклуб «SEO для НКО: инструкция по применению»
Медиаклуб «SEO для НКО: инструкция по применению»Медиаклуб «SEO для НКО: инструкция по применению»
Медиаклуб «SEO для НКО: инструкция по применению»
Agency for social information
 
презентация интернет
презентация интернетпрезентация интернет
презентация интернет
Superkachek Superkachek
 
люстик
люстиклюстик
люстикAnna
 
Александр Люстик - На что нужно обращать внимание при составлении семантическ...
Александр Люстик - На что нужно обращать внимание при составлении семантическ...Александр Люстик - На что нужно обращать внимание при составлении семантическ...
Александр Люстик - На что нужно обращать внимание при составлении семантическ...
Александр Алаев
 
На_что_нужно_обращать_внимание_при_составлении_семантического_ядра
На_что_нужно_обращать_внимание_при_составлении_семантического_ядраНа_что_нужно_обращать_внимание_при_составлении_семантического_ядра
На_что_нужно_обращать_внимание_при_составлении_семантического_ядраAleksandr Leyko
 
Start prezenten
Start prezentenStart prezenten
Start prezentenrinto2
 
скIm2 занятие 2 - seo, семантика
скIm2   занятие 2 - seo, семантикаскIm2   занятие 2 - seo, семантика
скIm2 занятие 2 - seo, семантика
Ivan Pronko
 
Презентация - Web
Презентация - WebПрезентация - Web
Презентация - WebMaksim Kislov
 
системный анализ и реинжиниринг
системный анализ и реинжинирингсистемный анализ и реинжиниринг
системный анализ и реинжинирингAleksandr Barmin
 
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
HRPR Camp - Самое технологичное событие в HR
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетеLibrary Franko
 
[Youdz.ru] поиск в интернете.
[Youdz.ru] поиск в интернете.[Youdz.ru] поиск в интернете.
[Youdz.ru] поиск в интернете.
You DZ
 
Poisk informacii v_internete
Poisk informacii v_internetePoisk informacii v_internete
Poisk informacii v_internetemaksim_shishelov
 
Поисковое продвижение - Михаил Федоринин
Поисковое продвижение - Михаил ФедорининПоисковое продвижение - Михаил Федоринин
Поисковое продвижение - Михаил ФедорининMyAcademy
 
AskNet Search
AskNet SearchAskNet Search
AskNet Search
Andrey Ogarok
 
вводный доклад, анатомия поисковых машин
вводный доклад, анатомия поисковых машинвводный доклад, анатомия поисковых машин
вводный доклад, анатомия поисковых машинAlex Lychack
 

Similar to Поиск информации в интернете при помощи поисковых систем (20)

Prezent puti interneta_neispovedimi
Prezent puti interneta_neispovedimiPrezent puti interneta_neispovedimi
Prezent puti interneta_neispovedimi
 
Puple's presentation
Puple's presentationPuple's presentation
Puple's presentation
 
Поиск информации
Поиск информацииПоиск информации
Поиск информации
 
Медиаклуб «SEO для НКО: инструкция по применению»
Медиаклуб «SEO для НКО: инструкция по применению»Медиаклуб «SEO для НКО: инструкция по применению»
Медиаклуб «SEO для НКО: инструкция по применению»
 
презентация интернет
презентация интернетпрезентация интернет
презентация интернет
 
люстик
люстиклюстик
люстик
 
Александр Люстик - На что нужно обращать внимание при составлении семантическ...
Александр Люстик - На что нужно обращать внимание при составлении семантическ...Александр Люстик - На что нужно обращать внимание при составлении семантическ...
Александр Люстик - На что нужно обращать внимание при составлении семантическ...
 
На_что_нужно_обращать_внимание_при_составлении_семантического_ядра
На_что_нужно_обращать_внимание_при_составлении_семантического_ядраНа_что_нужно_обращать_внимание_при_составлении_семантического_ядра
На_что_нужно_обращать_внимание_при_составлении_семантического_ядра
 
Start prezenten
Start prezentenStart prezenten
Start prezenten
 
скIm2 занятие 2 - seo, семантика
скIm2   занятие 2 - seo, семантикаскIm2   занятие 2 - seo, семантика
скIm2 занятие 2 - seo, семантика
 
Презентация - Web
Презентация - WebПрезентация - Web
Презентация - Web
 
системный анализ и реинжиниринг
системный анализ и реинжинирингсистемный анализ и реинжиниринг
системный анализ и реинжиниринг
 
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
Конкурентная разведка в Интернете _ Инна Юрик _ Школа бизнес-исследований_ bu...
 
модуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернетемодуль 2 тема 4 оценка кач ва информ. в интернете
модуль 2 тема 4 оценка кач ва информ. в интернете
 
[Youdz.ru] поиск в интернете.
[Youdz.ru] поиск в интернете.[Youdz.ru] поиск в интернете.
[Youdz.ru] поиск в интернете.
 
Poisk informacii v_internete
Poisk informacii v_internetePoisk informacii v_internete
Poisk informacii v_internete
 
Поисковое продвижение - Михаил Федоринин
Поисковое продвижение - Михаил ФедорининПоисковое продвижение - Михаил Федоринин
Поисковое продвижение - Михаил Федоринин
 
Базовый курс по SEO
Базовый курс по SEOБазовый курс по SEO
Базовый курс по SEO
 
AskNet Search
AskNet SearchAskNet Search
AskNet Search
 
вводный доклад, анатомия поисковых машин
вводный доклад, анатомия поисковых машинвводный доклад, анатомия поисковых машин
вводный доклад, анатомия поисковых машин
 

Поиск информации в интернете при помощи поисковых систем

  • 1. ПОИСК ИНФОРМАЦИИ В ИНТЕРНЕТЕ ПРИ ПОМОЩИ ПОИСКОВЫХ СИСТЕМ, КАТАЛОГОВ И ПОРТАЛОВ В. Рогалевич, Информационный поиск: источники и методы 2012
  • 2. АВТОМАТИЗАЦИЯ ПОИСКА Большие массивы информации и системы ее Информационный поиск: источники и методы, 2012  поиска существовали задолго до появления интернета  Чтобы отыскать нужное, требовалась помощь специалиста  Первые автоматизированные поисковые системы появились в 50-60-е годы 20 века (искали только текст)  В начале 1990-х стали появляться первые поисковые системы в сети интернет  Интернет - неструктурированный источник информации, за которым отсутствует общий контроль,не обязательно выявлена орфография.  Тем не менее и здесь возможен эффективный поиск нужной информации при помощи различных механизмов и методов. 2
  • 3. СРЕДСТВА ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ Информационный поиск: источники и методы, 2012 Средства поиска информации в интернете Индексирующие поисковые Тематические каталоги Порталы системы (Google, Yahoo) (http://www.dmoz.org/ ) 3
  • 4. ИНДЕКСИРУЮЩИЕ ПОИСКОВЫЕ СИСТЕМЫ ИЛИ ПОИСКОВИКИ Информационный поиск: источники и методы, 2012  Поисковые системы (information retrieval systems, search engines) - основные средства поиска информации в интернете  в индексирующей поисковой системе нет структурированного списка ссылок или рубрикаций  огромные базы данных, состоящие из различных веб-страниц, которые индексируются только при помощи компьютеров (программ-роботов, «пауков») 4
  • 5.  «Пауки» постоянно ищут в интернете новые веб- Информационный поиск: источники и методы, 2012 сайты, отправляют их индексаторам, затем продолжают поиск, двигаясь по ссылкам этих сайтов все глубже и дальше;  Программы-индексаторы определяют основные признаки, ссылки и тематику сайтов и сохраняют их в файлы;  Ключевые слова берутся из URL-адреса страницы, из названия страницы, из заголовков в HTML-коде страницы из основного текста  Поиск проводится в базе данных конкретного поисковика 5
  • 6. ПОИСКОВЫЙ ЗАПРОС  Запрос - слово или фраза, по которй поисковая система будет искать требующиеся веб-сайты (ключевые слова), методы, 2012 Информационный поиск: источники и  Запрос вводится в строку поиска поисковика,  Затем содержимое запроса сопоставляется с веб-страницами, находящимися в базе данных поисковой системы,  При наличии там нужного или фразы, эти страницы добавляются в список результатов поиска  ! В список результатов попадают не сами веб- сайты, а их немного устаревшие копии, находящиеся в сервере поисковика 6
  • 7. ИТАК: Информационный поиск: источники и методы, 2012 Программное Паук Индексатор обеспечение (spider) (index) search engine software Интерфейс поисковика (user interface) 7
  • 8. ИНДЕКСИРУЮЩИЕ ПОИСКОВЫЕ СИСТЕМЫ ИСПОЛЬЗУЮТСЯ КОГДА: Информационный поиск: источники и методы, 2012  пользователь может точно сформулировать свой запрос;  нужно сэкономить время, нужное для поиска информации;  нужна свежая и актуальная информация, касающаяся какого-либо события или явления;  нужно, чтобы информация искалась во всех доступных местах интернета (форумы, блоги, группы новостей);  есть время и желание выбирать нужную информацию из огромного массива найденных материалов;  пользователь гогтов сам оценивать качество найденных веб-страниц. 8
  • 9. ПОИСКОВЫЕ СИСТЕМЫ НЕ ИЩУТ: Информационный поиск: источники и методы, 2012  информацию во внутренних сетях Интранет,  сайты, предлагающие узкий круг услуг,  сайты, требующие регистрирования и динамические сайты (базы данных),  быстро стареющие и теряющие актуальность сайты (новости),  сайты, в HTML-заглавиях которых имеется запрет на индексирование,  а также сайты с отдаленными, непрямыми адресами. 9
  • 10. НЕГАТИВНЫЕ СТОРОНЫ Информационный поиск: источники и методы, 2012  Составление наиболее точного запроса, чтобы количество ответов было минимальным;  Отсутствует контроль за качеством информации;  Не слишком частое обновление базы данных;  Разные поисковые системы используют разные методы индексации и потому дают разные результаты запроса;  Мало информации касательно найденного документа;  Базы данных поисковых систем содержат лишь 10 малую часть ресурсов интернета.
  • 11. КЛАССИФИКАЦИЯ ПОИСКОВЫХ СИСТЕМ SEARCHENGINEWATCH.COM Информационный поиск: источники и методы, 2012  Основные или универсальные системы, например Google, Bing, Yahoo, Altavista, Ask.com, AOL  Детские системы, http://kids.yahoo.com/, http://www.askkids.com, http://www.agakids.ru, http://kids.quintura.ru  Поисковые системы новостей, Yahoo News, Google News, http://www.topix.net/  Мультимедийные системы (аудио/видео/иллюстрации): http://www.findsounds.com/, http://www.blinkx.com/  Специализированные системы: http://www.scirus.com  Скачиваемые программы, Copernic, Quintura  Метапоисковые системы, Metacrawler, Dogpile, Mamma 11  Региональные системы, Neti.ee, www.ee, www.yandex.ru
  • 12. НЕМНОГО СТАТИСТИКИ: ИСПОЛЬЗОВАНИЕ ПОИСКОВЫХ СИСТЕМ В 2011Г Информационный поиск: источники и методы, 2012 12
  • 13. Информационный поиск: источники и методы, 2012 13 В РОССИИ
  • 14. Информационный поиск: источники и методы, 2012 14 В МИРЕ
  • 15. ПОИСКОВЫЕ СИСТЕМЫ СЕМАНТИЧЕСКОГО ПОИСКА Информационный поиск: источники и методы, 2012  Такие системы зачастую имеют людей-редакторов.  Система дает ответы на запрос на естественном языке, причем вопрос должен быть на английском языке.  Запрос может простым словом, вопросом или предложением, не нужно точно знать правила составления запроса  Если программа правильно интерпретирует вопрос, то результат будет более релевантным и точным, чем в других поисковых системах.  http://www.lexxe.com/ , http://www.wolframalpha.com/ , 15 http://www.hakia.com , http://asknet.ru/
  • 16. RSS-АГРЕГАТОРЫ Информационный поиск: источники и методы, 2012  Приложения, собирающие и обрабатывающие информацию RSS-каналов  Веб-агрегаторы, - сайты по сбору и отображению RSS-потоков, такие как Яндекс.Лента (http://lenta.yandex.ru/) , Google Reader, Netvibes, Pageflakes, Bloglines  Некоторые поисковые системы уже включают в себе RSS-агрегаторы, например http://www.webalta.ru/ , http://www.aol.com/  Многие современные браузеры и почтовые клиенты также умеют работать с RSS-лентами 16
  • 17. ГЛУБОКАЯ ПАУТИНА Информационный поиск: источники и методы, 2012  также известна как невидимая паутина (англ. invisible web, - множество веб-страниц Всемирной паутины, неиндексируемых поисковыми системами.  Наиболее значительной частью глубокой паутины является глубинный веб (от англ. deep web, hidden web), состоящий из веб- страниц, динамически-генерируемых по запросам к онлайн базам данных  также сайты, доступ к которым открыт только для зарегистрированных пользователей 17
  • 18. ГЛУБОКАЯ ПАУТИНА  значительная часть Всемирной паутины оказывается скрыта от методы, 2012 Информационный поиск: источники и поисковых роботов  Доступная информация –всего лишь верхушка айсберга все информации, имющейся в сети  http://www.deeppeep.org/  http://www.incywincy.com/  http://www.management.com.ua/ims/ims172.html (статья )  http://rus.ruvr.ru/2009/01/14/910608.html (Подкаст) 18
  • 19. КАК ИСКАТЬ: ТАКТИКА И СТРАТЕГИЯ ПОИСКА Информационный поиск: источники и методы, 2012  Поисковый запрос нужно формулировать достаточно четко и конкретно, чаще всего это словосочетание (например: клеить обои, биография Пушкина).  Обязательно проверяйте орфографию поисковых слов!  Для более конкретного поиска информации поисковые системы предлагают расширенные возможности поиска (Advanced Search, Täpsustatud otsing)  У каждой системы свой выбор параметров 19
  • 20. ЛОГИЧЕСКИЙ ЯЗЫК ЗАПРОСОВ  Для быстрого нахождения нужной информации Информационный поиск: источники и методы, 2012 специалисты советуют пользоваться логическим языком запроса  Это допольнительные служебные команды, уточняющие требования запроса  Например: нужно искать веб-страницы, в которых есть слово «деньги» или «долги»  искать страницы, где есть слово «деньги», но не встречается «долги».  Логические операции И, ИЛИ, НО НЕ ВСТРЕЧАЕТСЯ в каждой системе выполняются по определенным командам. Список находится в справочном разделе поисковой системы. (&, ~ , !) 20
  • 21. ЛОГИЧЕСКИЕ George Boole ОПЕРАТОРЫ БУЛЯ Информационный поиск: источники и методы, 2012  При поиске в БД часто используются англоязычные логические операторы: AND, OR, NOT, NEAR.  http://lib.colostate.edu/tutorials/advboolean.html  http://guides.rusarchives.ru/help/query.html;jsessionid=lMmr  В настоящее время они уже встроены в систему поиска и их следует просто выбрать 21
  • 22. ФОРМИРОВАНИЕ ЗАПРОСА В РАСШИРЕННОМ ПОИСКЕ GOOGLE методы, 2012 Информационный поиск: источники и Операторы Буля в встроенном виде 22
  • 23. ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ Информационный поиск: источники и методы, 2012  У многих поисковых систем имеется целый ряд дополнительных услуг и возможностей  Поиск мультимедийных файлов, перевод и тд в Google: http://www.google.ee/about/products/  Доп. услуги Google http://www.google.ee/intl/et/help/features.html  Поиск материалов, защищенных лицензией Creative Commons: http://search.creativecommons.org/  В Google – в расширенном поиске можно также указать лицензию веб-документов 23
  • 24. Информационный поиск: источники и методы, 2012 24 ПОИСК ЧЕРЕЗ САЙТ CREATIVE COMMONS
  • 26. МЕТАПОИСКОВЫЕ СИСТЕМЫ Поисковые механизмы, которые посылают запрос 21.5.12  пользователя другим поисковым системам и базам данных методы 2012 Информационный поиск: источники и  У метапоисковых систем обычно нет собственной базы данных  Результаты запроса обьединяются, повторяющиеся материалы исключаются из списка найденных страниц.  Время, затраченное на поиск информации значительно сокращается, но ответы на запрос очень похожи и повторяются.  довольно гибкие системы, т.к. ищут информацию и 26 в каталогах и в индексрующих системах.
  • 27. Информационный поиск: источники и 21.5.12 методы 2012 27 СТРУКТУРА МЕТАПОИСКОВЫХ СИСТЕМ
  • 28. Информационный поиск: источники и методы, 2012 28 ПРИМЕР МЕТАПОИСКОВОЙ СИСТЕМЫ
  • 29. КОГДА ИСПОЛЬЗОВАТЬ? когда нужно быстро узнать, есть ли в 21.5.12  интернете информация, касающаяся какой- нибудь специфической темы, методы 2012 Информационный поиск: источники и  результаты запроса таким системам в основном общие и поверхностные  для сокращения времени поиска просматривается всего 10% результатов.  при уточнении запроса система может прийти в замешательство, поскольу у разных поисковых систем разные языки запроса 29
  • 30. ПРИМЕРЫ  http://www.exactus.ru/ метапоиск и 21.5.12 интеллектуальный (семантический) поиск + поиск в Википедии методы 2012 Информационный поиск: источники и  http://nigma.ru/ интеллектуальная поисковая система, первая кластеризирующая и метапоисковая система в Рунете, создана при поддержке МГУ им. М. В. Ломоносова и Stanford University  http://www.dogpile.com/  http://www.ixquick.com/ (не сохраняет информацию о пользователе)  http://www.mamma.com/ 30  http://www.webcrawler.com/
  • 31. «УМНЫЕ» МЕТАПОИСКОВЫЕ МЕХАНИЗМЫ (SMART METASEARCH ENGINES)  Выполняют кластерный и лингвистический 21.5.12 анализ результатов темы запроса, также анализ текста методы 2012 Информационный поиск: источники и  Позволяют заглянуть чуть глубже в полученные результаты  Однако, ни одна из этих технологий не превосходит качество БД поисковых систем, откуда они берут информацию  Поэтому метапоиск советуется, когда нужно проводить более широкий поиск, искать общую информацию  Примеры «умных» систем: http://www.surfwax.com/, nigma.ru , 31 http://search.yippy.com/
  • 32. ТЕМАТИЧЕСКИЕ КАТАЛОГИ  схожи по принципу своей работы с 21.5.12 традиционными бумажными каталогами  Чтобы найти сайт по определенной тематике, методы 2012 Информационный поиск: источники и необходимо ознакомиться с содержанием каталога  Иерархическая система организации информации: основные рубрики (напр. Экономика, Отдых, Спорт), подтемы и тд  составляются специалистами в области информационной науки или в области конкретной тематики  все выбранные в каталог страницы заранее оценены и сравнительно релевантны 32
  • 33. Информационный поиск: источники и методы, 2012 33 ПРИМЕР ТЕМАТИЧЕСКОГО КАТАЛОГА
  • 34. ТЕМАТИЧЕСКИЕ КАТАЛОГИ Каталоги составляются на основе 21.5.12  предложений, советов и оценок пользователей методы 2012 Информационный поиск: источники и  База данных у каталогов намного меньше , чем у поисковых систем  Многие тематические каталоги оснащены поисковыми системами, которые проводят поиск вне каталога (в случае, если в базе данных каталога не было найдено достаточное количество ответов на запрос)  советуют использовать на самом первом этапе поиска информации для общего ознакомления 34 с конкретной тематикой
  • 35. КОГДА ИСПОЛЬЗОВАТЬ? когда нужно найти качественную и предварительно 21.5.12  оцененную специалистами информацию; когда ищется информация на какую-либо общую, методы 2012 Информационный поиск: источники и  широкую тему;  когда надо уточнить какую-то тему и получить общий, систематический обзор;  в случае, если пользователь владеет некоторыми иностранными языками;  когда пользователь желает получить разумное (т.е. не очень большое) количество ответов.  Отрицательные черты: большое количество устаревшей информации и выборочность 35 информации.
  • 36. ПРИМЕРЫ http://www.dmoz.org/ (Open Directory Project, 21.5.12  самый популярный и обширный каталог, мультиязыковой) методы 2012 Информационный поиск: источники и  http://botw.org/ (Best of the Web Directory )  http://www.stpt.com/directory/  http://dir.yahoo.com/ ,  http://yaca.yandex.ru/ 36
  • 37. ИНТЕРНЕТ-ПОРТАЛЫ (WEB PORTALS)  Портал – в переводе означает «двери», 21.5.12 «ворота».  веб-сайт, предоставляющий пользователю методы 2012 Информационный поиск: источники и Интернета различные интерактивные сервисы, работающие в рамках одного веб-сайта, такие как почта, поиск, погода, новости, форумы, обсуждения, голосования и т.д (iGoogle, MSN)  Горизонтальные порталы: охватывающие много тем и услуг , в т.ч. поиск — Yahoo, Яндекс;  Вертикальные порталы: специализированные тематические порталы (портал альпинистов, образовательный портал, филологический портал: http://www.philology.ru/ ) 37
  • 38. Информационный поиск: источники и методы, 2012 38 ПРИМЕР ПОРТАЛА
  • 39. КАРТЫ И АТЛАСЫ В ИНТЕРНЕТЕ  Атласы в интернете позволяют с легкостью найти нужный населенный пункт или объект 21.5.12 при помощи строки поиска методы 2012 Информационный поиск: источники и  Также можно проложить маршрут из пункта А в пункт Б (на автомобиле)  http://maps.google.com/ (Возможность трехмерного просмотра Google Street View)  http://maps.yandex.ru/ (есть т.н. Народная карта, где пользователи сами добавляют места и обьекты)  http://www.bing.com/maps/ (карты NASA)  http://maps.yahoo.com (использует карты Nokia) 39  Интерактивная карта Таллинна
  • 40. GOOGLE STREET VIEW ПО АДРЕСУ ТАЛЛИННСКОГО УНИВЕРСИТЕТА методы, 2012 Информационный поиск: источники и 40