SlideShare a Scribd company logo
1 of 18
Ранжирование:от строчки кода до Матрикснета Федор Романенко Менеджер отдела качества поиска СтуДень, Москва, 1 апреля 2010
Ранжирование – что это? ,[object Object]
с помощью факторов вычисляет релевантность документа в виде числа
выбирает топ-10
сложная вещь с простым результатом
определяет долю на рынке
самый большой секрет поисковых компаний,[object Object]
 просматриваем все найденные документы
подходит только для специалистов
нельзя использовать, когда найдено много* здесь и далее: первый пример удачного применения в интернет поиске
Текстовое ранжирование: tf*idf (Altavista – 1995) «Близость» текста запроса к тексту документаучитывает: ,[object Object]
обратную частоту слова в языке (inverteddocumentfreq.)
длину документа и запросаТекстовая релевантность также учитывает: ,[object Object]
близость слов запроса
совпадение словоформ,[object Object]
опечатки: аднакласники = одноклассники
расширения: МГУ = Московский Государственный УниверситетДва пути компьютерной лингвистики: ,[object Object]
статистический: языковые модели,[object Object]

More Related Content

Similar to Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"

Project Management 2.0: AI Transformation
Project Management 2.0: AI TransformationProject Management 2.0: AI Transformation
Project Management 2.0: AI TransformationEduard Tyantov
 
Perminov_Оптимизация КЦ
Perminov_Оптимизация КЦPerminov_Оптимизация КЦ
Perminov_Оптимизация КЦYulia Sedova
 
01 информационный поиск
01 информационный поиск01 информационный поиск
01 информационный поискLidia Pivovarova
 
Fact Extraction (ideograph)
Fact Extraction (ideograph)Fact Extraction (ideograph)
Fact Extraction (ideograph)NLPseminar
 
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУYandex
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information ExtractionLidia Pivovarova
 
Контент инижиниринг - Лекция 1
Контент инижиниринг - Лекция 1Контент инижиниринг - Лекция 1
Контент инижиниринг - Лекция 1Elena Tikhomirova
 
информационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетинформационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетInno4ka2323
 
Ai lab
Ai labAi lab
Ai labaaa
 
Принципы работы поисковой системы
Принципы работы поисковой системыПринципы работы поисковой системы
Принципы работы поисковой системыNetpeak
 
Принципы работы поисковой системы
Принципы работы поисковой системыПринципы работы поисковой системы
Принципы работы поисковой системыNetpeak
 
Machine Learning as a Service
Machine Learning as a ServiceMachine Learning as a Service
Machine Learning as a Serviceelpisglobal
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текстаLidia Pivovarova
 
Задачи системного аналитика (конспект лекций Школы системного анализа)
Задачи системного аналитика (конспект лекций Школы системного анализа)Задачи системного аналитика (конспект лекций Школы системного анализа)
Задачи системного аналитика (конспект лекций Школы системного анализа)Anton Konstantinov
 
Аналитика SEO. Выпуск 3. Алгоритм ранжирования Яндекса
Аналитика SEO. Выпуск 3. Алгоритм ранжирования ЯндексаАналитика SEO. Выпуск 3. Алгоритм ранжирования Яндекса
Аналитика SEO. Выпуск 3. Алгоритм ранжирования ЯндексаДмитрий Севальнев
 
Сливинский
СливинскийСливинский
Сливинскийtop_expert
 
Plakhov urfu 2013
Plakhov urfu 2013Plakhov urfu 2013
Plakhov urfu 2013Yandex
 

Similar to Федор Романенко - "Ранжирование: от строчки кода до Матрикснета" (20)

Project Management 2.0: AI Transformation
Project Management 2.0: AI TransformationProject Management 2.0: AI Transformation
Project Management 2.0: AI Transformation
 
Perminov_Оптимизация КЦ
Perminov_Оптимизация КЦPerminov_Оптимизация КЦ
Perminov_Оптимизация КЦ
 
01 информационный поиск
01 информационный поиск01 информационный поиск
01 информационный поиск
 
Fact Extraction (ideograph)
Fact Extraction (ideograph)Fact Extraction (ideograph)
Fact Extraction (ideograph)
 
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
"Анализ неявных предпочтений пользователей" Михаил Агеев, Яндекс, МГУ
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information Extraction
 
Контент инижиниринг - Лекция 1
Контент инижиниринг - Лекция 1Контент инижиниринг - Лекция 1
Контент инижиниринг - Лекция 1
 
Evaluation in-nlp
Evaluation in-nlpEvaluation in-nlp
Evaluation in-nlp
 
информационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетинформационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернет
 
Ai lab
Ai labAi lab
Ai lab
 
Принципы работы поисковой системы
Принципы работы поисковой системыПринципы работы поисковой системы
Принципы работы поисковой системы
 
Принципы работы поисковой системы
Принципы работы поисковой системыПринципы работы поисковой системы
Принципы работы поисковой системы
 
Machine Learning as a Service
Machine Learning as a ServiceMachine Learning as a Service
Machine Learning as a Service
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
Задачи системного аналитика (конспект лекций Школы системного анализа)
Задачи системного аналитика (конспект лекций Школы системного анализа)Задачи системного аналитика (конспект лекций Школы системного анализа)
Задачи системного аналитика (конспект лекций Школы системного анализа)
 
Аналитика SEO. Выпуск 3. Алгоритм ранжирования Яндекса
Аналитика SEO. Выпуск 3. Алгоритм ранжирования ЯндексаАналитика SEO. Выпуск 3. Алгоритм ранжирования Яндекса
Аналитика SEO. Выпуск 3. Алгоритм ранжирования Яндекса
 
Комбинирование факторов для разрешения референции местоимений
Комбинирование факторов для разрешения референции местоименийКомбинирование факторов для разрешения референции местоимений
Комбинирование факторов для разрешения референции местоимений
 
Сливинский
СливинскийСливинский
Сливинский
 
Системы автоматического составления обзорных рефератов
Системы автоматического составления обзорных рефератовСистемы автоматического составления обзорных рефератов
Системы автоматического составления обзорных рефератов
 
Plakhov urfu 2013
Plakhov urfu 2013Plakhov urfu 2013
Plakhov urfu 2013
 

More from Rostislav Shorgin

Евгения Шкуратова - "Яндекс - это мы!"
Евгения Шкуратова - "Яндекс - это мы!"Евгения Шкуратова - "Яндекс - это мы!"
Евгения Шкуратова - "Яндекс - это мы!"Rostislav Shorgin
 
Константин Коломеец - "Выложи это в wiki"
Константин Коломеец - "Выложи это в wiki"Константин Коломеец - "Выложи это в wiki"
Константин Коломеец - "Выложи это в wiki"Rostislav Shorgin
 
Сергей Певцов - "Непременно нужно каждый день выпалывать баобабы..."
Сергей Певцов - "Непременно нужно каждый день выпалывать баобабы..."Сергей Певцов - "Непременно нужно каждый день выпалывать баобабы..."
Сергей Певцов - "Непременно нужно каждый день выпалывать баобабы..."Rostislav Shorgin
 
Татьяна Бахаревская - "Эксплуатация проектов"
Татьяна Бахаревская - "Эксплуатация проектов"Татьяна Бахаревская - "Эксплуатация проектов"
Татьяна Бахаревская - "Эксплуатация проектов"Rostislav Shorgin
 
Дмитрий Беляев - "Атака на клоны!"
Дмитрий Беляев - "Атака на клоны!"Дмитрий Беляев - "Атака на клоны!"
Дмитрий Беляев - "Атака на клоны!"Rostislav Shorgin
 
Виталий Титов - "Анализ запроса"
Виталий Титов - "Анализ запроса"Виталий Титов - "Анализ запроса"
Виталий Титов - "Анализ запроса"Rostislav Shorgin
 
Анатолий Орлов - "Как устроены поисковые системы"
Анатолий Орлов - "Как устроены поисковые системы"Анатолий Орлов - "Как устроены поисковые системы"
Анатолий Орлов - "Как устроены поисковые системы"Rostislav Shorgin
 
Илья Сегалович - "Поиск в жизни, Яндекс в поиске"
Илья Сегалович - "Поиск в жизни, Яндекс в поиске"Илья Сегалович - "Поиск в жизни, Яндекс в поиске"
Илья Сегалович - "Поиск в жизни, Яндекс в поиске"Rostislav Shorgin
 

More from Rostislav Shorgin (8)

Евгения Шкуратова - "Яндекс - это мы!"
Евгения Шкуратова - "Яндекс - это мы!"Евгения Шкуратова - "Яндекс - это мы!"
Евгения Шкуратова - "Яндекс - это мы!"
 
Константин Коломеец - "Выложи это в wiki"
Константин Коломеец - "Выложи это в wiki"Константин Коломеец - "Выложи это в wiki"
Константин Коломеец - "Выложи это в wiki"
 
Сергей Певцов - "Непременно нужно каждый день выпалывать баобабы..."
Сергей Певцов - "Непременно нужно каждый день выпалывать баобабы..."Сергей Певцов - "Непременно нужно каждый день выпалывать баобабы..."
Сергей Певцов - "Непременно нужно каждый день выпалывать баобабы..."
 
Татьяна Бахаревская - "Эксплуатация проектов"
Татьяна Бахаревская - "Эксплуатация проектов"Татьяна Бахаревская - "Эксплуатация проектов"
Татьяна Бахаревская - "Эксплуатация проектов"
 
Дмитрий Беляев - "Атака на клоны!"
Дмитрий Беляев - "Атака на клоны!"Дмитрий Беляев - "Атака на клоны!"
Дмитрий Беляев - "Атака на клоны!"
 
Виталий Титов - "Анализ запроса"
Виталий Титов - "Анализ запроса"Виталий Титов - "Анализ запроса"
Виталий Титов - "Анализ запроса"
 
Анатолий Орлов - "Как устроены поисковые системы"
Анатолий Орлов - "Как устроены поисковые системы"Анатолий Орлов - "Как устроены поисковые системы"
Анатолий Орлов - "Как устроены поисковые системы"
 
Илья Сегалович - "Поиск в жизни, Яндекс в поиске"
Илья Сегалович - "Поиск в жизни, Яндекс в поиске"Илья Сегалович - "Поиск в жизни, Яндекс в поиске"
Илья Сегалович - "Поиск в жизни, Яндекс в поиске"
 

Федор Романенко - "Ранжирование: от строчки кода до Матрикснета"