Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Фишки из патентов Google

7,996 views

Published on

Обзор нескольких патентов Google, о которых вы могли не знать. Презентация с конференции #GuruConf

Published in: Education

Фишки из патентов Google

  1. 1. Фишки из патентов Google О которых вы могли не знать Сергей Кокшаров, 2017
  2. 2. Семантическая близость слов важнее визуальной ln2.in/pat_216
  3. 3. "Масса" и "орбита" семантически одинаково удалены от "сатурна".
  4. 4. Расстояния между словами пересчитываются, в зависимости от семантической разметки, а не удаленности в файле
  5. 5. Google может сам размечать ваши документы • Списки могут создаваться таблицами <table>, <tr> • Могут создаваться блоковыми элементами <div> • Тегами параграфа <p> • Просто с помощью разделителей строки <br> • Page analyzer component анализирует структуру документа, и не только списки
  6. 6. Используйте правильную разметку, не спамьте ключами каждый элемент списка, учитывайте пересчет расстояний.
  7. 7. Богатые семантикой страницы имеют дополнительный бонус ln2.in/pat_409
  8. 8. Узнать количество мест в ТОПе можно, анализируя и сравнивая частотные словари
  9. 9. ln2.in/pat_225 Вес ссылок зависит от вероятности перехода по ним
  10. 10. Учитываемые характеристики ссылок • Размер и цвет текста ссылки • Позиция в документе (списки, текст, до или после первого экрана 800х600, боковая панель, футер...) • Позиция в списке (если ссылка в списке) • Количество слов в анкоре, их коммерческость • Тип ссылки (текст, картинка), соотношение сторон • Слова, окружающие ссылку • Внутренняя или внешняя, тематический кластер
  11. 11. Учитываемые характеристики донора • Количество ссылок • Присутствие слов в тексте и заголовках • Тематический кластер документа • Степень соответствия тематических кластеров донора и ссылки
  12. 12. Учитываемые поведение пользователей • Клики по ссылкам, вводимые адреса, заполнения форм • Язык и интересы пользователя • Используемые ключевые слова • Частота клика по ссылке • Как часто ссылки не кликаются при выборе других • Как часто ни одна ссылка в документе не кликается • ...
  13. 13. nofollow не учитывается 
 в этой модели
  14. 14. Для попадания в блок ответов используйте natural language answer ln2.in/pat_354
  15. 15. Особенности блок-ответов • Показываются только по intent- или factual- queries • Натуральный язык запроса является intent-query • Имеется ограниченный набор шаблонов, и блек-листы, созданные модераторами • Основной ключ должен входить в заголовок • Для тематической классификации используется анализ слов в релевантных пассажах (LSI-фраз) • Для ряда тематик необходимы списки • Ответ выбирается только из natural language
  16. 16. Шаблон "Как делать {что-то}"
  17. 17. Блеклист пока работает не для всех языков :)
  18. 18. Сравните, кто из них дает естественный ответ
  19. 19. Можно использовать в свою пользу
  20. 20. Хотите еще в топ по запросу "жидкие обои"? :) или "венецианская штукатурка"... Контекст Изображения Блок ответов Ютуб
  21. 21. ln2.in/pat_722 Рейтинг документа меняется не сразу после внесения изменений Песочница
  22. 22. Определить старый ранк документа Определить целевой ранк Выбрать функцию перехода Определить ранк документа, исходя из функции перехода Присвоить ранк
  23. 23. Для чего? • Борьба со спамными техниками • Дает не тот эффект, который ожидал оптимизатор (вводит в заблуждение) • Позволяет выявлять документы и сайты, продвигающиеся спамом
  24. 24. Окончательно рейтинг стабализируется через 70 дней после обнаружения изменений Функция перехода с задержкой по времени
  25. 25. 10% изменение рейтинга дает обратный эффект 20 дней отрицательного рейтинга
  26. 26. Особенности • Функция перехода выбирается из множества: с задержкой по времени, отрицательная, случайная. • Модификация ранка на 10% включит отрицательную функцию перехода. • Идентификация спама происходит во время действия функции перехода. • Изменение сигналов выше порогового значения приводят к фильтрации спама (обнулении рейтинга). • Функция перехода может устанавливаться не только для документа, но и для всего сервера.
  27. 27. Анализируемые спам-техники • Переспам текста ключевыми словами • Невидимый текст • Мелкий шрифт • Редиректы (подмена) • Переспам мета-тегов • Манипуляции ссылками • С 2010 года список пополнился
  28. 28. Как искать патенты • patents.google.com • www.seobythesea.com • http://patents.ic.gc.ca/opic-cipo/cpd/eng/search/ advanced.html • другие поисковики патентов
  29. 29. Пример поиска патентов Google через их поисковый сервис
  30. 30. Кокшаров Сергей https://telegram.me/ devakatalk 
 https://fb.com/sevasjack https://vk.com/devaka

×