• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
20101219 yandex academic_programs_braslavski
 

20101219 yandex academic_programs_braslavski

on

  • 568 views

 

Statistics

Views

Total Views
568
Views on SlideShare
496
Embed Views
72

Actions

Likes
0
Downloads
2
Comments
0

3 Embeds 72

http://logic.pdmi.ras.ru 50
http://compsciclub.ru 15
http://www.compsciclub.ru 7

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    20101219 yandex academic_programs_braslavski 20101219 yandex academic_programs_braslavski Presentation Transcript

    • Академические инициативы Академические инициативы Яндекса д Павел Браславский Павел Браславский
    • Академические инициативы Академические инициативы• Школа Анализа Данных• Семинары Яндекса Семинары Яндекса• Интернет‐математика• РОМИП• Школа по информационному поиске  Школа по информационному поиске (RuSSIR)• Книга «Введение в информационный  поиск» 2
    • Yandex School of Data Analysis two‐year master program, http://shad.yandex.ru 3
    • Teachers 4
    • Scientific seminars Scientific seminarsMonthly seminars on Data analysis & Monthly seminars on Data analysis &information retrievalOrganized by Microsoft Research + Microsoft Research +Яндекс http://company.yandex.ru/public/seminars/schedule/ 5
    • IMAT 2009 IMAT 2009• Learning to rank  L i k• 245 features for query‐document pairs• Graded relevance judgments (0..4)• Pure numeric data (i.e. no original queries, documents  or feature semantics) f )• Learning set: 97 290 feature vectors (9 124 queries)• Test set: 115 643 vectors (21 103 – public evaluation;  94 540 – final evaluation)• Evaluation measure: DCG• http://imat2009.yandex.ru 6
    • 7
    • IMAT 2010 IMAT 2010• Traffic congestion prediction ffi i di i• (Rough) data: ( g ) – Modified graph of Moscow streets  – Observed traffic speed 4‐10 pm (4‐min intervals) Observed traffic speed 4 10 pm (4 min intervals)  for 30 subsequent days + 4‐6 pm on the 31st day• Task: predict traffic speed 6‐10 pm of the 31st Task: predict traffic speed 6‐10 pm of the 31 day• public/final evaluation bli /fi l l ti• http://imat2010.yandex.ru 8
    • Modified graph of streetsModified graph of streets 9
    • IMAT 2010 Data IMAT 2010 Data• G h Graph: vertices (139 241/33 029) and edges (206  ti (139 241/33 029) d d (206 260/86 249) – <id_vertex> <id_g p group> – <id_edge> <id_edge_group> <start_vert> <end_vert> – <id_edge_group> <length> <avg_speed>• Observations (learning set 29 226 208 lines) Observations (learning set, 29 226 208 lines) – <id_edge_group> <day> <time> <speed>• Task (691 641 lines) ( ) – <id_edge_group> <day> <time> ??• Evaluation 10
    • 11
    • ИМАТ 2011 ИМАТ 2011Старт конкурса – февраль 2011Задача интересная, победителю – приз ☺Задача интересная, победителю  приз ☺ 12
    • ROMIP• TREC‐like Russian initiative• Started 2002 • g Several text and image collections• 10‐15 participants per year (total 50+) • Academia and industry, students support• ~3 000 man‐hours of evaluation (2009)• Remote participation + live meeting Remote participation + live meeting• Collections are freely available• Popular testbed for IR research in Russia 13
    • ROMIP largest text collections ROMIP largest text collections Evaluated within  SizeCollection Documents Topics ad‐hoc search  (compressed) track ~300 000 Legal 2 Gb 14 794 220 By.Web By Web 1 524 676 1 524 676 8 Gb 8 Gb ~ 60 000 60 000 1 500+ 1 500+ KM.RU 3 010 455 13 Gb ~ 60 000 ~250 14
    • Image collections Image collectionsPhoto collection: 20 000 images from FlickrPhoto collection: 20 000 images from FlickrDups collection: 15 hrs video  37 800 frames 15 15
    • RuSSIR• Yekaterinburg, 5‐12 September 2007 Yekaterinburg,  5 12 September 2007 http://romip.ru/russir2007• Taganrog 1 5 September 2008 Taganrog, 1‐5 September 2008 http://romip.ru/russir2008/• Petrozavodsk, 11‐16 September 2009 http://romip.ru/russir2009/• Voronezh, 13‐18 September 2010 http://romip.ru/russir2010/• Saint Petersburg, 15‐19 August 2011 http://romip.ru/edbt‐russir2011/ p p 16
    • RuSSIR• Put RuSSIR pic here • Annual event  Annual event• 100+ participants• 4th RuSSIR: Voronezh 13‐18 September• http://romip.ru/russir2010/ http://romip ru/russir2010/ 17
    • Информационный поиск по‐русскиИнформационный поиск по русски Оригинальная английская версия: http://informationretrieval.org 18
    • Павел БраславскийПавел Браславскийpb@yandex‐team.ru 19