Your SlideShare is downloading. ×
0
Академические инициативы Академические инициативы        Яндекса           д      Павел Браславский      Павел Браславский
Академические инициативы    Академические инициативы• Школа Анализа Данных• Семинары Яндекса  Семинары Яндекса• Интернет‐м...
Yandex School of Data Analysis  two‐year master program, http://shad.yandex.ru                                            ...
Teachers           4
Scientific seminars                   Scientific seminarsMonthly seminars on Data analysis & Monthly seminars on Data anal...
IMAT 2009                     IMAT 2009•   Learning to rank     L     i         k•   245 features for query‐document pairs...
7
IMAT 2010                  IMAT 2010• Traffic congestion prediction     ffi         i      di i• (Rough) data:  (    g )  ...
Modified graph of streetsModified graph of streets                            9
IMAT 2010 Data                  IMAT 2010 Data• G h  Graph: vertices (139 241/33 029) and edges (206             ti    (13...
11
ИМАТ 2011              ИМАТ 2011Старт конкурса – февраль 2011Задача интересная, победителю – приз ☺Задача интересная, побе...
ROMIP•   TREC‐like Russian initiative•   Started 2002 •                        g    Several text and image collections•   ...
ROMIP largest text collections ROMIP largest text collections                                                   Evaluated ...
Image collections            Image collectionsPhoto collection: 20 000 images from FlickrPhoto collection: 20 000 images f...
RuSSIR• Yekaterinburg, 5‐12 September 2007  Yekaterinburg,  5 12 September 2007  http://romip.ru/russir2007• Taganrog 1 5 ...
RuSSIR•   Put RuSSIR pic here •   Annual event     Annual event•   100+ participants•   4th RuSSIR: Voronezh 13‐18 Septemb...
Информационный поиск по‐русскиИнформационный поиск по русски Оригинальная английская версия: http://informationretrieval.o...
Павел БраславскийПавел Браславскийpb@yandex‐team.ru                    19
Upcoming SlideShare
Loading in...5
×

20101219 yandex academic_programs_braslavski

486

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
486
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "20101219 yandex academic_programs_braslavski"

  1. 1. Академические инициативы Академические инициативы Яндекса д Павел Браславский Павел Браславский
  2. 2. Академические инициативы Академические инициативы• Школа Анализа Данных• Семинары Яндекса Семинары Яндекса• Интернет‐математика• РОМИП• Школа по информационному поиске  Школа по информационному поиске (RuSSIR)• Книга «Введение в информационный  поиск» 2
  3. 3. Yandex School of Data Analysis two‐year master program, http://shad.yandex.ru 3
  4. 4. Teachers 4
  5. 5. Scientific seminars Scientific seminarsMonthly seminars on Data analysis & Monthly seminars on Data analysis &information retrievalOrganized by Microsoft Research + Microsoft Research +Яндекс http://company.yandex.ru/public/seminars/schedule/ 5
  6. 6. IMAT 2009 IMAT 2009• Learning to rank  L i k• 245 features for query‐document pairs• Graded relevance judgments (0..4)• Pure numeric data (i.e. no original queries, documents  or feature semantics) f )• Learning set: 97 290 feature vectors (9 124 queries)• Test set: 115 643 vectors (21 103 – public evaluation;  94 540 – final evaluation)• Evaluation measure: DCG• http://imat2009.yandex.ru 6
  7. 7. 7
  8. 8. IMAT 2010 IMAT 2010• Traffic congestion prediction ffi i di i• (Rough) data: ( g ) – Modified graph of Moscow streets  – Observed traffic speed 4‐10 pm (4‐min intervals) Observed traffic speed 4 10 pm (4 min intervals)  for 30 subsequent days + 4‐6 pm on the 31st day• Task: predict traffic speed 6‐10 pm of the 31st Task: predict traffic speed 6‐10 pm of the 31 day• public/final evaluation bli /fi l l ti• http://imat2010.yandex.ru 8
  9. 9. Modified graph of streetsModified graph of streets 9
  10. 10. IMAT 2010 Data IMAT 2010 Data• G h Graph: vertices (139 241/33 029) and edges (206  ti (139 241/33 029) d d (206 260/86 249) – <id_vertex> <id_g p group> – <id_edge> <id_edge_group> <start_vert> <end_vert> – <id_edge_group> <length> <avg_speed>• Observations (learning set 29 226 208 lines) Observations (learning set, 29 226 208 lines) – <id_edge_group> <day> <time> <speed>• Task (691 641 lines) ( ) – <id_edge_group> <day> <time> ??• Evaluation 10
  11. 11. 11
  12. 12. ИМАТ 2011 ИМАТ 2011Старт конкурса – февраль 2011Задача интересная, победителю – приз ☺Задача интересная, победителю  приз ☺ 12
  13. 13. ROMIP• TREC‐like Russian initiative• Started 2002 • g Several text and image collections• 10‐15 participants per year (total 50+) • Academia and industry, students support• ~3 000 man‐hours of evaluation (2009)• Remote participation + live meeting Remote participation + live meeting• Collections are freely available• Popular testbed for IR research in Russia 13
  14. 14. ROMIP largest text collections ROMIP largest text collections Evaluated within  SizeCollection Documents Topics ad‐hoc search  (compressed) track ~300 000 Legal 2 Gb 14 794 220 By.Web By Web 1 524 676 1 524 676 8 Gb 8 Gb ~ 60 000 60 000 1 500+ 1 500+ KM.RU 3 010 455 13 Gb ~ 60 000 ~250 14
  15. 15. Image collections Image collectionsPhoto collection: 20 000 images from FlickrPhoto collection: 20 000 images from FlickrDups collection: 15 hrs video  37 800 frames 15 15
  16. 16. RuSSIR• Yekaterinburg, 5‐12 September 2007 Yekaterinburg,  5 12 September 2007 http://romip.ru/russir2007• Taganrog 1 5 September 2008 Taganrog, 1‐5 September 2008 http://romip.ru/russir2008/• Petrozavodsk, 11‐16 September 2009 http://romip.ru/russir2009/• Voronezh, 13‐18 September 2010 http://romip.ru/russir2010/• Saint Petersburg, 15‐19 August 2011 http://romip.ru/edbt‐russir2011/ p p 16
  17. 17. RuSSIR• Put RuSSIR pic here • Annual event  Annual event• 100+ participants• 4th RuSSIR: Voronezh 13‐18 September• http://romip.ru/russir2010/ http://romip ru/russir2010/ 17
  18. 18. Информационный поиск по‐русскиИнформационный поиск по русски Оригинальная английская версия: http://informationretrieval.org 18
  19. 19. Павел БраславскийПавел Браславскийpb@yandex‐team.ru 19
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×