Tarcsi Ádám prezentációja

952 views

Published on

Miért nem érti a Google, hogy mit keresek című előadása az április 27-i Keresők című MeetOff-on hangzott el.

Published in: Technology, News & Politics
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
952
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
10
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Tarcsi Ádám prezentációja

  1. 1. Miért nem érti meg a Google, hogy mit is keresek? Tarcsi Ádám [email_address] , ELTE Informatikai Kar 2011. április 27. A keresők világa MeetOFF
  2. 2. Történet – röviden – 1. http://joaogeraldes.wordpress.com/2010/09/05/31-infographic-explores-internet-facts-figures-history-statistics/
  3. 3.
  4. 4. Google számokban Forrás: http//pingdom.com
  5. 5. Keresők globális piaci részesedése, 2011 április
  6. 6. Kereső trendek 2008.08-2011.04.
  7. 7. De nem mindenhol a Google az első: Kína
  8. 8. A Google Search Engine architektúrája Forrás: Brin, S. and Page, L. (1998) The Anatomy of a Large-Scale Hypertextual Web Search Engine . Seventh International World-Wide Web Conference (WWW 1998), April 14-18, 1998, Brisbane, Australia
  9. 9. Mi a baj a Google-lel? <ul><li>Mindent tud rólunk és gyakran mégsem ad jó találatot. </li></ul><ul><li>Nem segít abban sem, hogy a találatok között megtaláljam azt, amit keresek. </li></ul><ul><li>Néhány kérdés, amire nem tud válaszolni? </li></ul><ul><li>- Hol voltak ma földrengések? </li></ul><ul><li>- Milyen bor illik a kardhalhoz? </li></ul><ul><li>- Hol lesz ma este blues koncert? </li></ul>
  10. 10. A Web működése okozza a gondot! <ul><li>A HTML dokumentum leíró és nem információ leíró nyelv. </li></ul><ul><ul><li>Metaelemek - sovány vigasz </li></ul></ul><ul><ul><ul><li><meta name=&quot;description&quot; content=&quot;Az oldal a … témakörével foglalkozik.&quot;> </li></ul></ul></ul><ul><ul><ul><li><meta name=&quot;keywords&quot; content=&quot;kulcsszó1, kulcsszó2, kulcsszó3&quot;> </li></ul></ul></ul><ul><ul><li>Az oldalak közötti kapcsolatok egyirányúak. </li></ul></ul><ul><ul><li>A tartalom az embernek szól. </li></ul></ul><ul><ul><li>A HTML5 picit segít ezen </li></ul></ul><ul><li>De: az emberi nyelv sem formalizálható teljesen a matematika segítségével. </li></ul>
  11. 11. Az adatok a weboldalakba temetve
  12. 12. Számítógépnek is értenie kell Nagyszámú integráció - ad hoc - egyedi A kapott információk jellemzően túl nagy mennyiségűek áttekintéshez, automatikus keresésre és összekapcsolásra van szükség A weblapok ember számára „érthetőek”. A tartalom a számítógép számára „érthetetlen”. ? Alkalmazások milliói Search & Mash-up Engine 010 0 1 1 0 0 1101 10100 10 0010 01 101 101 01 110 1 10 1 10 0 1 1 0 1 0 1 0 0 1 1 0 1 1 1 10 0 1 101 0 1
  13. 13. Mi a „megértés”? <ul><li>Mit mond egy weblap egy Web robotnak? </li></ul><ul><ul><li>&quot; For more information visit <a href=“http://www.ex.org”> my company </a> Web site. . .” </li></ul></ul><ul><li>Ebből azt értik, hogy: </li></ul><ul><ul><li>&quot; blah blah blah blah blah <a href=“http://www.ex.org”> blah blah blah </a> blah blah. . .” </li></ul></ul>
  14. 14. Mit „ért meg” a Google? <ul><li>Azt érti meg, hogy: </li></ul><ul><ul><li>[page1] hivatkozik [page2]  page2 fontos </li></ul></ul><ul><li> Google rendezni tudja a találatokat! Az okosabb találatokhoz okosabb adatleírás kell. </li></ul>
  15. 15. Jobb kereső <ul><li>- Értelmezett keresésekből, értelmezett tárolt adatokból indul ki  szemantikus web </li></ul><ul><li>- Jobban értelmezhető találatok  vizualizált keresők, csoportokba, kategoriákba adott keresők </li></ul>
  16. 16. Szemantika, kapcsolat, … <ul><ul><li>Kapcsolat nem weblapok között, hanem tartalmak között. </li></ul></ul><ul><ul><li>Szemantika ~ jelentés </li></ul></ul><ul><ul><li> (meta)adatok szükségesek a leírásra </li></ul></ul>egér egér
  17. 17. Szemantikus web egér eszik fél tőle eszik ábrázol terminológia (szó v. kifejezés) a fogalomra…. van van van
  18. 18. A Szemantikus Web Semantic Web Egyszerűbb integráció - s ztenderdek - többcélú Hatékonyabb gép-ember, ember-ember együttműködés Még több alkalmazás Ember számára is érthetőbb Számítógép számára „érthető(bb)”, feldolgozható Semantic Mash-ups & Search
  19. 19. Részei <ul><ul><li>RDF (Resource Description Framework): erőforrások közötti kapcsolatrendszert (kijelentéseket) leíró nyelv. A kapcsolatrendszerből következtethetünk a jelentésre (szemantika). </li></ul></ul><ul><ul><li>RDFa: (RDF in attributes): RDF és a HTML egyfajta ötvözete http://www.w3.org/TR/xhtml-rdfa-primer/ </li></ul></ul><ul><ul><li>Microdata: tartalmak címkézésére http://dev.w3.org/html5/md/ </li></ul></ul><ul><ul><li>Microformats: egyedek (emberek, események, termékek, stb.) tulajdonságainak leírására http://microformats.org/ </li></ul></ul><ul><ul><li>OWL (Web Ontology Language): modellező nyelv, összefüggések leírására. Ontológia: definíciókból álló fogalomgyűjtemény </li></ul></ul><ul><ul><li>SPARQL: RDF lekérdező nyelv (~SQL) </li></ul></ul>
  20. 20. SZEMANTIKUS KERESÉS
  21. 21. Szemantikus keresés <ul><li>Seth Grimes a  keresés és a szemantika közös megközelítésének 11 módját  sorolja fel: </li></ul><ul><ul><li>kapcsolódó keresések felajánlása, keresett kifejezések javítása </li></ul></ul><ul><ul><li>definíciók, referenciák megjelenítése egy keresett kifejezésre </li></ul></ul><ul><ul><li>szemantikailag annotált eredménymegjelenítés, a releváns információk kiemelése </li></ul></ul><ul><ul><li>hosszabb szöveg alapú keresés </li></ul></ul><ul><ul><li>szemantikai/szintaktikai annotációval támogatott keresés </li></ul></ul><ul><ul><li>fogalmi keresés taxonómiák alkalmazásával </li></ul></ul><ul><ul><li>ontológia alapú keresés </li></ul></ul><ul><ul><li>szemantikus web technológiáinak kihasználása </li></ul></ul><ul><ul><li>előre definiált kategóriák szerinti eredménymegjelenítés </li></ul></ul><ul><ul><li>eredmények klaszterezett, csoportosított megjelenítése </li></ul></ul><ul><ul><li>természetes nyelvű kereső kérdések megválaszolása </li></ul></ul>http://kereses.blog.hu/2010/02/03/mitol_szemantikus_egy_kereso http://intelligent-enterprise.informationweek.com/channels/information_management/showArticle.jhtml;jsessionid=DG4QLODCL5X0TQE1GHPSKH4ATMY32JVN?articleID=222400100
  22. 22. Google: Microadatok, microformats, RDFa Forrás: http://www.google.com/support/webmasters/bin/answer.py?hl=hu&answer=173379 Tulajdonság Leírás name (fn) Kötelező. Az esemény neve. recipeType (tag) Az étel típusa: pl. előétel, főétel, desszert ... photo Az étel készítését ábrázoló fénykép. published A recept közzétételének ideje  ISO dátumformátumban . summary Az étel rövid összefoglaló leírása. review Az étel értékelése. Tartalmazhat beágyazott  értékelési információkat . prepTime A recept előkészítésének időtartama  ISO 8601 időtartam-formátumban . Az időtartam megadásához használhatja a min és max gyermekelemeket is. cookTime Az étel megfőzésének/-sütésének időtartama  ISO 8601 időtartam-formátumban . Az időtartam megadásához használhatja a min és max gyermekelemeket is. totalTime (duration) Az étel előkészítésének és megfőzésének/sütésének időtartama  ISO 8601 időtartam-formátumban . Az időtartam megadásához használhatja a min és max gyermekelemeket is. nutrition A recepttel kapcsolatos tápanyagadatok. A következő gyermekelemeket tartalmazhatja: servingSize, calories, fat, saturatedFat, unsaturatedFat, carbohydrates, sugar, fiber, protein, cholesterol. Ezek az elemek nem kifejezett részei a hRecipe mikroformátumnak, de a Google felismeri őket. instructions Az étel elkészítésének lépései. Tartalmazhatja az instruction gyermekelemet, amellyel az egyes lépéseket különböztetheti meg. yield A recept alapján elkészített étel mennyisége (pl. hány főre, hány adag stb.). ingredient A receptben használt hozzávaló. Tartalmazhatja a name (a hozzávalók neve) és az amount (mennyiség) gyermekelemeket. Ennek használatával azonosítsa az egyes hozzávalókat. author A recept szerzője. Tartalmazhat beágyazott,  személyre vonatkozó  információt.
  23. 23. Hol voltak ma földrengések?
  24. 24. WolframAlpha http://www.wolframalpha.com/input/?i=all+earthquakes+today
  25. 25. Szemantikus Web adatforrások <ul><li>http://richard.cyganiak.de/2007/10/lod/lod-datasets_2010-09-22.html </li></ul>Szemantikus web és a web 3.0
  26. 26. Szemantikus Wikipedia - DBpedia <ul><li>http://dbpedia.org/ </li></ul><ul><li>http://dbpedia.neofonie.de/browse/ </li></ul>
  27. 27. Melyek azok a legalább 50 kilométer hosszú folyók, melyek a Rajnába ömlenek?
  28. 28. Szemantikus kereső: evri <ul><li>http://www.evri.com/news/for?query=Budapest+sights </li></ul>
  29. 29. Vizuális kereső http://like.com
  30. 30. Google squared <ul><ul><li>http://www.google.com/squared </li></ul></ul>
  31. 31. Csoportosítás: Polymeta.hu
  32. 32. Néhány érdekes példa: <ul><ul><li>http://www.hakia.com/ </li></ul></ul><ul><ul><li>http://swoogle.umbc.edu/ </li></ul></ul><ul><ul><li>http://www.cognitionsearch.com/ </li></ul></ul><ul><ul><li>http://www.kartoo.com/ </li></ul></ul><ul><ul><li>http://www.quintura.com/ </li></ul></ul><ul><ul><li>http://iglue.com/ </li></ul></ul><ul><ul><li>http://szorcs.hu/ </li></ul></ul><ul><ul><li>http://miner.hu/ </li></ul></ul>
  33. 33. Irodalom <ul><ul><li>Szemantikus Web technikai leírás: http://www.sti-innsbruck.at/teaching/curriculum/semantic-web/ </li></ul></ul><ul><ul><li>These slides are partially based on “Semantic Web An Introduction” by Emanuele Della Valle http://applied-semantic-web.org/slides/2010/03/01_intro.ppt </li></ul></ul><ul><ul><li>Youtube: Did you know? http://www.youtube.com/results?search_query=did+you+know&aq=f </li></ul></ul><ul><ul><li>Bor ajánló: http://onto.rpi.edu/wiki/wine/index.php/Main_Page </li></ul></ul><ul><ul><li>Google szemantikus megoldásai a Webmastertools-ban: http://www.google.com/support/webmasters/bin/topic.py?topic=21997 </li></ul></ul>

×