Retour d'expérience Reador sur le #WebSem sophiaconf2014

1,186 views

Published on

Published in: Internet
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,186
On SlideShare
0
From Embeds
0
Number of Embeds
57
Actions
Shares
0
Downloads
8
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

Retour d'expérience Reador sur le #WebSem sophiaconf2014

  1. 1. Nous avons produit plus d'informations en 2012 que pendant 5000 ans (4 millions de Tera octets)
  2. 2. INFOBÉSITÉ
  3. 3. Un outil de filtrage automatique de news, puissant et simple pour organiser, à faible coût, votre veille sur       READOR
  4. 4. READOR :PROCESSUSDEVEILLE      EXTRACTION DES DONNEES FILTRAGE SEMANTIQUE  CREATION DE VOS JOURNAUX GENERATION DE TAGS 
  5. 5. RETOURD'EXPERIENCE FONCTIONNEL “Où est l'utilité des technos. sémantiques ? ” TECHNIQUE “ Est-ce que ça marche bien ? ”
  6. 6. RETOURD'EXPERIENCE FONCTIONNEL “Où est l'utilité des technos. sémantiques ? ” TECHNIQUE “ Est-ce que ça marche bien ? ”
  7. 7. RETOURD'EXPERIENCEFONCTIONNEL ●Suppression du bruit plus poussée – Basé sur du TAL pour pour effectuer la reconnaissance des termes importants
  8. 8. EXEMPLEDERECHERCHE#BIGDATA
  9. 9. EXEMPLEDERECHERCHE#BIGDATA
  10. 10. EXEMPLEDERECHERCHE#BIGDATA
  11. 11. EXEMPLEDERECHERCHE#BIGDATA
  12. 12. EXEMPLEDERECHERCHE#BIGDATA
  13. 13. EXEMPLEDERECHERCHE#BIGDATA
  14. 14. EXEMPLEDERECHERCHE#BIGDATA
  15. 15. EXEMPLEDERECHERCHE#BIGDATA
  16. 16. EXEMPLEDERECHERCHE#BIGDATA
  17. 17. RETOURD'EXPERIENCEFONCTIONNEL ●Suppression du bruit plus poussée – Basé sur du TAL pour pour effectuer la reconnaissance des termes importants ●Enrichissement des tweets ●Lien avec d'autres bases de connaissances – Grâce à Wikipedia/DBpedia – Inférences
  18. 18. EXEMPLEDAVIDCAMERON
  19. 19. EXEMPLEDAVIDCAMERON
  20. 20. EXEMPLEDAVIDCAMERON
  21. 21. EXEMPLEDAVIDCAMERON
  22. 22. EXEMPLEDAVIDCAMERON
  23. 23. EXEMPLEDAVIDCAMERON
  24. 24. RETOURD'EXPERIENCEFONCTIONNEL ●Suppression du bruit plus poussée – Basé sur du TAL pour pour effectuer la reconnaissance des termes importants ●Enrichissement des tweets ●Lien avec d'autres bases de connaissances – Grâce à Wikipedia/DBpedia – Inférences
  25. 25. Langagesdeprogrammation INFERENCES
  26. 26. Langagesdeprogrammation INFERENCES programmationdeLangages Web 2.0
  27. 27. Langagesdeprogrammation Langages Web 3.0 Langages de programmation Java Python Rails INFERENCES DBpedia programmationdeLangages Web 2.0
  28. 28. IncubateurPaca-Est EstPacaIncubateur Web 2.0 Web 3.0 Incubateur Paca Est INFERENCES Accompagne Entreprises France Labs Azameo Reador.NET Baseinterne Sophia Antipolis Biot Valbonne DBpedia Lieu Toulon Nice
  29. 29. INFERENCES SURREADOR
  30. 30. “ Où est l'utilité des technos. sémantiques ? ”
  31. 31. “Oùestl'utilitédestechnos.sémantiques ? ” STRUCTURER La donnée & ENRICHIR “ Où est l'utilité des technos. sémantiques ? ”
  32. 32. RETOURD'EXPERIENCE FONCTIONNEL “Où est l'utilité des technos. sémantiques ? ” TECHNIQUE “ Est-ce que ça marche bien ? ”
  33. 33. COTÉDATA  Déjà 22 millions de données traitées  Plus de 300 millions de triplets  4 serveurs : 150 Go de RAM et 20 cœurs
  34. 34. SGBDSÉMANTIQUE :VIRTUOSO ●Actuellement en prod. chez Wikipedia ●Quasiment la totalité chargée en RAM => 100Go alloués ●De nombreuses journées de config des options... ●Encore en dev...
  35. 35. GÉNÉRATIONDESREQUÊTES PREFIX RSS: <http://purl.org/rss/1.0/> SELECT * WHERE{ SELECT DISTINCT(?concept),?pubDateTime, CONCAT( ?filter272,?filter273,?filter274 ) AS ?filtersVals FROM <http://zone-project.org/datas/items> FROM <http://zone-project.org/datas/sources> WHERE { ?concept RDF:type RSS:item. { ?concept <http://zone-project.org/model/plugins/twitter#hashtag> "#bigdata".} ?concept ?filter275 <http://dbpedia.org/resource/Machine_learning>. ?concept ?filter276 <http://dbpedia.org/resource/Python_(programming_language)>. OPTIONAL { ?concept ?filter272 <http://dbpedia.org/resource/Apache_Hadoop>.} OPTIONAL { ?concept ?filter273 <http://dbpedia.org/resource/Java(programming_language)>. } OPTIONAL { ?concept ?filter277 <http://dbpedia.org/resource/International_Business_Machines>}. FILTER (!bound(?filter277)) ?concept RSS:pubDateTime ?pubDateTime. } } ORDER BY DESC(?pubDateTime) LIMIT 10 OFFSET 0
  36. 36. RETOURD'EXPERIENCE FONCTIONNEL “Où est l'utilité des technos. sémantiques ? ” TECHNIQUE “ Est-ce que ça marche bien ? ”
  37. 37. christophe@reador.net 07 62 59 64 17 @descl3 @readornet

×