Semantic Search Technology‘De belofte van het semantisch web (web 3.0)’                            Hannah Verhoeff
Semantiek achterhalen van woorden en daar de advertentie opafstemmen.“Is de jager op dreef?” zei de student diergeneeskund...
Entiteiten vaststellen in een document en meegeven in de html:mensen (‘edwardnorton’), gebeurtenissen, bedrijven, landen, ...
Semantiek achterhalen:                                     Annotaties in de vorm van                                     R...
Beperkte schaalbaarheid:Afhankelijk van mensenwerk – inconsistente interpretatieArbeidsintensiefAfhankelijk van de bronsys...
Explosieve groei van informatie – de komst van ‘Big Data’Het wordt lastiger om informatie te beheren en structuur/ beteken...
Digitale (web)teksten                                                                           geautomatiseerd           ...
… een kijkje achter de schermenOpen Calais van Reuters is een platform dat pagina’s via een API naarsemantische pagina’s v...
Holding promises of Semantic Search                            Bedreiging voor SEO, ondanks succes dankzij                ...
Zoek op een persoon en vind zijn/ haar geboorteplaats, -datum, broers en zussen, etc.                   Geen links maar   ...
Human resource
Semantic Search in te zetten binnen de organisatieCognito Technology
Sinequa
Sophia Search   Attivio
…‘De belofte van het semantisch web (web 3.0)’
20120829 Presentatie over Semantic Search
20120829 Presentatie over Semantic Search
Upcoming SlideShare
Loading in …5
×

20120829 Presentatie over Semantic Search

417 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
417
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

20120829 Presentatie over Semantic Search

  1. 1. Semantic Search Technology‘De belofte van het semantisch web (web 3.0)’ Hannah Verhoeff
  2. 2. Semantiek achterhalen van woorden en daar de advertentie opafstemmen.“Is de jager op dreef?” zei de student diergeneeskunde“Is De Jager op dreef?” zei de parlementair journalistSyntax versus semantiek
  3. 3. Entiteiten vaststellen in een document en meegeven in de html:mensen (‘edwardnorton’), gebeurtenissen, bedrijven, landen, sport, eten (‘nasi’)etc.Ontologie is opgebouwd uit entiteiten (annotaties). De tekst: “Mark Rutte is Minister Of The Netherlands” zou je kunnen vervangen door het volgende stukje RDF/XML: <rdf:Description rdf: about=#Mark Rutte”> <isMinisterOf rdf:resource=”#The Netherlands “/> </rdf:Description>Bepaal de interpretatie van data door te begrijpen wat debedoeling is van de zoeker en de contextuele betekenis van determen door het web (associatief slim).
  4. 4. Semantiek achterhalen: Annotaties in de vorm van RDF en Microformats – vanuit de documenten Automatisch herkennen van entiteiten – vanuit de zoeker Binnen de organisatie is een ontologie het best bruikbaar voor specifieke domeinen. Mogelijk te combineren met externe linked open data
  5. 5. Beperkte schaalbaarheid:Afhankelijk van mensenwerk – inconsistente interpretatieArbeidsintensiefAfhankelijk van de bronsystemen
  6. 6. Explosieve groei van informatie – de komst van ‘Big Data’Het wordt lastiger om informatie te beheren en structuur/ betekeniste achterhalen in de diversiteit en heterogeniteit van bronnen;Zoeken en vinden is een probleem, maar daarbovenop de gemistekansen door onontgonnen informatie.[T]here are known knowns; there are things we know Database Searchthat we know.There are known unknowns; that is to say there are Enterprise Searchthings that, we now know we dont know.But there are also unknown unknowns – there are Semantic Searchthings we do not know, we dont know. ” —United States Secretary of Defense, Donald Rumsfeld
  7. 7. Digitale (web)teksten geautomatiseerd samenvatten, interpreteren en anonimiseren. • Sentence Boundary Detector • Parser • Namefinder • Pattern Recognizer • PostTagger • Role Designation • Associative network • Tag cloud • Topic Extraction• Herleiden van de betekenis van entiteiten uit de context van een pagina;• Natuurlijk taal applicaties (NLP)  In grote hoeveelheden data zonder dat hier mensenwerk bij komt kijken. Alleen mensenwerk bij toevoegen content en ontwikkelen techniek.
  8. 8. … een kijkje achter de schermenOpen Calais van Reuters is een platform dat pagina’s via een API naarsemantische pagina’s verrijkt. Hierbij put Reuters uit haar databasevan personen, plaatsen en locaties. http://viewer.opencalais.com/PlatypusWiki is een pakket waarmee semantische wiki’s gemaaktkunnen worden. Semantic wiki is een upgrade van de ‘Wikipedia’Mediawiki software om semantische pagina’s te bouwen.
  9. 9. Holding promises of Semantic Search Bedreiging voor SEO, ondanks succes dankzij Semanic contextualizationSuperieur businessintelligence – analysegestructureerde/ongestructureerde content
  10. 10. Zoek op een persoon en vind zijn/ haar geboorteplaats, -datum, broers en zussen, etc. Geen links maar antwoorden!
  11. 11. Human resource
  12. 12. Semantic Search in te zetten binnen de organisatieCognito Technology
  13. 13. Sinequa
  14. 14. Sophia Search Attivio
  15. 15. …‘De belofte van het semantisch web (web 3.0)’

×