SlideShare a Scribd company logo
1 of 18
Download to read offline
Real-Time Media
Monitoring & Analyse
Ongestructureerde Data Omzetten naar Kennis
Auxipress
 Press Clipping
 Media Monitoring
 Wat zegt de media over mijn bedrijf
Use Case : Tekst naar Kennis
Business Case
Online
Sociale
Media
AutomatischAnalyse
Sector +
Nederland,
Frankrijk
Print
Pers
ManueelClipping
Bedrijf
België
+
++
+
Gebruikte data
 Volledige Belgische Media
 Kranten (print en online) worden dagelijks ‘s morgens digitaal ontvangen
 Artikels worden digitaal geknipt en voorzien van meta data
 Weekbladen
 Radio/TV
 Abonnement op Facebook/Twitter gegevens
 Extra Media on-demand
 Politieke partij programma’s
 Vakbladen
 Dossiers, ....
 Frankrijk/Nederland
Bijna uitsluitend ongestructureerde data
 Tekst
 XML, OCR, Transcripts
 8.000 artikels / dag
 Nederlands/Frans/Engels
 MetaData
 Publicatie Datum
 Bron
 Taal
Configuratie
 Hardware : 64 Cores / 64 GB Memory / 6 Terrabyte HD
 InterSystems Caché platform
 Caché Database voor opslag van alle artikels en tabellen (momenteel 1,4 Terrabyte)
 iKnow NLP voor Detecteren van Concepten (multi-woord groepen) uit teksten in 3 talen
 (custom) iFind voor Matchen van Dictionary
 DeepSee BI voor visualisatie en analyse
Dictionary
 5 niveaus
 > 12,000 categorieën
 > 85,000 concepten
...
Ondernemingen &
Consumptie
Economie & Financiën
Economie & Budget Financiën & Verzekeringen Buitenlandse Handel
Buitenlandse Handel Wisselkoers en Valuta Vrijhandelsakkoorden
UNCTAD ACTA GATT CETA NAFTA
ALENA NAFTA
Noord-Amerikaanse
Vrijhandelsovereenkomst
North Amarican Free Trade
Agreement
...
Bankensector Fiscaliteit
Werk, Pensioen, Sociale
overleg
Onderwijs, Opleiding &
Wetenschap
Aanpak
 Automatische import van media via .XML
 Artikels worden via InterSystems iKnow NLP naar Concepten omgezet
 Concepten worden gematcht met een Dictionary
 Elk artikel wordt gecategoriseerd
 Nieuwe Relevante Concepten worden gedecteerd om in de Dictionary te worden bijgevoegd
• Xml tags
• Split
articles
Input
• UTF8
• Html
• Custom
Clean
• Concepts
• Concept-
Relation-
Concept
NLP
• Match
Dictionary
• Categorize
Match
Dictionary Matching
Challenges
 Constante bijsturing nodig (learn-as-you-go)
 1 Sales kan meer bijkomende features verzinnen dan 100 IT’ers kunnen oplossen
 Altijd grotere volumes data
 Kleine details worden grote problemen
 Adhoc klanten queries
 Te groot voor Excel
 Aanpassingen in structuur van dictionary of herrekenen van oude artikels op nieuwe
concepten (200 miljoen zinnen)
Taal
Categorisatie en Taal
=
Arts (NL)Arts (FR)
Categorisatie op Woordniveau
Carrefour de l’Arbre
Carrefour
carrefour
Toekomstvisie
 Standaard dagelijkse media aanbod uitbreiden naar:
 Nederland (vanaf 1 januari 2019)
 Frankrijk
 Dictionary uitbreiden naar Geo, Merken, Sentiment, Temporaliteit
 Nog grotere datavolumes
 Online platform voor klanten
Toekomstvisie
 Migratie naar InterSystems Iris Data Platform voor
 Sharding van data
 Bijkomende analytics
Conclusie
 Tekst omzetten naar Kennis is mogelijk
 NLP brengt Tekst naar Concept niveau
 Concepten worden door Dictionary vertaald naar Categorieën/Thema’s
 BI / Queries op Categorieën
Vragen ?
Danny Wijnschenk
Winfo bvba
danny@winfo.be

More Related Content

Similar to Auxipress - Real-time Media Monitoring en Analyse door ongestructureerde data om te zetten naar kennis

DocuProces Workshop
DocuProces WorkshopDocuProces Workshop
DocuProces WorkshopRob Besse
 
Akeneo: the foundation of Online expansion at Obelink9
Akeneo: the foundation of Online expansion at Obelink9Akeneo: the foundation of Online expansion at Obelink9
Akeneo: the foundation of Online expansion at Obelink9webwinkelvakdag
 
MarketeerCongres 2008: HP - Jeffrey Raskeyn
MarketeerCongres 2008: HP - Jeffrey RaskeynMarketeerCongres 2008: HP - Jeffrey Raskeyn
MarketeerCongres 2008: HP - Jeffrey RaskeynMarketeerCongres
 
Teezir eCare 3.0
Teezir eCare 3.0Teezir eCare 3.0
Teezir eCare 3.0Teezir
 
Bezit of toegang? Hoe technologie de wereld verandert
Bezit of toegang? Hoe technologie de wereld verandertBezit of toegang? Hoe technologie de wereld verandert
Bezit of toegang? Hoe technologie de wereld verandertFred Wiltenburg
 
Presentatie Web3 / Interactieve Media Group
Presentatie Web3 / Interactieve Media GroupPresentatie Web3 / Interactieve Media Group
Presentatie Web3 / Interactieve Media GroupLars Smeets
 
RFID-infomarkt: Presentatie Kno-Tech
RFID-infomarkt: Presentatie Kno-TechRFID-infomarkt: Presentatie Kno-Tech
RFID-infomarkt: Presentatie Kno-Techpslb pslb
 
Workshop persberichten schrijven
Workshop persberichten schrijvenWorkshop persberichten schrijven
Workshop persberichten schrijvenAlexander Overdiep
 
Sessie Metadata Informatie aan Zee 2015
Sessie Metadata Informatie aan Zee 2015Sessie Metadata Informatie aan Zee 2015
Sessie Metadata Informatie aan Zee 2015Sigrid Vlaemynck
 
Admix - Mathe Moons presntatie #DMSummit 2011
Admix - Mathe Moons presntatie #DMSummit 2011Admix - Mathe Moons presntatie #DMSummit 2011
Admix - Mathe Moons presntatie #DMSummit 2011Copernica BV
 
TST-Centrale
TST-CentraleTST-Centrale
TST-CentraleINL
 
Presentatie Digitale Mediatheek 02072008
Presentatie Digitale Mediatheek 02072008Presentatie Digitale Mediatheek 02072008
Presentatie Digitale Mediatheek 02072008Danielle Quadakkers
 
Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Maarten Verwaest
 
Docu check workshop 22 maart 2011
Docu check workshop 22 maart 2011Docu check workshop 22 maart 2011
Docu check workshop 22 maart 2011DocuProces
 
Gezocht Federatieve Zoekmachine
Gezocht Federatieve ZoekmachineGezocht Federatieve Zoekmachine
Gezocht Federatieve ZoekmachineGerard Bierens
 

Similar to Auxipress - Real-time Media Monitoring en Analyse door ongestructureerde data om te zetten naar kennis (20)

DocuProces Workshop
DocuProces WorkshopDocuProces Workshop
DocuProces Workshop
 
Akeneo: the foundation of Online expansion at Obelink9
Akeneo: the foundation of Online expansion at Obelink9Akeneo: the foundation of Online expansion at Obelink9
Akeneo: the foundation of Online expansion at Obelink9
 
MarketeerCongres 2008: HP - Jeffrey Raskeyn
MarketeerCongres 2008: HP - Jeffrey RaskeynMarketeerCongres 2008: HP - Jeffrey Raskeyn
MarketeerCongres 2008: HP - Jeffrey Raskeyn
 
Prosite Webinar 2010
Prosite Webinar 2010Prosite Webinar 2010
Prosite Webinar 2010
 
Teezir eCare 3.0
Teezir eCare 3.0Teezir eCare 3.0
Teezir eCare 3.0
 
Bezit of toegang? Hoe technologie de wereld verandert
Bezit of toegang? Hoe technologie de wereld verandertBezit of toegang? Hoe technologie de wereld verandert
Bezit of toegang? Hoe technologie de wereld verandert
 
Presentatie Web3 / Interactieve Media Group
Presentatie Web3 / Interactieve Media GroupPresentatie Web3 / Interactieve Media Group
Presentatie Web3 / Interactieve Media Group
 
RFID-infomarkt: Presentatie Kno-Tech
RFID-infomarkt: Presentatie Kno-TechRFID-infomarkt: Presentatie Kno-Tech
RFID-infomarkt: Presentatie Kno-Tech
 
TopBI
TopBITopBI
TopBI
 
Natural language processing
Natural language processingNatural language processing
Natural language processing
 
Workshop persberichten schrijven
Workshop persberichten schrijvenWorkshop persberichten schrijven
Workshop persberichten schrijven
 
Sessie Metadata Informatie aan Zee 2015
Sessie Metadata Informatie aan Zee 2015Sessie Metadata Informatie aan Zee 2015
Sessie Metadata Informatie aan Zee 2015
 
Admix - Mathe Moons presntatie #DMSummit 2011
Admix - Mathe Moons presntatie #DMSummit 2011Admix - Mathe Moons presntatie #DMSummit 2011
Admix - Mathe Moons presntatie #DMSummit 2011
 
2007 03 20 V E A
2007 03 20  V E A2007 03 20  V E A
2007 03 20 V E A
 
TST-Centrale
TST-CentraleTST-Centrale
TST-Centrale
 
Digitalisering helpt culturele schatten te ontsluiten
Digitalisering helpt culturele schatten te ontsluitenDigitalisering helpt culturele schatten te ontsluiten
Digitalisering helpt culturele schatten te ontsluiten
 
Presentatie Digitale Mediatheek 02072008
Presentatie Digitale Mediatheek 02072008Presentatie Digitale Mediatheek 02072008
Presentatie Digitale Mediatheek 02072008
 
Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)
 
Docu check workshop 22 maart 2011
Docu check workshop 22 maart 2011Docu check workshop 22 maart 2011
Docu check workshop 22 maart 2011
 
Gezocht Federatieve Zoekmachine
Gezocht Federatieve ZoekmachineGezocht Federatieve Zoekmachine
Gezocht Federatieve Zoekmachine
 

More from BigDataExpo

Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...BigDataExpo
 
Google Cloud - Google's vision on AI
Google Cloud - Google's vision on AIGoogle Cloud - Google's vision on AI
Google Cloud - Google's vision on AIBigDataExpo
 
Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...BigDataExpo
 
PGGM - The Future Explore
PGGM - The Future ExplorePGGM - The Future Explore
PGGM - The Future ExploreBigDataExpo
 
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...BigDataExpo
 
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...BigDataExpo
 
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...BigDataExpo
 
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AIDynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AIBigDataExpo
 
Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science BigDataExpo
 
FunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data AnalyticsFunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data AnalyticsBigDataExpo
 
fashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big DatafashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big DataBigDataExpo
 
BigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenchesBigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenchesBigDataExpo
 
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...BigDataExpo
 
Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...BigDataExpo
 
Bovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sectorBovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sectorBigDataExpo
 
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...BigDataExpo
 
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...BigDataExpo
 
Rabobank - There is something about Data
Rabobank - There is something about DataRabobank - There is something about Data
Rabobank - There is something about DataBigDataExpo
 
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...BigDataExpo
 
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...BigDataExpo
 

More from BigDataExpo (20)

Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
Centric - Jaap huisprijzen, GTST, The Bold, IKEA en IENS. Zomaar wat toepassi...
 
Google Cloud - Google's vision on AI
Google Cloud - Google's vision on AIGoogle Cloud - Google's vision on AI
Google Cloud - Google's vision on AI
 
Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...Pacmed - Machine Learning in health care: opportunities and challanges in pra...
Pacmed - Machine Learning in health care: opportunities and challanges in pra...
 
PGGM - The Future Explore
PGGM - The Future ExplorePGGM - The Future Explore
PGGM - The Future Explore
 
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
Universiteit Utrecht & gghdc - Wat zijn de gezondheidseffecten van omgeving e...
 
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
Rob van Kranenburg - Kunnen we ons een sociaal krediet systeem zoals in het o...
 
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
OrangeNXT - High accuracy mapping from videos for efficient fiber optic cable...
 
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AIDynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
Dynniq & GoDataDriven - Shaping the future of traffic with IoT and AI
 
Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science Teleperformance - Smart personalized service door het gebruik van Data Science
Teleperformance - Smart personalized service door het gebruik van Data Science
 
FunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data AnalyticsFunXtion - Interactive Digital Fitness with Data Analytics
FunXtion - Interactive Digital Fitness with Data Analytics
 
fashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big DatafashionTrade - Vroeger noemde we dat Big Data
fashionTrade - Vroeger noemde we dat Big Data
 
BigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenchesBigData Republic - Industrializing data science: a view from the trenches
BigData Republic - Industrializing data science: a view from the trenches
 
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
Bicos - Hear how a top sportswear company produced cutting-edge data infrastr...
 
Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...Endrse - Next level online samenwerkingen tussen personalities en merken met ...
Endrse - Next level online samenwerkingen tussen personalities en merken met ...
 
Bovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sectorBovag - Refine-IT - Proces optimalisatie in de automotive sector
Bovag - Refine-IT - Proces optimalisatie in de automotive sector
 
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
Schiphol - Optimale doorstroom van passagiers op Schiphol dankzij slimme data...
 
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
Veco - Big Data in de Supply Chain: Hoe Process Mining kan helpen kosten te r...
 
Rabobank - There is something about Data
Rabobank - There is something about DataRabobank - There is something about Data
Rabobank - There is something about Data
 
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
VU Amsterdam - Big data en datagedreven waardecreatie: valt er nog iets te ki...
 
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
 

Auxipress - Real-time Media Monitoring en Analyse door ongestructureerde data om te zetten naar kennis

  • 1. Real-Time Media Monitoring & Analyse Ongestructureerde Data Omzetten naar Kennis
  • 2. Auxipress  Press Clipping  Media Monitoring  Wat zegt de media over mijn bedrijf
  • 3. Use Case : Tekst naar Kennis
  • 5. Gebruikte data  Volledige Belgische Media  Kranten (print en online) worden dagelijks ‘s morgens digitaal ontvangen  Artikels worden digitaal geknipt en voorzien van meta data  Weekbladen  Radio/TV  Abonnement op Facebook/Twitter gegevens  Extra Media on-demand  Politieke partij programma’s  Vakbladen  Dossiers, ....  Frankrijk/Nederland
  • 6. Bijna uitsluitend ongestructureerde data  Tekst  XML, OCR, Transcripts  8.000 artikels / dag  Nederlands/Frans/Engels  MetaData  Publicatie Datum  Bron  Taal
  • 7. Configuratie  Hardware : 64 Cores / 64 GB Memory / 6 Terrabyte HD  InterSystems Caché platform  Caché Database voor opslag van alle artikels en tabellen (momenteel 1,4 Terrabyte)  iKnow NLP voor Detecteren van Concepten (multi-woord groepen) uit teksten in 3 talen  (custom) iFind voor Matchen van Dictionary  DeepSee BI voor visualisatie en analyse
  • 8. Dictionary  5 niveaus  > 12,000 categorieën  > 85,000 concepten ... Ondernemingen & Consumptie Economie & Financiën Economie & Budget Financiën & Verzekeringen Buitenlandse Handel Buitenlandse Handel Wisselkoers en Valuta Vrijhandelsakkoorden UNCTAD ACTA GATT CETA NAFTA ALENA NAFTA Noord-Amerikaanse Vrijhandelsovereenkomst North Amarican Free Trade Agreement ... Bankensector Fiscaliteit Werk, Pensioen, Sociale overleg Onderwijs, Opleiding & Wetenschap
  • 9. Aanpak  Automatische import van media via .XML  Artikels worden via InterSystems iKnow NLP naar Concepten omgezet  Concepten worden gematcht met een Dictionary  Elk artikel wordt gecategoriseerd  Nieuwe Relevante Concepten worden gedecteerd om in de Dictionary te worden bijgevoegd • Xml tags • Split articles Input • UTF8 • Html • Custom Clean • Concepts • Concept- Relation- Concept NLP • Match Dictionary • Categorize Match
  • 11. Challenges  Constante bijsturing nodig (learn-as-you-go)  1 Sales kan meer bijkomende features verzinnen dan 100 IT’ers kunnen oplossen  Altijd grotere volumes data  Kleine details worden grote problemen  Adhoc klanten queries  Te groot voor Excel  Aanpassingen in structuur van dictionary of herrekenen van oude artikels op nieuwe concepten (200 miljoen zinnen)
  • 12. Taal
  • 14. Categorisatie op Woordniveau Carrefour de l’Arbre Carrefour carrefour
  • 15. Toekomstvisie  Standaard dagelijkse media aanbod uitbreiden naar:  Nederland (vanaf 1 januari 2019)  Frankrijk  Dictionary uitbreiden naar Geo, Merken, Sentiment, Temporaliteit  Nog grotere datavolumes  Online platform voor klanten
  • 16. Toekomstvisie  Migratie naar InterSystems Iris Data Platform voor  Sharding van data  Bijkomende analytics
  • 17. Conclusie  Tekst omzetten naar Kennis is mogelijk  NLP brengt Tekst naar Concept niveau  Concepten worden door Dictionary vertaald naar Categorieën/Thema’s  BI / Queries op Categorieën
  • 18. Vragen ? Danny Wijnschenk Winfo bvba danny@winfo.be