SlideShare a Scribd company logo
1 of 15
Gábor Pécsy
Senior Manager, Data Enrichment
Meltwater Group
June 25, 2014
• Privately owned and organically grown
• Headquarters: San Francisco, California
• Employees: 900+
• Customers: 35,000+
• Core business –Media Monitoring
History / Overview
1
Founded: 2001 in Oslo, Norway with $15,000
• Strong top line growth since inception
• Consistently profitable every year of operation
• Mostly self-funded
• Yearly revenue 165M USD
Financials
Jorn
Lyseggen
• CEO & Founder
• Involved in four
startups to date
• Founded Meltwater in
2001
Offices All Around the Globe
• 50+ offices in Europe, North and South America, Asia, Africa, Australia
• 900+ employees, mostly sales
Not-for-profit NGO fully funded and run by Meltwater
Our product vision
4
Morning coffee
Informed
decisions
Help our clients track and understand
5
own brand
competitors leads
partners
product reviews
own industry
Uses Meltwater to find out
about new instances of
vandalism and break-ins. Often,
the victim is in need of services
Uses Meltwater to help
determine how public
perception of certain ingredient
chemicals will influence
adoption & sales
Uses Meltwater to be alerted
of when certain patent will
expire in target markets
TV Station In India: Uses Meltwater to
monitor the performance and
popularity of news anchors and
programs
Uses Meltwater
social listening to
estimate and
prevent
infrastructure
attacks
Meltwater in Budapest
• Operations started in 2009
• No sales
• Originally a technology research group
• Currently two teams present:
• Content Services: responsible for content acquisition
• Data Enrichment: data analytics and enrichments (including NLP)
• Current size: 11, plan to grow to 20 by end of the year
6
Our technology in numbers
• Content:
• News crawler: 250K+ sources, 2M+ documents daily
• Over 3 billion since 2001
• Blog crawler (icerocket.com): 30M blogs
• Social data: 100M+ document daily from various sources (twitter,
facebook, Youtube, comment streams, Wikipedia etc.)
• Data enrichment:
• NLP services in 12 languages (details later)
• Search and Storage:
• Ellastic Search index
• Riak – the largest know installation according to Basho
• ~150TB of data
7
Existing NLP Services
● Language detection
53 Languages
● Sentiment analysis
● Key phrase extraction
12 languages with support
for numeric values
12 languages
● Named Entity Recognition
4 languages (English,
German, Swedish,
Norwegian)
● Content Categorization
12 Languages with support
for dynamic categories
● Intent detection
“I want to by an iPhone.”
PURCHA
SE
“How can I play music on my iPhone?”
QUESTION
Sales
Customer
Support
1 Language (English)
● Named Entity Disambiguation
1 Language
● Near duplicate detection
Language Agnostic
8
NLP Capabilities under development
• Entity level sentiment
• Relationship extraction
• Document Grouping
• Searchable knowledge base
9
Thank you!
10
Gábor Pécsy (gabor.pecsy@meltwater.com)
Current Products
11
mNews
12
mPress - now part of mNews
13
mBuzz
14

More Related Content

Viewers also liked

Mihaltz trendminer hu_nl_pmeetup_20140925
Mihaltz trendminer hu_nl_pmeetup_20140925Mihaltz trendminer hu_nl_pmeetup_20140925
Mihaltz trendminer hu_nl_pmeetup_20140925Zoltan Varju
 
Simon Eszter: Szekvenciális elemzők: a hunner és a hunchunk
Simon Eszter: Szekvenciális elemzők: a hunner és a hunchunkSimon Eszter: Szekvenciális elemzők: a hunner és a hunchunk
Simon Eszter: Szekvenciális elemzők: a hunner és a hunchunkZoltan Varju
 
Miháltz Márton: hun* kiegészítések: hunstem, hunmorph_extend, huntoken
Miháltz Márton: hun* kiegészítések: hunstem, hunmorph_extend, huntokenMiháltz Márton: hun* kiegészítések: hunstem, hunmorph_extend, huntoken
Miháltz Márton: hun* kiegészítések: hunstem, hunmorph_extend, huntokenZoltan Varju
 
Magyar politikai blogszféra
Magyar politikai blogszféraMagyar politikai blogszféra
Magyar politikai blogszféraZoltan Varju
 
Hadoop based etl and solr based semantic search
Hadoop based etl and solr based semantic searchHadoop based etl and solr based semantic search
Hadoop based etl and solr based semantic searchZoltan Varju
 
Digitális testbeszéd
Digitális testbeszédDigitális testbeszéd
Digitális testbeszédZoltan Varju
 
Szekeres Péter: Webes vélemények egyetlen grafikonba sűrítve
Szekeres Péter: Webes vélemények egyetlen grafikonba sűrítveSzekeres Péter: Webes vélemények egyetlen grafikonba sűrítve
Szekeres Péter: Webes vélemények egyetlen grafikonba sűrítveZoltan Varju
 
Balogh Kitti: Machine learning algoritmusok kiértékelése
Balogh Kitti: Machine learning algoritmusok kiértékeléseBalogh Kitti: Machine learning algoritmusok kiértékelése
Balogh Kitti: Machine learning algoritmusok kiértékeléseZoltan Varju
 
Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnev...
Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnev...Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnev...
Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnev...Zoltan Varju
 
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: NeticleNLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: NeticleZoltan Varju
 
MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport
MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport
MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport Zoltan Varju
 

Viewers also liked (11)

Mihaltz trendminer hu_nl_pmeetup_20140925
Mihaltz trendminer hu_nl_pmeetup_20140925Mihaltz trendminer hu_nl_pmeetup_20140925
Mihaltz trendminer hu_nl_pmeetup_20140925
 
Simon Eszter: Szekvenciális elemzők: a hunner és a hunchunk
Simon Eszter: Szekvenciális elemzők: a hunner és a hunchunkSimon Eszter: Szekvenciális elemzők: a hunner és a hunchunk
Simon Eszter: Szekvenciális elemzők: a hunner és a hunchunk
 
Miháltz Márton: hun* kiegészítések: hunstem, hunmorph_extend, huntoken
Miháltz Márton: hun* kiegészítések: hunstem, hunmorph_extend, huntokenMiháltz Márton: hun* kiegészítések: hunstem, hunmorph_extend, huntoken
Miháltz Márton: hun* kiegészítések: hunstem, hunmorph_extend, huntoken
 
Magyar politikai blogszféra
Magyar politikai blogszféraMagyar politikai blogszféra
Magyar politikai blogszféra
 
Hadoop based etl and solr based semantic search
Hadoop based etl and solr based semantic searchHadoop based etl and solr based semantic search
Hadoop based etl and solr based semantic search
 
Digitális testbeszéd
Digitális testbeszédDigitális testbeszéd
Digitális testbeszéd
 
Szekeres Péter: Webes vélemények egyetlen grafikonba sűrítve
Szekeres Péter: Webes vélemények egyetlen grafikonba sűrítveSzekeres Péter: Webes vélemények egyetlen grafikonba sűrítve
Szekeres Péter: Webes vélemények egyetlen grafikonba sűrítve
 
Balogh Kitti: Machine learning algoritmusok kiértékelése
Balogh Kitti: Machine learning algoritmusok kiértékeléseBalogh Kitti: Machine learning algoritmusok kiértékelése
Balogh Kitti: Machine learning algoritmusok kiértékelése
 
Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnev...
Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnev...Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnev...
Vincze Veronika: Nyelvi elemzők Szegedről: morfológia, szintaxis, tulajdonnev...
 
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: NeticleNLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
 
MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport
MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport
MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport
 

Similar to Meltwater - nlp matiné 2014

Open datapolicy heatherlaird_good2015
Open datapolicy heatherlaird_good2015Open datapolicy heatherlaird_good2015
Open datapolicy heatherlaird_good2015GO Open Data (GOOD)
 
March of Dimes and Bixal - Using social media to deliver health messages
March of Dimes and Bixal  - Using social media to deliver health messagesMarch of Dimes and Bixal  - Using social media to deliver health messages
March of Dimes and Bixal - Using social media to deliver health messagesbixal
 
Social Media for Non Profits - Westminster College
Social Media for Non Profits - Westminster CollegeSocial Media for Non Profits - Westminster College
Social Media for Non Profits - Westminster CollegeGrand Canyon University
 
The Convergence of Search, Social and Content Marketing
The Convergence of Search, Social and Content MarketingThe Convergence of Search, Social and Content Marketing
The Convergence of Search, Social and Content MarketingBlueGlass Interactive, Inc.
 
Marketing OTC Presentation by Dana Otillio For IABC Houston
Marketing OTC Presentation by Dana Otillio For IABC HoustonMarketing OTC Presentation by Dana Otillio For IABC Houston
Marketing OTC Presentation by Dana Otillio For IABC HoustonIABC Houston
 
LSC Technology Initiative Grant Conference 2015 | Law Help
LSC Technology Initiative Grant Conference 2015 | Law HelpLSC Technology Initiative Grant Conference 2015 | Law Help
LSC Technology Initiative Grant Conference 2015 | Law HelpLegal Services Corporation
 
Evolve Law Summit
Evolve Law SummitEvolve Law Summit
Evolve Law SummitEvolve Law
 
Open Source as a Viable Business Model
Open Source as a Viable Business ModelOpen Source as a Viable Business Model
Open Source as a Viable Business ModelTien-Soon Law
 
How can inno­va­tors lever­age crowd­fund­ing and strate­gic invest­ments to ...
How can inno­va­tors lever­age crowd­fund­ing and strate­gic invest­ments to ...How can inno­va­tors lever­age crowd­fund­ing and strate­gic invest­ments to ...
How can inno­va­tors lever­age crowd­fund­ing and strate­gic invest­ments to ...SharpBrains
 
Nep libraries event feb 2014
Nep libraries event feb 2014Nep libraries event feb 2014
Nep libraries event feb 2014NLIS
 
Open Data for Digital Activism and Civic Engegament
Open Data for Digital Activism and Civic EngegamentOpen Data for Digital Activism and Civic Engegament
Open Data for Digital Activism and Civic EngegamentSerdar Temiz
 
Marketing from Europe to Japan
Marketing from Europe to JapanMarketing from Europe to Japan
Marketing from Europe to JapanThomas Nelan
 
Content Marketing Barcamp Acrolinx, Cosca15 in Dieburg
Content Marketing Barcamp Acrolinx, Cosca15 in DieburgContent Marketing Barcamp Acrolinx, Cosca15 in Dieburg
Content Marketing Barcamp Acrolinx, Cosca15 in DieburgChristian Gericke
 
Nih presentation march 2017
Nih presentation march 2017Nih presentation march 2017
Nih presentation march 2017Business Turku
 
How to Build Audience and Engagement in Government
How to Build Audience and Engagement in GovernmentHow to Build Audience and Engagement in Government
How to Build Audience and Engagement in GovernmentGovLoop
 
BlogWell Atlanta Case Study: Coca-Cola, presented by Natalie Johnson
BlogWell Atlanta Case Study: Coca-Cola, presented by Natalie JohnsonBlogWell Atlanta Case Study: Coca-Cola, presented by Natalie Johnson
BlogWell Atlanta Case Study: Coca-Cola, presented by Natalie JohnsonSocialMedia.org
 
Cash out for_business_full_large
Cash out for_business_full_largeCash out for_business_full_large
Cash out for_business_full_largeCashOut
 

Similar to Meltwater - nlp matiné 2014 (20)

Open datapolicy heatherlaird_good2015
Open datapolicy heatherlaird_good2015Open datapolicy heatherlaird_good2015
Open datapolicy heatherlaird_good2015
 
Presentation to LCI
Presentation to LCIPresentation to LCI
Presentation to LCI
 
March of Dimes and Bixal - Using social media to deliver health messages
March of Dimes and Bixal  - Using social media to deliver health messagesMarch of Dimes and Bixal  - Using social media to deliver health messages
March of Dimes and Bixal - Using social media to deliver health messages
 
John Foley - Global Channel Partners Summit 2012
John Foley - Global Channel Partners Summit 2012John Foley - Global Channel Partners Summit 2012
John Foley - Global Channel Partners Summit 2012
 
Social Media for Non Profits - Westminster College
Social Media for Non Profits - Westminster CollegeSocial Media for Non Profits - Westminster College
Social Media for Non Profits - Westminster College
 
The Convergence of Search, Social and Content Marketing
The Convergence of Search, Social and Content MarketingThe Convergence of Search, Social and Content Marketing
The Convergence of Search, Social and Content Marketing
 
Marketing OTC Presentation by Dana Otillio For IABC Houston
Marketing OTC Presentation by Dana Otillio For IABC HoustonMarketing OTC Presentation by Dana Otillio For IABC Houston
Marketing OTC Presentation by Dana Otillio For IABC Houston
 
LSC Technology Initiative Grant Conference 2015 | Law Help
LSC Technology Initiative Grant Conference 2015 | Law HelpLSC Technology Initiative Grant Conference 2015 | Law Help
LSC Technology Initiative Grant Conference 2015 | Law Help
 
Evolve Law Summit
Evolve Law SummitEvolve Law Summit
Evolve Law Summit
 
Open Source as a Viable Business Model
Open Source as a Viable Business ModelOpen Source as a Viable Business Model
Open Source as a Viable Business Model
 
How can inno­va­tors lever­age crowd­fund­ing and strate­gic invest­ments to ...
How can inno­va­tors lever­age crowd­fund­ing and strate­gic invest­ments to ...How can inno­va­tors lever­age crowd­fund­ing and strate­gic invest­ments to ...
How can inno­va­tors lever­age crowd­fund­ing and strate­gic invest­ments to ...
 
Nep libraries event feb 2014
Nep libraries event feb 2014Nep libraries event feb 2014
Nep libraries event feb 2014
 
Crowdpromoting
CrowdpromotingCrowdpromoting
Crowdpromoting
 
Open Data for Digital Activism and Civic Engegament
Open Data for Digital Activism and Civic EngegamentOpen Data for Digital Activism and Civic Engegament
Open Data for Digital Activism and Civic Engegament
 
Marketing from Europe to Japan
Marketing from Europe to JapanMarketing from Europe to Japan
Marketing from Europe to Japan
 
Content Marketing Barcamp Acrolinx, Cosca15 in Dieburg
Content Marketing Barcamp Acrolinx, Cosca15 in DieburgContent Marketing Barcamp Acrolinx, Cosca15 in Dieburg
Content Marketing Barcamp Acrolinx, Cosca15 in Dieburg
 
Nih presentation march 2017
Nih presentation march 2017Nih presentation march 2017
Nih presentation march 2017
 
How to Build Audience and Engagement in Government
How to Build Audience and Engagement in GovernmentHow to Build Audience and Engagement in Government
How to Build Audience and Engagement in Government
 
BlogWell Atlanta Case Study: Coca-Cola, presented by Natalie Johnson
BlogWell Atlanta Case Study: Coca-Cola, presented by Natalie JohnsonBlogWell Atlanta Case Study: Coca-Cola, presented by Natalie Johnson
BlogWell Atlanta Case Study: Coca-Cola, presented by Natalie Johnson
 
Cash out for_business_full_large
Cash out for_business_full_largeCash out for_business_full_large
Cash out for_business_full_large
 

More from Zoltan Varju

NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroidNLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroidZoltan Varju
 
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: PrecognoxNLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: PrecognoxZoltan Varju
 
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzéseBalogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzéseZoltan Varju
 
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entitiesBabak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entitiesZoltan Varju
 
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatbanSzövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatbanZoltan Varju
 
Szövegbányászat
SzövegbányászatSzövegbányászat
SzövegbányászatZoltan Varju
 
Balogh Kitti: Szövegbányászat
Balogh Kitti: SzövegbányászatBalogh Kitti: Szövegbányászat
Balogh Kitti: SzövegbányászatZoltan Varju
 
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...Zoltan Varju
 
Kisvilágunk, a nyelv
Kisvilágunk, a nyelvKisvilágunk, a nyelv
Kisvilágunk, a nyelvZoltan Varju
 
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszédBalogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszédZoltan Varju
 
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzésekBalogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzésekZoltan Varju
 
Érzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzésÉrzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzésZoltan Varju
 
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...Zoltan Varju
 
Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)Zoltan Varju
 
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...Zoltan Varju
 
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...Zoltan Varju
 
Rasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útjaRasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útjaZoltan Varju
 
Kontextus és a hivatkozások ereje
Kontextus és a hivatkozások erejeKontextus és a hivatkozások ereje
Kontextus és a hivatkozások erejeZoltan Varju
 
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshezSimon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshezZoltan Varju
 
Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben Zoltan Varju
 

More from Zoltan Varju (20)

NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroidNLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
 
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: PrecognoxNLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
 
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzéseBalogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
 
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entitiesBabak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entities
 
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatbanSzövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatban
 
Szövegbányászat
SzövegbányászatSzövegbányászat
Szövegbányászat
 
Balogh Kitti: Szövegbányászat
Balogh Kitti: SzövegbányászatBalogh Kitti: Szövegbányászat
Balogh Kitti: Szövegbányászat
 
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
 
Kisvilágunk, a nyelv
Kisvilágunk, a nyelvKisvilágunk, a nyelv
Kisvilágunk, a nyelv
 
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszédBalogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszéd
 
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzésekBalogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
 
Érzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzésÉrzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzés
 
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
 
Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)
 
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
 
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
 
Rasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útjaRasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útja
 
Kontextus és a hivatkozások ereje
Kontextus és a hivatkozások erejeKontextus és a hivatkozások ereje
Kontextus és a hivatkozások ereje
 
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshezSimon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
Simon Eszter: Silver standard korpuszok tulajdonnév-felismeréshez
 
Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben
 

Recently uploaded

My Hashitalk Indonesia April 2024 Presentation
My Hashitalk Indonesia April 2024 PresentationMy Hashitalk Indonesia April 2024 Presentation
My Hashitalk Indonesia April 2024 PresentationRidwan Fadjar
 
Connect Wave/ connectwave Pitch Deck Presentation
Connect Wave/ connectwave Pitch Deck PresentationConnect Wave/ connectwave Pitch Deck Presentation
Connect Wave/ connectwave Pitch Deck PresentationSlibray Presentation
 
costume and set research powerpoint presentation
costume and set research powerpoint presentationcostume and set research powerpoint presentation
costume and set research powerpoint presentationphoebematthew05
 
Advanced Test Driven-Development @ php[tek] 2024
Advanced Test Driven-Development @ php[tek] 2024Advanced Test Driven-Development @ php[tek] 2024
Advanced Test Driven-Development @ php[tek] 2024Scott Keck-Warren
 
Unlocking the Potential of the Cloud for IBM Power Systems
Unlocking the Potential of the Cloud for IBM Power SystemsUnlocking the Potential of the Cloud for IBM Power Systems
Unlocking the Potential of the Cloud for IBM Power SystemsPrecisely
 
Human Factors of XR: Using Human Factors to Design XR Systems
Human Factors of XR: Using Human Factors to Design XR SystemsHuman Factors of XR: Using Human Factors to Design XR Systems
Human Factors of XR: Using Human Factors to Design XR SystemsMark Billinghurst
 
My INSURER PTE LTD - Insurtech Innovation Award 2024
My INSURER PTE LTD - Insurtech Innovation Award 2024My INSURER PTE LTD - Insurtech Innovation Award 2024
My INSURER PTE LTD - Insurtech Innovation Award 2024The Digital Insurer
 
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticsKotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticscarlostorres15106
 
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)Wonjun Hwang
 
Scanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsScanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsRizwan Syed
 
Streamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupStreamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupFlorian Wilhelm
 
Are Multi-Cloud and Serverless Good or Bad?
Are Multi-Cloud and Serverless Good or Bad?Are Multi-Cloud and Serverless Good or Bad?
Are Multi-Cloud and Serverless Good or Bad?Mattias Andersson
 
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024BookNet Canada
 
Unleash Your Potential - Namagunga Girls Coding Club
Unleash Your Potential - Namagunga Girls Coding ClubUnleash Your Potential - Namagunga Girls Coding Club
Unleash Your Potential - Namagunga Girls Coding ClubKalema Edgar
 
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Patryk Bandurski
 
Science&tech:THE INFORMATION AGE STS.pdf
Science&tech:THE INFORMATION AGE STS.pdfScience&tech:THE INFORMATION AGE STS.pdf
Science&tech:THE INFORMATION AGE STS.pdfjimielynbastida
 
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks..."LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...Fwdays
 

Recently uploaded (20)

My Hashitalk Indonesia April 2024 Presentation
My Hashitalk Indonesia April 2024 PresentationMy Hashitalk Indonesia April 2024 Presentation
My Hashitalk Indonesia April 2024 Presentation
 
Connect Wave/ connectwave Pitch Deck Presentation
Connect Wave/ connectwave Pitch Deck PresentationConnect Wave/ connectwave Pitch Deck Presentation
Connect Wave/ connectwave Pitch Deck Presentation
 
costume and set research powerpoint presentation
costume and set research powerpoint presentationcostume and set research powerpoint presentation
costume and set research powerpoint presentation
 
Advanced Test Driven-Development @ php[tek] 2024
Advanced Test Driven-Development @ php[tek] 2024Advanced Test Driven-Development @ php[tek] 2024
Advanced Test Driven-Development @ php[tek] 2024
 
Vulnerability_Management_GRC_by Sohang Sengupta.pptx
Vulnerability_Management_GRC_by Sohang Sengupta.pptxVulnerability_Management_GRC_by Sohang Sengupta.pptx
Vulnerability_Management_GRC_by Sohang Sengupta.pptx
 
E-Vehicle_Hacking_by_Parul Sharma_null_owasp.pptx
E-Vehicle_Hacking_by_Parul Sharma_null_owasp.pptxE-Vehicle_Hacking_by_Parul Sharma_null_owasp.pptx
E-Vehicle_Hacking_by_Parul Sharma_null_owasp.pptx
 
Unlocking the Potential of the Cloud for IBM Power Systems
Unlocking the Potential of the Cloud for IBM Power SystemsUnlocking the Potential of the Cloud for IBM Power Systems
Unlocking the Potential of the Cloud for IBM Power Systems
 
Hot Sexy call girls in Panjabi Bagh 🔝 9953056974 🔝 Delhi escort Service
Hot Sexy call girls in Panjabi Bagh 🔝 9953056974 🔝 Delhi escort ServiceHot Sexy call girls in Panjabi Bagh 🔝 9953056974 🔝 Delhi escort Service
Hot Sexy call girls in Panjabi Bagh 🔝 9953056974 🔝 Delhi escort Service
 
Human Factors of XR: Using Human Factors to Design XR Systems
Human Factors of XR: Using Human Factors to Design XR SystemsHuman Factors of XR: Using Human Factors to Design XR Systems
Human Factors of XR: Using Human Factors to Design XR Systems
 
My INSURER PTE LTD - Insurtech Innovation Award 2024
My INSURER PTE LTD - Insurtech Innovation Award 2024My INSURER PTE LTD - Insurtech Innovation Award 2024
My INSURER PTE LTD - Insurtech Innovation Award 2024
 
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticsKotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
 
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
 
Scanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsScanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL Certs
 
Streamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupStreamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project Setup
 
Are Multi-Cloud and Serverless Good or Bad?
Are Multi-Cloud and Serverless Good or Bad?Are Multi-Cloud and Serverless Good or Bad?
Are Multi-Cloud and Serverless Good or Bad?
 
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
Transcript: #StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
 
Unleash Your Potential - Namagunga Girls Coding Club
Unleash Your Potential - Namagunga Girls Coding ClubUnleash Your Potential - Namagunga Girls Coding Club
Unleash Your Potential - Namagunga Girls Coding Club
 
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
 
Science&tech:THE INFORMATION AGE STS.pdf
Science&tech:THE INFORMATION AGE STS.pdfScience&tech:THE INFORMATION AGE STS.pdf
Science&tech:THE INFORMATION AGE STS.pdf
 
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks..."LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
 

Meltwater - nlp matiné 2014

  • 1. Gábor Pécsy Senior Manager, Data Enrichment Meltwater Group June 25, 2014
  • 2. • Privately owned and organically grown • Headquarters: San Francisco, California • Employees: 900+ • Customers: 35,000+ • Core business –Media Monitoring History / Overview 1 Founded: 2001 in Oslo, Norway with $15,000 • Strong top line growth since inception • Consistently profitable every year of operation • Mostly self-funded • Yearly revenue 165M USD Financials Jorn Lyseggen • CEO & Founder • Involved in four startups to date • Founded Meltwater in 2001
  • 3. Offices All Around the Globe • 50+ offices in Europe, North and South America, Asia, Africa, Australia • 900+ employees, mostly sales
  • 4. Not-for-profit NGO fully funded and run by Meltwater
  • 5. Our product vision 4 Morning coffee Informed decisions
  • 6. Help our clients track and understand 5 own brand competitors leads partners product reviews own industry Uses Meltwater to find out about new instances of vandalism and break-ins. Often, the victim is in need of services Uses Meltwater to help determine how public perception of certain ingredient chemicals will influence adoption & sales Uses Meltwater to be alerted of when certain patent will expire in target markets TV Station In India: Uses Meltwater to monitor the performance and popularity of news anchors and programs Uses Meltwater social listening to estimate and prevent infrastructure attacks
  • 7. Meltwater in Budapest • Operations started in 2009 • No sales • Originally a technology research group • Currently two teams present: • Content Services: responsible for content acquisition • Data Enrichment: data analytics and enrichments (including NLP) • Current size: 11, plan to grow to 20 by end of the year 6
  • 8. Our technology in numbers • Content: • News crawler: 250K+ sources, 2M+ documents daily • Over 3 billion since 2001 • Blog crawler (icerocket.com): 30M blogs • Social data: 100M+ document daily from various sources (twitter, facebook, Youtube, comment streams, Wikipedia etc.) • Data enrichment: • NLP services in 12 languages (details later) • Search and Storage: • Ellastic Search index • Riak – the largest know installation according to Basho • ~150TB of data 7
  • 9. Existing NLP Services ● Language detection 53 Languages ● Sentiment analysis ● Key phrase extraction 12 languages with support for numeric values 12 languages ● Named Entity Recognition 4 languages (English, German, Swedish, Norwegian) ● Content Categorization 12 Languages with support for dynamic categories ● Intent detection “I want to by an iPhone.” PURCHA SE “How can I play music on my iPhone?” QUESTION Sales Customer Support 1 Language (English) ● Named Entity Disambiguation 1 Language ● Near duplicate detection Language Agnostic 8
  • 10. NLP Capabilities under development • Entity level sentiment • Relationship extraction • Document Grouping • Searchable knowledge base 9
  • 11. Thank you! 10 Gábor Pécsy (gabor.pecsy@meltwater.com)
  • 14. mPress - now part of mNews 13

Editor's Notes

  1. 1
  2. 2