SlideShare a Scribd company logo
NLP és 
termékfejlesztés 
VARJÚ ZOLTÁN, PRECOGNOX 
2014.11.18. @ CEU MICRODATA
Mi vár 
ránk? 
• Hírelemző 
• Rapid prototyping 
• Hogyan dolgozunk mi 
• Python és NLTK 
• Hogyan szeretnénk 
majd dolgozni a 
jövőben
Hírelemző
A projektről 
 Belső projekt 
 Gyakornokok dolgoznak rajta (Kulcsár Ádám, 
Fodor Mánuel) 
 Szakdolgozati téma és saját játszótér 
 (Automatikus) tartalomelemzés 
 Korpusznyelvészet (keywords, kollokációk, 
konkordanicák, stb.) 
 R-index és nowcasting irodalom ihlette rendszer
Ihlet 
Google Correlate
Szemantika
Célok 
 Korpusznyelvészet == szógyakorisági vizsgálatok 
 Tartalomelemzés == szótárak használata 
 Szentiment- és emócióelemzés == szótárak használata 
 Predikció 
 Szemantikus technológiák 
 Faceted search 
 Semantic search 
 Szótárak automatikus kiegészítése
Article Extractor 
 boilerpipe
OpenNLP
UIMA
Lucene/Solr
Apache Stanbol
Rapid prototyping
Rapid 
prototyping 
• Gyorsan valami 
használhatót 
élesben 
• A prototípus 
maga a termék 
nulladik verziója
Miért? 
 A csapat online kommunikál 
 Budapest, Kaposvár, Hódmezővásárhely, 
Szikszó között nehéz megoldani a 
folyamatos élő kapcsolatokat 
 „kézzel fogható” dologról beszéljünk 
 „olcsón” tudjunk hibázni
Rapid prototyping és K+F 
Prototípus == 
Specifikáció 
Működő prototípus == 
tesztesetek a „rendes” 
terméknek
Hogyan dolgozunk? 
1) Adatok 
Áltlában Python segítségével hozzuk „emészthető” formára és/vagy gyűjtjük be 
2) Felfedezés 
Milyen módszerek jöhetnek szóba? 
R és Python segítségével gyors próba, tipikus „spaghetti code” 
3) Prototípus 
Egy, vagy több működő módszer rendesebb implementálása 
A lehető legtöbb általunk használt eszközzel szeretjük megépíteni
Python és prototyping
Miért Python? 
 Futtatható pszeudo-kód 
 Könnyen megtanulják a kutatók, tudják olvasni a fejlesztők 
 Wraper-ek a legtöbb általunk használt eszközökhöz 
(boilerpipe, Solr, Weka) 
 SciPy 
 scikit-learn 
 pandas 
 NLTK 
 Hy
Toby Segaran 
Programming Collective 
Intelligence 
Programming the Semantic 
Web
NLTK 
Natural Language Toolkit 
 Minden benne van 
 Ingyenes könyv 
 Tanítási célra íródott 
 Jurafsky – Martin és 
Manning – Schütze 
érthető vele 
 Standard módon 
alakítható igényeinkhez
Még gyorsabban!
A Java és a Python legjobb 
része a VM! 
Főnevek helyett igék, OOP helyett 
funkcionális programozás 
Közelebb a probléma formális 
leírásához 
Konceptuálisan átláthatóbb 
Párhuzamos és elosztott rendszereké 
a jövő
Clojure és Hy 
 Hy – Lisp dialektus a Python VM-re 
 Clojure – modern Lisp a JVM-re 
 Clojure Incanter – R stílusú, funkcionális statisztikai programozási 
környezet
Funkcionális programozás – a 
jövő 
 Egyszerűbb a kutatónak 
 Minimalizálja a prototípus és a kész termék 
elkészítése közötti időt 
 Elmosódnak a prototípus és a termék határai, 
szabadon alakíthatja a fejlesztő és a kutató 
csapat 
 Minsky – Weeks: Caml trading – experiences with 
functional programming on Wall Street
Kérdés? 
@zoltanvarju 
@varjuzoli 
zoltan.varju@precognox.com 
http://kereses.blog.hu/

More Related Content

Similar to Nlp és termékfejlesztés

Hogyan optimalizáljunk C/C++ kódokat!
Hogyan optimalizáljunk C/C++ kódokat!Hogyan optimalizáljunk C/C++ kódokat!
Hogyan optimalizáljunk C/C++ kódokat!
Open Academy
 
Objektum-orinetált mérések a gyakorlatban
Objektum-orinetált mérések a gyakorlatbanObjektum-orinetált mérések a gyakorlatban
Objektum-orinetált mérések a gyakorlatban
Antal Orcsik
 
Forráskódtárak gráfalapú statikus analízise
Forráskódtárak gráfalapú statikus analíziseForráskódtárak gráfalapú statikus analízise
Forráskódtárak gráfalapú statikus analízise
Dániel Stein
 
Vjzvzr poster
Vjzvzr posterVjzvzr poster
Vjzvzr posterpszaby
 
8 Bauer Tamas Gal Gyorgy Portal Alkalmazasok Jogosultsag Kezelese
8 Bauer Tamas   Gal Gyorgy   Portal Alkalmazasok Jogosultsag Kezelese8 Bauer Tamas   Gal Gyorgy   Portal Alkalmazasok Jogosultsag Kezelese
8 Bauer Tamas Gal Gyorgy Portal Alkalmazasok Jogosultsag KezelesePOLYGON Informatikai Kft.
 
#Stackoverflow útravaló haladóknak
#Stackoverflow útravaló haladóknak#Stackoverflow útravaló haladóknak
#Stackoverflow útravaló haladóknak
Márton Kodok
 
Digitális bölcsészet Dr. Kalcsó Gyula blogja
Digitális bölcsészet Dr. Kalcsó Gyula blogjaDigitális bölcsészet Dr. Kalcsó Gyula blogja
Digitális bölcsészet Dr. Kalcsó Gyula blogja
Kiss Ágnes
 
A petőfi irodalmi múzeum portálrendszere v1
A petőfi irodalmi múzeum portálrendszere v1A petőfi irodalmi múzeum portálrendszere v1
A petőfi irodalmi múzeum portálrendszere v1t.zsuzsi17
 
Lego okt eszköz
Lego okt eszközLego okt eszköz
Lego okt eszköz
kangyerka
 
Előadás2
Előadás2Előadás2
Előadás2
egyetem
 
Univerzalis Entitas Kezeles - Laravel
Univerzalis Entitas Kezeles - LaravelUniverzalis Entitas Kezeles - Laravel
Univerzalis Entitas Kezeles - Laravel
Peter Perger
 
Sok a szöveg?
Sok a szöveg?Sok a szöveg?
Sok a szöveg?
Zoltan Varju
 
Mit csinál egy nyelvész egy IT cégnél?
Mit csinál egy nyelvész egy IT cégnél?Mit csinál egy nyelvész egy IT cégnél?
Mit csinál egy nyelvész egy IT cégnél?Zoltan Varju
 
Varga Krisztián: A szemantikus folyamatmenedzsment eszközeinek hasznosítása a...
Varga Krisztián: A szemantikus folyamatmenedzsment eszközeinek hasznosítása a...Varga Krisztián: A szemantikus folyamatmenedzsment eszközeinek hasznosítása a...
Varga Krisztián: A szemantikus folyamatmenedzsment eszközeinek hasznosítása a...
Informatikai Intézet
 
Braille iras
Braille irasBraille iras
Braille iras
Eva Gyarmathy
 
A mi hackathonunk: Egy kihívásokkal teli IoT projekt tapasztalatai
A mi hackathonunk: Egy kihívásokkal teli IoT projekt tapasztalataiA mi hackathonunk: Egy kihívásokkal teli IoT projekt tapasztalatai
A mi hackathonunk: Egy kihívásokkal teli IoT projekt tapasztalatai
György Balássy
 
OH-DIG07TA__tanmenet.docx
OH-DIG07TA__tanmenet.docxOH-DIG07TA__tanmenet.docx
OH-DIG07TA__tanmenet.docx
gipszjakab11
 

Similar to Nlp és termékfejlesztés (17)

Hogyan optimalizáljunk C/C++ kódokat!
Hogyan optimalizáljunk C/C++ kódokat!Hogyan optimalizáljunk C/C++ kódokat!
Hogyan optimalizáljunk C/C++ kódokat!
 
Objektum-orinetált mérések a gyakorlatban
Objektum-orinetált mérések a gyakorlatbanObjektum-orinetált mérések a gyakorlatban
Objektum-orinetált mérések a gyakorlatban
 
Forráskódtárak gráfalapú statikus analízise
Forráskódtárak gráfalapú statikus analíziseForráskódtárak gráfalapú statikus analízise
Forráskódtárak gráfalapú statikus analízise
 
Vjzvzr poster
Vjzvzr posterVjzvzr poster
Vjzvzr poster
 
8 Bauer Tamas Gal Gyorgy Portal Alkalmazasok Jogosultsag Kezelese
8 Bauer Tamas   Gal Gyorgy   Portal Alkalmazasok Jogosultsag Kezelese8 Bauer Tamas   Gal Gyorgy   Portal Alkalmazasok Jogosultsag Kezelese
8 Bauer Tamas Gal Gyorgy Portal Alkalmazasok Jogosultsag Kezelese
 
#Stackoverflow útravaló haladóknak
#Stackoverflow útravaló haladóknak#Stackoverflow útravaló haladóknak
#Stackoverflow útravaló haladóknak
 
Digitális bölcsészet Dr. Kalcsó Gyula blogja
Digitális bölcsészet Dr. Kalcsó Gyula blogjaDigitális bölcsészet Dr. Kalcsó Gyula blogja
Digitális bölcsészet Dr. Kalcsó Gyula blogja
 
A petőfi irodalmi múzeum portálrendszere v1
A petőfi irodalmi múzeum portálrendszere v1A petőfi irodalmi múzeum portálrendszere v1
A petőfi irodalmi múzeum portálrendszere v1
 
Lego okt eszköz
Lego okt eszközLego okt eszköz
Lego okt eszköz
 
Előadás2
Előadás2Előadás2
Előadás2
 
Univerzalis Entitas Kezeles - Laravel
Univerzalis Entitas Kezeles - LaravelUniverzalis Entitas Kezeles - Laravel
Univerzalis Entitas Kezeles - Laravel
 
Sok a szöveg?
Sok a szöveg?Sok a szöveg?
Sok a szöveg?
 
Mit csinál egy nyelvész egy IT cégnél?
Mit csinál egy nyelvész egy IT cégnél?Mit csinál egy nyelvész egy IT cégnél?
Mit csinál egy nyelvész egy IT cégnél?
 
Varga Krisztián: A szemantikus folyamatmenedzsment eszközeinek hasznosítása a...
Varga Krisztián: A szemantikus folyamatmenedzsment eszközeinek hasznosítása a...Varga Krisztián: A szemantikus folyamatmenedzsment eszközeinek hasznosítása a...
Varga Krisztián: A szemantikus folyamatmenedzsment eszközeinek hasznosítása a...
 
Braille iras
Braille irasBraille iras
Braille iras
 
A mi hackathonunk: Egy kihívásokkal teli IoT projekt tapasztalatai
A mi hackathonunk: Egy kihívásokkal teli IoT projekt tapasztalataiA mi hackathonunk: Egy kihívásokkal teli IoT projekt tapasztalatai
A mi hackathonunk: Egy kihívásokkal teli IoT projekt tapasztalatai
 
OH-DIG07TA__tanmenet.docx
OH-DIG07TA__tanmenet.docxOH-DIG07TA__tanmenet.docx
OH-DIG07TA__tanmenet.docx
 

More from Zoltan Varju

NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroidNLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
Zoltan Varju
 
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: PrecognoxNLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
Zoltan Varju
 
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: NeticleNLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
Zoltan Varju
 
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzéseBalogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Zoltan Varju
 
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entitiesBabak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entities
Zoltan Varju
 
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatbanSzövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatban
Zoltan Varju
 
Szövegbányászat
SzövegbányászatSzövegbányászat
Szövegbányászat
Zoltan Varju
 
Balogh Kitti: Szövegbányászat
Balogh Kitti: SzövegbányászatBalogh Kitti: Szövegbányászat
Balogh Kitti: Szövegbányászat
Zoltan Varju
 
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Zoltan Varju
 
Kisvilágunk, a nyelv
Kisvilágunk, a nyelvKisvilágunk, a nyelv
Kisvilágunk, a nyelv
Zoltan Varju
 
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszédBalogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Zoltan Varju
 
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzésekBalogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Zoltan Varju
 
Érzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzésÉrzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzés
Zoltan Varju
 
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Zoltan Varju
 
Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)
Zoltan Varju
 
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Zoltan Varju
 
Sorok között olvasni
Sorok között olvasniSorok között olvasni
Sorok között olvasni
Zoltan Varju
 
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Zoltan Varju
 
Rasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útjaRasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útja
Zoltan Varju
 
Kontextus és a hivatkozások ereje
Kontextus és a hivatkozások erejeKontextus és a hivatkozások ereje
Kontextus és a hivatkozások ereje
Zoltan Varju
 

More from Zoltan Varju (20)

NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroidNLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
 
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: PrecognoxNLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
 
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: NeticleNLP meetup 2016.10.05 - Szekeres Péter: Neticle
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
 
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzéseBalogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
 
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entitiesBabak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entities
 
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatbanSzövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatban
 
Szövegbányászat
SzövegbányászatSzövegbányászat
Szövegbányászat
 
Balogh Kitti: Szövegbányászat
Balogh Kitti: SzövegbányászatBalogh Kitti: Szövegbányászat
Balogh Kitti: Szövegbányászat
 
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
 
Kisvilágunk, a nyelv
Kisvilágunk, a nyelvKisvilágunk, a nyelv
Kisvilágunk, a nyelv
 
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszédBalogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti - Szűcs Krisztina: Képes beszéd
 
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzésekBalogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
 
Érzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzésÉrzelmek hálójában – hálózat- és tartalomelemzés
Érzelmek hálójában – hálózat- és tartalomelemzés
 
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...Szabó - Varjú: Automatikus  értékelés- és érzelemelemzés magyar nyelvű szöveg...
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
 
Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)Mókus (Koncsik Anita, Varjú Zoltán)
Mókus (Koncsik Anita, Varjú Zoltán)
 
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
 
Sorok között olvasni
Sorok között olvasniSorok között olvasni
Sorok között olvasni
 
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
 
Rasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útjaRasztik Zita: A стартовать jövevényszó fejlődési útja
Rasztik Zita: A стартовать jövevényszó fejlődési útja
 
Kontextus és a hivatkozások ereje
Kontextus és a hivatkozások erejeKontextus és a hivatkozások ereje
Kontextus és a hivatkozások ereje
 

Nlp és termékfejlesztés

  • 1. NLP és termékfejlesztés VARJÚ ZOLTÁN, PRECOGNOX 2014.11.18. @ CEU MICRODATA
  • 2. Mi vár ránk? • Hírelemző • Rapid prototyping • Hogyan dolgozunk mi • Python és NLTK • Hogyan szeretnénk majd dolgozni a jövőben
  • 4. A projektről  Belső projekt  Gyakornokok dolgoznak rajta (Kulcsár Ádám, Fodor Mánuel)  Szakdolgozati téma és saját játszótér  (Automatikus) tartalomelemzés  Korpusznyelvészet (keywords, kollokációk, konkordanicák, stb.)  R-index és nowcasting irodalom ihlette rendszer
  • 7. Célok  Korpusznyelvészet == szógyakorisági vizsgálatok  Tartalomelemzés == szótárak használata  Szentiment- és emócióelemzés == szótárak használata  Predikció  Szemantikus technológiák  Faceted search  Semantic search  Szótárak automatikus kiegészítése
  • 10. UIMA
  • 14. Rapid prototyping • Gyorsan valami használhatót élesben • A prototípus maga a termék nulladik verziója
  • 15. Miért?  A csapat online kommunikál  Budapest, Kaposvár, Hódmezővásárhely, Szikszó között nehéz megoldani a folyamatos élő kapcsolatokat  „kézzel fogható” dologról beszéljünk  „olcsón” tudjunk hibázni
  • 16. Rapid prototyping és K+F Prototípus == Specifikáció Működő prototípus == tesztesetek a „rendes” terméknek
  • 17. Hogyan dolgozunk? 1) Adatok Áltlában Python segítségével hozzuk „emészthető” formára és/vagy gyűjtjük be 2) Felfedezés Milyen módszerek jöhetnek szóba? R és Python segítségével gyors próba, tipikus „spaghetti code” 3) Prototípus Egy, vagy több működő módszer rendesebb implementálása A lehető legtöbb általunk használt eszközzel szeretjük megépíteni
  • 19. Miért Python?  Futtatható pszeudo-kód  Könnyen megtanulják a kutatók, tudják olvasni a fejlesztők  Wraper-ek a legtöbb általunk használt eszközökhöz (boilerpipe, Solr, Weka)  SciPy  scikit-learn  pandas  NLTK  Hy
  • 20. Toby Segaran Programming Collective Intelligence Programming the Semantic Web
  • 21. NLTK Natural Language Toolkit  Minden benne van  Ingyenes könyv  Tanítási célra íródott  Jurafsky – Martin és Manning – Schütze érthető vele  Standard módon alakítható igényeinkhez
  • 23. A Java és a Python legjobb része a VM! Főnevek helyett igék, OOP helyett funkcionális programozás Közelebb a probléma formális leírásához Konceptuálisan átláthatóbb Párhuzamos és elosztott rendszereké a jövő
  • 24. Clojure és Hy  Hy – Lisp dialektus a Python VM-re  Clojure – modern Lisp a JVM-re  Clojure Incanter – R stílusú, funkcionális statisztikai programozási környezet
  • 25. Funkcionális programozás – a jövő  Egyszerűbb a kutatónak  Minimalizálja a prototípus és a kész termék elkészítése közötti időt  Elmosódnak a prototípus és a termék határai, szabadon alakíthatja a fejlesztő és a kutató csapat  Minsky – Weeks: Caml trading – experiences with functional programming on Wall Street
  • 26. Kérdés? @zoltanvarju @varjuzoli zoltan.varju@precognox.com http://kereses.blog.hu/