Submit Search
Upload
AH 4.5
•
0 likes
•
238 views
K
Keith Jones
Follow
Report
Share
Report
Share
1 of 10
Download now
Download to read offline
Recommended
Ch 4.2
Ch 4.2
Keith Jones
AH Ch 2.3
AH Ch 2.3
Keith Jones
Ch 4.1
Ch 4.1
Keith Jones
WBTS Ch 2
WBTS Ch 2
Keith Jones
WBTS Ch 4
WBTS Ch 4
Keith Jones
Martina tantványa
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Zoltan Varju
Breve y sencillo tutorial para aprender uso básico de espacios de la plataforma LMS Blackboard
Tutorial sobre uso básico de herramientas y espacios de Blackboard
Tutorial sobre uso básico de herramientas y espacios de Blackboard
Edith GC
Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Zoltan Varju
Recommended
Ch 4.2
Ch 4.2
Keith Jones
AH Ch 2.3
AH Ch 2.3
Keith Jones
Ch 4.1
Ch 4.1
Keith Jones
WBTS Ch 2
WBTS Ch 2
Keith Jones
WBTS Ch 4
WBTS Ch 4
Keith Jones
Martina tantványa
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Zoltan Varju
Breve y sencillo tutorial para aprender uso básico de espacios de la plataforma LMS Blackboard
Tutorial sobre uso básico de herramientas y espacios de Blackboard
Tutorial sobre uso básico de herramientas y espacios de Blackboard
Edith GC
Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Zoltan Varju
Kürt Akadémia
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatban
Zoltan Varju
Adatelemzés
Balogh Kitti: Szövegbányászat
Balogh Kitti: Szövegbányászat
Zoltan Varju
This is a seminar presentation for ARIN6912, Digital Research and Publishing. The basis of the presentation is the article by Nicholas Carr entitled 'Is Google making us stupid', published in The Atlantic Monthly Jul/Aug 2008. Illustrations from the in-class presentation have been removed (Slides 2 and 6).
The Internet, thinking and knowledge
The Internet, thinking and knowledge
bmwi
A Magyar WordNet (HuWN) a Princeton WordNet elveit követve a nyelvi fogalmakat szinonimahalmazokkal (synsetekkel) reprezentálja és közöttük szemantikai viszonyokat definiálva (pl. hipernima (is-a), meronima (rész-egész), antonima stb.) hoz létre egy lexikális fogalmi hálózatot. Noha a wordnetekben a nyelvi fogalmak közötti taxonómia nem felel meg egy szigorú formális ontológia követelményeinek, az NLP különböző alkalmazásaiban mégis gyakran használják őket világismereti reprezentáció forrásaként. A Magyar WordNet 42 ezer synsetet tartalmaz, és össze van kapcsolva az angol (Princeton) WordNet 2.0-ás és 3.0-s verzióival, ami átjárást biztosít több mint 20 egyéb nyelv wordnetjeihez, illetve az angol wordnethez illeszkedő egyéb adatbázisokhoz (Yago, DBPedia, BabelNet stb.). A HuWN szabadon hozzáférhető.
Miháltz Márton: Magyar wordnet
Miháltz Márton: Magyar wordnet
Zoltan Varju
A szövegekben található információk hatékony kinyeréséhez számos nyelvi jelenséget tudnunk kell kezelni, mint például tulajdonnevek és névelemek, többszavas kifejezések, nyelvi bizonytalanság és szubjektivitás. Az előadásban bemutatjuk azokat a Szegeden készült korpuszokat, amelyek különböző doménekből és nyelvekből származó szövegeket tartalmaznak, és bennük nyelvész szakértők kézzel megjelölték az előbb említett jelenségeket, így tanító és tesztadatbázisként szolgálhatnak az információkinyerő rendszerek különböző moduljaihoz.
Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben
Zoltan Varju
Az előadásban bemutatjuk a Szeged Korpusz és Treebank nevű adatbázist, mely a maga 1,2 millió szavával a legnagyobb, teljes egészében kézzel annotált, magyar nyelvű szövegkorpusz. A korpusz hét különböző doménből származó szövegeket foglal magában, ezek számos annotációs réteggel rendelkeznek: megtalálható bennük az egyes szövegszavak összes lehetséges, illetve a kontextusnak megfelelő morfológiai kódja, minden egyes mondathoz hozzá van rendelve annak szintaktikai szerkezete kétféle elméleti keret szerint is, továbbá szemantikai jellegű annotációk is találhatók egyes részkorpuszokban.
Vincze Veronika: A Szeged Korpusz és Treebank
Vincze Veronika: A Szeged Korpusz és Treebank
Zoltan Varju
Beszéd és érzelemdetektálás
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
Zoltan Varju
Meltwater is a Business Intelligence company of +1000 individuals spread across ~60 offices in ~30 countries with over 26,000 clients. At Meltwater we see ourselves as a Outside Insights company, meaning we seek to deliver similar type of business analytics & insights as traditional CRM dashboards and ERP systems used to, except by leveraging data outside the firewall (social media, news, blogs etc.) we believe the insights can be much more decisive and predictive for our clients business. Part of the challenge with this is of course structuring the unstructured data out there. This is why the Data Science team at Meltwater has the mission to ingest, categorize, label, classify, and a whole range of other enrichments on the content that we crawl in order to index it properly in our big data architecture and make it available for our insights dashboard. We do these enrichments in +17 languages. Babak Rasolzadeh is the Director of Data Science & NLP at Meltwater and has a team of 24 engineers on this team. Prior to Meltwater, Babak was the co-founder of OculusAI, a computer vision start-up in Sweden, that was sold to Meltwater in 2013. He holds a PhD in Computer Vision, from KTH in Sweden, and has worked on things ranging from self-driving cars to humanoid robots and mobile object recognition. He is an advisor for several startups here in US and Sweden.
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entities
Zoltan Varju
“Az elektronikus hálózat révén az emberek teljesen bevonódnak egymás életébe. Közvetlenül és szakadatlan ömlik ránk az információ, melyet alighogy feldolgoztunk, máris követ az új, aztán még újabb adag.Elektronikussá alakított világunk arra sarkall bennünket, hogy kategorizáló szokásunkat mintázatfelismerő eljárásra cseréljük.” McLuhan már 1967-ben felhívta a figyelmet arra, hogy elárasztanak minket az információk, pedig akkor még nem voltak se blogok, se híroldalak, se közösségi média. Az, hogy az olvasó szelektálja mit olvas, s ez a szelekció mintegy burokba zárja őt, egyre ismertebb. Minket az érdekel hogy a tartalmak előállítói is saját világukban élnek-e? Kikre hivatkoznak a hírek szerzői és a politikai blogok véleményvezérei? Van-e átjárás a megannyi politkai nézetet valló szerző között? Hatnak-e egymásra azok, akik a közvéleményt formálják? A Nyelv és Tudománnyal elindított projektünk során 12 121 posztot/cikket gyűjtöttünk be. Vizsgálataink során a klasszikus linkelemzést (pl. PageRank, be- és kimenő élek száma, stb.) szeretnénk a tartalomelemzés módszereivel ötvözni, s olyan kérdésekre megtalálni a választ mint: milyen témák foglalkoztatják a híroldalakat és blogokat honnét indul el egy-egy téma hogyan terjed egy téma
Textus; szövegek hálójában
Textus; szövegek hálójában
Zoltan Varju
A Pázmány Péter Katolikus Egyetem Bölcsészet- és Társadalomtudományi Kara (PPKE BTK), a Pázmány Péter Katolikus Egyetem Információs Technológiai és Bionikai Kara (PPKE ITK) és a Magyar Alkalmazott Nyelvészek és Nyelvtanárok Egyesülete (MANYE) 2015. március 30. és április 1. között a PPKE ITK-n (1083 Budapest, Práter utca 50/a) rendezte meg a 25. MAGYAR ALKALMAZOTT NYELVÉSZETI KONGRESSZUST. A tudományos konferencia a Nyelv – Nyelvtechnológia – Nyelvpedagógia: 21. századi távlatok központi téma köré szerveződött. A Precognox az emócióelemzést célzó projektjének újabb eredményeit egy előadás keretében mutatta be, míg a szentimentelemzéssel kapcsolatos munkánkat poszteren prezentáltuk.
Szabó - Vincze - Morvay: Magyar nyelvű szövegek emócióelemzésénekelméleti és...
Szabó - Vincze - Morvay: Magyar nyelvű szövegek emócióelemzésénekelméleti és...
Zoltan Varju
WBTS 6.2
WBTS 6.2
Keith Jones
WBTS 6.2
WBTS 6.2
Keith Jones
AH 4.4
AH 4.4
Keith Jones
WBTS Ch 6.1
WBTS Ch 6.1
Keith Jones
Ch 4.3
Ch 4.3
Keith Jones
WBTS Ch 5
WBTS Ch 5
Keith Jones
Wbts05
Wbts05
Keith Jones
AH 2.2
AH 2.2
Keith Jones
WBTS Ch 3
WBTS Ch 3
Keith Jones
AH CH 2.1
AH CH 2.1
Keith Jones
AH Ch 1-2
AH Ch 1-2
Keith Jones
Hon AH Ch 1-1
Hon AH Ch 1-1
Keith Jones
More Related Content
Viewers also liked
Kürt Akadémia
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatban
Zoltan Varju
Adatelemzés
Balogh Kitti: Szövegbányászat
Balogh Kitti: Szövegbányászat
Zoltan Varju
This is a seminar presentation for ARIN6912, Digital Research and Publishing. The basis of the presentation is the article by Nicholas Carr entitled 'Is Google making us stupid', published in The Atlantic Monthly Jul/Aug 2008. Illustrations from the in-class presentation have been removed (Slides 2 and 6).
The Internet, thinking and knowledge
The Internet, thinking and knowledge
bmwi
A Magyar WordNet (HuWN) a Princeton WordNet elveit követve a nyelvi fogalmakat szinonimahalmazokkal (synsetekkel) reprezentálja és közöttük szemantikai viszonyokat definiálva (pl. hipernima (is-a), meronima (rész-egész), antonima stb.) hoz létre egy lexikális fogalmi hálózatot. Noha a wordnetekben a nyelvi fogalmak közötti taxonómia nem felel meg egy szigorú formális ontológia követelményeinek, az NLP különböző alkalmazásaiban mégis gyakran használják őket világismereti reprezentáció forrásaként. A Magyar WordNet 42 ezer synsetet tartalmaz, és össze van kapcsolva az angol (Princeton) WordNet 2.0-ás és 3.0-s verzióival, ami átjárást biztosít több mint 20 egyéb nyelv wordnetjeihez, illetve az angol wordnethez illeszkedő egyéb adatbázisokhoz (Yago, DBPedia, BabelNet stb.). A HuWN szabadon hozzáférhető.
Miháltz Márton: Magyar wordnet
Miháltz Márton: Magyar wordnet
Zoltan Varju
A szövegekben található információk hatékony kinyeréséhez számos nyelvi jelenséget tudnunk kell kezelni, mint például tulajdonnevek és névelemek, többszavas kifejezések, nyelvi bizonytalanság és szubjektivitás. Az előadásban bemutatjuk azokat a Szegeden készült korpuszokat, amelyek különböző doménekből és nyelvekből származó szövegeket tartalmaznak, és bennük nyelvész szakértők kézzel megjelölték az előbb említett jelenségeket, így tanító és tesztadatbázisként szolgálhatnak az információkinyerő rendszerek különböző moduljaihoz.
Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben
Zoltan Varju
Az előadásban bemutatjuk a Szeged Korpusz és Treebank nevű adatbázist, mely a maga 1,2 millió szavával a legnagyobb, teljes egészében kézzel annotált, magyar nyelvű szövegkorpusz. A korpusz hét különböző doménből származó szövegeket foglal magában, ezek számos annotációs réteggel rendelkeznek: megtalálható bennük az egyes szövegszavak összes lehetséges, illetve a kontextusnak megfelelő morfológiai kódja, minden egyes mondathoz hozzá van rendelve annak szintaktikai szerkezete kétféle elméleti keret szerint is, továbbá szemantikai jellegű annotációk is találhatók egyes részkorpuszokban.
Vincze Veronika: A Szeged Korpusz és Treebank
Vincze Veronika: A Szeged Korpusz és Treebank
Zoltan Varju
Beszéd és érzelemdetektálás
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
Zoltan Varju
Meltwater is a Business Intelligence company of +1000 individuals spread across ~60 offices in ~30 countries with over 26,000 clients. At Meltwater we see ourselves as a Outside Insights company, meaning we seek to deliver similar type of business analytics & insights as traditional CRM dashboards and ERP systems used to, except by leveraging data outside the firewall (social media, news, blogs etc.) we believe the insights can be much more decisive and predictive for our clients business. Part of the challenge with this is of course structuring the unstructured data out there. This is why the Data Science team at Meltwater has the mission to ingest, categorize, label, classify, and a whole range of other enrichments on the content that we crawl in order to index it properly in our big data architecture and make it available for our insights dashboard. We do these enrichments in +17 languages. Babak Rasolzadeh is the Director of Data Science & NLP at Meltwater and has a team of 24 engineers on this team. Prior to Meltwater, Babak was the co-founder of OculusAI, a computer vision start-up in Sweden, that was sold to Meltwater in 2013. He holds a PhD in Computer Vision, from KTH in Sweden, and has worked on things ranging from self-driving cars to humanoid robots and mobile object recognition. He is an advisor for several startups here in US and Sweden.
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entities
Zoltan Varju
“Az elektronikus hálózat révén az emberek teljesen bevonódnak egymás életébe. Közvetlenül és szakadatlan ömlik ránk az információ, melyet alighogy feldolgoztunk, máris követ az új, aztán még újabb adag.Elektronikussá alakított világunk arra sarkall bennünket, hogy kategorizáló szokásunkat mintázatfelismerő eljárásra cseréljük.” McLuhan már 1967-ben felhívta a figyelmet arra, hogy elárasztanak minket az információk, pedig akkor még nem voltak se blogok, se híroldalak, se közösségi média. Az, hogy az olvasó szelektálja mit olvas, s ez a szelekció mintegy burokba zárja őt, egyre ismertebb. Minket az érdekel hogy a tartalmak előállítói is saját világukban élnek-e? Kikre hivatkoznak a hírek szerzői és a politikai blogok véleményvezérei? Van-e átjárás a megannyi politkai nézetet valló szerző között? Hatnak-e egymásra azok, akik a közvéleményt formálják? A Nyelv és Tudománnyal elindított projektünk során 12 121 posztot/cikket gyűjtöttünk be. Vizsgálataink során a klasszikus linkelemzést (pl. PageRank, be- és kimenő élek száma, stb.) szeretnénk a tartalomelemzés módszereivel ötvözni, s olyan kérdésekre megtalálni a választ mint: milyen témák foglalkoztatják a híroldalakat és blogokat honnét indul el egy-egy téma hogyan terjed egy téma
Textus; szövegek hálójában
Textus; szövegek hálójában
Zoltan Varju
A Pázmány Péter Katolikus Egyetem Bölcsészet- és Társadalomtudományi Kara (PPKE BTK), a Pázmány Péter Katolikus Egyetem Információs Technológiai és Bionikai Kara (PPKE ITK) és a Magyar Alkalmazott Nyelvészek és Nyelvtanárok Egyesülete (MANYE) 2015. március 30. és április 1. között a PPKE ITK-n (1083 Budapest, Práter utca 50/a) rendezte meg a 25. MAGYAR ALKALMAZOTT NYELVÉSZETI KONGRESSZUST. A tudományos konferencia a Nyelv – Nyelvtechnológia – Nyelvpedagógia: 21. századi távlatok központi téma köré szerveződött. A Precognox az emócióelemzést célzó projektjének újabb eredményeit egy előadás keretében mutatta be, míg a szentimentelemzéssel kapcsolatos munkánkat poszteren prezentáltuk.
Szabó - Vincze - Morvay: Magyar nyelvű szövegek emócióelemzésénekelméleti és...
Szabó - Vincze - Morvay: Magyar nyelvű szövegek emócióelemzésénekelméleti és...
Zoltan Varju
Viewers also liked
(10)
Szövegbányászat a gyakorlatban
Szövegbányászat a gyakorlatban
Balogh Kitti: Szövegbányászat
Balogh Kitti: Szövegbányászat
The Internet, thinking and knowledge
The Internet, thinking and knowledge
Miháltz Márton: Magyar wordnet
Miháltz Márton: Magyar wordnet
Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: Korpuszok az információkinyerésben
Vincze Veronika: A Szeged Korpusz és Treebank
Vincze Veronika: A Szeged Korpusz és Treebank
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
Babak Rasolzadeh: The importance of entities
Babak Rasolzadeh: The importance of entities
Textus; szövegek hálójában
Textus; szövegek hálójában
Szabó - Vincze - Morvay: Magyar nyelvű szövegek emócióelemzésénekelméleti és...
Szabó - Vincze - Morvay: Magyar nyelvű szövegek emócióelemzésénekelméleti és...
More from Keith Jones
WBTS 6.2
WBTS 6.2
Keith Jones
WBTS 6.2
WBTS 6.2
Keith Jones
AH 4.4
AH 4.4
Keith Jones
WBTS Ch 6.1
WBTS Ch 6.1
Keith Jones
Ch 4.3
Ch 4.3
Keith Jones
WBTS Ch 5
WBTS Ch 5
Keith Jones
Wbts05
Wbts05
Keith Jones
AH 2.2
AH 2.2
Keith Jones
WBTS Ch 3
WBTS Ch 3
Keith Jones
AH CH 2.1
AH CH 2.1
Keith Jones
AH Ch 1-2
AH Ch 1-2
Keith Jones
Hon AH Ch 1-1
Hon AH Ch 1-1
Keith Jones
WBTS CH 1
WBTS CH 1
Keith Jones
AH Ch 1.1
AH Ch 1.1
Keith Jones
More from Keith Jones
(14)
WBTS 6.2
WBTS 6.2
WBTS 6.2
WBTS 6.2
AH 4.4
AH 4.4
WBTS Ch 6.1
WBTS Ch 6.1
Ch 4.3
Ch 4.3
WBTS Ch 5
WBTS Ch 5
Wbts05
Wbts05
AH 2.2
AH 2.2
WBTS Ch 3
WBTS Ch 3
AH CH 2.1
AH CH 2.1
AH Ch 1-2
AH Ch 1-2
Hon AH Ch 1-1
Hon AH Ch 1-1
WBTS CH 1
WBTS CH 1
AH Ch 1.1
AH Ch 1.1
Download now