SlideShare a Scribd company logo
1 of 93
Download to read offline
LINGUISTIK KOMPUTASI
SENJATA AHLI BAHASA DI
ERA DIGITAL
Ismail Fahmi, Ph.D.
Director Media Kernels Indonesia (Drone Emprit)
Lecturer at the University of Islam Indonesia
Ismail.fahmi@gmail.com
SEMINAR LINGUISTIK UNAS
29 OKTOBER 2021
UNIVERSITAS NASIONAL
2
1992 – 1997 S1, Teknik Elektro, ITB
2003 – 2004 S2, Information Science, Universitas Groningen, Belanda
2004 – 2009 S3, Information Science, Universitas Groningen, Belanda
2000 – 2003 Inisiator IndonesiaDLN (Digital Library Network pertama di Indonesia)
Mengembangkan Ganesha Digital Library (GDL)
Mendirikan Knowledge Management Research Group (KMRG) ITB
Membangun Digital Library ITB
2009 – Sekarang Engineer di Weborama, Perusahaan berbasis big data (Paris/Amsterdam)
2014 – Sekarang Founder PT. Media Kernels Indonesia, a Drone Emprit Company
2015 – Sekarang Konsultan Perpustakaan Nasional, Inisiator Indonesia OneSearch
2017 – Sekarang Dosen Tetap Magister Teknik Informatika Universitas Islam Indonesia
Ismail Fahmi, Ph.D.
Ismail.fahmi@gmail.com
Lahir: Bojonegoro, 1974
Founder Media Kernels Indonesia
AGENDA
• Machine Learning dan Text Mining
• Arsitektur sistem
• Topik penelitian
• Tools
• Tahapan dalam pengembangan sistem
• Bidang pekerjaan
• Implementasi dalam Drone Emprit
3
TENTANG DRONE EMPRIT
MATA NAJWA LIVE ‘HOAX VIRUSES’
5
confidential
#ILC SOCIAL MEDIA WAR (21 AUGUST 2018)
6
PRESIDENTIAL ELECTION DEBATE 2019
7
8
COMMAND CENTER AIS KOMINFO RI
9
COMMAND CENTER JAWA BARAT
GUBERNUR JAWA BARAT JADI KAPTEN
10
BIG DATA DI KEMENTERIAN PERTAHANAN
11
UNSTRUCTURED DATA
DATA GROWTH: EXPONENTIAL
13
BIG DATA – BIG GROWTH
14
DATA IS THE NEW GOLD
• Ini benar kalau kita bisa
mengolahnya menjadi insight.
• Ini salah kalau kita “mati gaya”
di depan data, tidak punya ide
bagaimana memanfaatkannya.
• Jadi selain data itu sendiri, kita
perlu seorang “Alchemist”
yang bisa mengubahnya
menjadi “emas.”
• Dia adalah: data scientist.
15
NATURAL LANGUAGE PROCESSING (NLP)
APA ITU NLP?
17
IMPLEMENTASI NLP
18
QUESTION ANSWERING
19
QA SYSTEM
20
TEXT MINING VS TEXT ANALYTICS
APA ITU “TEXT MINING”?
Text mining is an artificial
intelligence (AI) technology that
uses natural language
processing (NLP) to transform
the free (unstructured) text in
documents and databases into
normalized, structured data
suitable for analysis or to drive
machine learning (ML)
algorithms (text analytics).
22
TEXT MINING TEXT ANALYTICS
DEFINISI
23
FRAMEWORK
24
CONTOH PROSES
25
TAHAPAN: TEXT MINING VS TEXT ANALYTICS
TEXT MINING
• Information Retrieval
• Data Preparation and Cleaning
• Segmentation
• Tokenization
• Stop-word numbers and
punctuation removal
• Stemming
• Convert to lowercase
• POS tagging
• Create text corpus
• Term-Document matrix
TEXT ANALYTICS
• Modelling (this may include inferential
models, predictive models or
prescriptive models)
• Training and evaluation of models
• Application of these Models
• Visualizing the Models
26
TEXT PROCESSING
RECOMMENDED BOOK
Speech and Language Processing: An Introduction to
Natural Language Processing, Computational Linguistics
and Speech Recognition
by Dan Jurafsky and James H. Martin
This book offers a unified vision of speech and language
processing covering statistical and symbolic approaches to
language processing, and presents algorithms and
techniques for speech recognition, spelling and grammar
correction, information extraction, search engines,
machine translation, and the creation of spoken-language
dialog agents.
Target readers:
• Beginners in natural language and speech processing
Why it is good:
• The book provides a solid foundational knowledge as it
introduces linguistics, computer science and statistics at
comprehensive depth.
28
TAHAPAN DALAM NLP
29
BASIC TEXT PROCESSING
• Regular Expressions
• Word Tokenization
• Word Normalization and Stemming
• Sentence Segmentation and Decision Trees
30
31
32
33
34
35
36
37
TEXT PROCESSING (MORE)
• Part-of-speech tagging (POS Tagging)
• Named Entity Recognition (NER)
• Dependency Parser
• Spell Checker
• Sentiment Analysis
38
TOOLS TEXT MINING
LIBRARY ARTIFICIAL INTELLIGENCE
40
AKURASI SPARK NLP (UNTUK NER)
41
KEMAMPUAN SPARK NLP DALAM TEXT
PROCESSING
42
SPARK NLP DAN SPARK ML
43
FITUR SPARK NLP
44
CONTOH: NAMED ENTITY RECOGNITION
45
Inisiasi
Input Text
Anotasi (processing)
Tipe output
NER output
CONTOH: ANNOTATION
46
CONTOH: ANNOTATION (2)
47
SENTIMENT ANALYSIS
48
NAMED ENTITY RECOGNITION
49
FUNGSI YANG SUDAH TERSEDIA
50
NLP DI DRONE EMPRIT / MEDIA KERNELS
ARSITEKTUR SISTEM
Ini adalah gambaran
sistem yang digunakan
untuk membangun
Knowledge Explorer
Indonesia OneSearch
(IOS). Khusus untuk IOS,
sumber datanya adalah
fullteks dalam bentuk
teks abstrak dan file PDF
dari artikel jurnal, tesis,
disertasi, dll.
52
TEKNOLOGI NLP
Teknologi yang digunakan untuk mengekstrak
fakta dari teks menggunakan NLP (Natural
Language Processing), yang meliputi proses-
proses berikut:
• Segmentation
• Part-Of-Speech (POS) Tagging
• Automatic Term Recognition (ATR)
• Named Entity Recognition (NER)
• Term Relationship Extraction
• Syntax Analysis (S-P-O)
53
CONTOH: UNSTRUCTURED TEXT
54
KANZ PHILOSOPHIA, Volume 3, Number 2, December 2013 201
KEWALIAN DALAM TASAWUF NUSANTARA
Artikel ini mendiskusikan dokrin Kewalian (al-walāyah) yang mempunyai basis yang kuat
dalam al-Qur’an dan hadis dan isu ini secara sistematis dibahas melalui ajaran Ibn ‘Arabi
yang kompleks.
Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal
bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian,
wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari
kekeramatan dan wali sebagai penguasa wilayah tertentu. Terlepas dari pengertian dan
cakupannya, ajaran kewalian yang sesungguhnya tidak lepas dari ajaran tentang kenabian
dan kerasulan yang menyiratkan pesan bahwa dunia manusia bukan hanya dunia material
yang identik dengan kenikmatan hedonis, tetapi di balik dunia fi sik terdapat dunia metafi
sik yang belum banyak diketahui manusia dan dari sanalah dunia fisik ini dikendalikan.
Kata-kata Kunci : wali, karamah, Nur Muhammad, kewalian, kenabian, penutup para wali
Fakultas Ushuluddin, UIN Syarif Hidayatullah. E-mail : yunasrilali@ymail.com
SEGMENTATION: PARAGRAPH
55
=====page1=====
-----------par----------
KANZ PHILOSOPHIA, Volume 3, Number 2, December 2013 201
-----------par----------
KEWALIAN DALAM TASAWUF NUSANTARA
-----------par----------
Artikel ini mendiskusikan dokrin Kewalian (al-walāyah) yang mempunyai basis yang kuat dalam al-
Qur’an dan hadis dan isu ini secara sistematis dibahas melalui ajaran Ibn ‘Arabi yang kompleks.
-----------par----------
Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal bersamaan
dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian, wali sebagai orang
yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari kekeramatan dan wali sebagai
penguasa wilayah tertentu. Terlepas dari pengertian dan cakupannya, ajaran kewalian yang
sesungguhnya tidak lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan
bahwa dunia manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi
di balik dunia fi sik terdapat dunia metafi sik yang belum banyak diketahui manusia dan dari
sanalah dunia fi sik ini dikendalikan.
-----------par----------
Kata-kata Kunci : wali, karamah, Nur Muhammad, kewalian, kenabian, penutup para wali 1 Fakultas
Ushuluddin, UIN Syarif Hidayatullah. E-mail : yunasrilali@ymail.com
SEGMENTATION: SENTENCE
56
-----------par----------
Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal
bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua
pengertian, wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai
implikasi dari kekeramatan dan wali sebagai penguasa wilayah tertentu.
Terlepas dari pengertian dan cakupannya, ajaran kewalian yang sesungguhnya tidak
lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan bahwa dunia
manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi
di balik dunia fisik terdapat dunia metafi sik yang belum banyak diketahui manusia dan
dari sanalah dunia fisik ini dikendalikan.
PART-OF-SPEECH TAGGING
57
----------- par ----------
Sementara_SC dalam_IN kajian_NN tasawuf_VB di_IN Nusantara_NNP ,_Z sebutan_NN
wali_NN ini_PR sudah_MD mulai_VB dikenal_VB bersamaan_VB dengan_IN masuknya_X
Islam_NNP ke_IN negeri_NN ini_PR yang_SC mengacu_VB kepada_IN dua_CD
pengertian_NN ,_Z wali_NN sebagai_IN orang_NN yang_SC memiliki_VB kesaktian-
kesaktian_NN -LRB-_-LRB- occulties_FW -RRB-_-RRB- sebagai_IN implikasi_NN dari_IN
kekeramatan_NN dan_CC wali_NN sebagai_IN penguasa_NN wilayah_NN tertentu_PR ._Z
Terlepas_VB dari_IN pengertian_NN dan_CC cakupannya_NN ,_Z ajaran_NN kewalian_NN
yang_SC sesungguhnya_RB tidak_NEG lepas_VB dari_IN ajaran_NN tentang_IN
kenabian_NN dan_CC kerasulan_NN yang_SC menyiratkan_VB pesan_NN bahwa_SC
dunia_NN manusia_NN bukan_NEG hanya_RB dunia_NN material_NN yang_SC identik_JJ
dengan_SC kenikmatan_NN hedonis_JJ ,_Z tetapi_CC di_IN balik_NN dunia_NN fi_X sik_X
terdapat_VB dunia_NN metafi_VB sik_X yang_SC belum_NEG banyak_CD diketahui_VB
manusia_NN dan_CC dari_IN sanalah_NN dunia_NN fi_X sik_X ini_PR dikendalikan_VB ._Z
S-P-O TRIPLE
Grafik di kanan ini adalah tree-map, dari
relasi subyek, predikat, dan obyek yang
berhasil diekstrak dari fullteks.
Manfaat dari tree map ini adalah
pengguna bisa mendapat insight
dengan cepat tentang:
• Aktor person, organisasi, konsep
(subyek)
• Aktifitas terkait dengan aktor
• Obyek atau related entitis terkait
aktivitas subyek.
58
S
P
O
CO-OCCURRENCE ANTAR KONSEP
• Menampilkan aktor, lokasi, dan istilah
penting yang sering muncul
bersamaan (dalam kalimat atau
paragraph yang sama).
• Co-occurrence menjadi indikasi
adanya korelasi yang kuat antar pelaku
dan istilah.
• Namun, jenis korelasinya apa, belum
bisa dilihat di sini.
59
DIRECTED GRAPH
Grafik ini menghubungkan
Subyek dan Obyek yang
saling berhubungan
melalui predikat. Dalam
grafik, predikat
ditampilkan sebagai garis
yang memiliki anak panah,
dari subyek ke obyek.
Relasi antar S dan O
dalam sebuah knowledge
base yang besar bisa
memperlihatkan relasi
dalam lingkup yang lebih
besar.
60
FACTMINER DRONE EMPRIT
DIAGRAM SISTEM
62
Berita Online
Natural
Language
Processing
Engine
Person, Organization,
Location, Time,
S-P-O Relationship
Laporan Internal
Dokumen Lainnya
Semantic
Search
Engine
Visualization
CONTOH PENCARIAN: DEMO, UNJUK RASA
63
Tren “demo atau unjuk rasa” selama tahun 2020 hingga hari ini. Kecenderungan naik mulai bulan Mei 2020.
Siapa tokoh dalam berita dan organisasi diekstrak dari dokumen.
ENTITAS PERISTIWA, WAKTU, DAN LOKASI
64
Selain tokoh dan organisasi, FactMiner juga mengekstrak peristiwa dalam berita, waktu, dan lokasi.
CONTOH FAKTA DARI ARTIKEL
65
Dalam kalimat mana di dokumen sumber terdapat kata kunci yang dicari.
EKSPLORASI PERISTIWA DALAM DOKUMEN
66
Subyek
Predikat
Obyek
Contoh:
Subyek = buruh
Predikat = menolak
Obyek = sebagian
besar tentang
Omnibus Law, UU
Cilaka, Kenaikan
BPJS
CONTOH: MAHASISWA MENOLAK
67
Subyek
Predikat
Obyek
SEBARAN PERISTIWA DEMO DI INDONESIA
68
CONTOH DETAIL BERITA DI “MALUKU UTARA”
69
CONTOH DETAIL BERITA DI “PAPUA BARAT”
70
MELIHAT CO-OCCURRENCE ANTARA SUBYEK-
OBYEK
71
EKSPLORASI GRAPH DARI RELASI S-P-O
72
ZOOM “FERDINAND”, LALU “EXPAND”
73
SENTIMENT ANALYSIS
SENTIMENT ANALYSIS
75
Positif
Negatif
Netral
?
MENTIONS
SENTIMENT ANALYSIS
76
Positif
?
MENTIONS
Untuk Setya Novanto
SENTIMENT ANALYSIS
77
Negatif
?
MENTIONS
Untuk KPK
SENTIMENT ANALYSIS
78
Netral
?
MENTIONS
Untuk Hakim Cepi Iskandar
EVALUASI
79
http://www.sciencedirect.com/science/article/pii/S2090447914000550
”one model for all” tidak bisa
memberi label yang tepat untuk
setiap subyek.
Lexicon base tergantung dari
keberadaan kata dalam kamus sentimen,
tidak bisa memberi label yang tepat
untuk subyek yang berbeda.
SENTIMENT ANALYSIS TOOLS
80
https://breakthroughanalysis.com/2012/01/08/what-are-
the-most-powerful-open-source-sentiment-analysis-tools/
Text Mining
Module
SENTIMENT ANALYSIS: DRONE EMPRIT
81
Adaptive Multiple Models
REGEX: EMOTION ANALYSIS
MENGGALI LEBIH DALAM EMOSI PUBLIK DALAM
PERCAKAPAN
• Secara kolosal, dari semua perakapan, kita bisa melihat tren emosi
publik terhadap sebuah isu tertentu.
• Dengan analisis emosi ini, kita bisa tahu:
• Apakah publik cenderung: percaya, tidak percaya, takut, senang, sedih,
marah, jijik, terkejut, atau penuh harapan?
• Apa yang membuat publik merasa percaya, takut, atau marah?
• Bagaimana tren emosi tertentu, dihubungkan dengan peristiwa yang
tengah terjadi?
• Untuk mengetahui emosi publik kita bisa menggunakan:
83
PLUTCHIK’S WHEEL OF EMOTIONS
84
https://www.6seconds.org/2017/04/27/plu
tchiks-model-of-emotions/
LEXICON BASED ANALYSIS
• JOY
• senang, bahagia, suka, seneng, hepi, menyenangkan, happy,
menggembirakan, gembira, fun, sukacita, riang, ceria, …
• TRUST
• FEAR
• SURPRISE
• SADNESS
• DISGUST
• ANGER
• ANTICIPATION
85
EMOSI: TIDAK YAKIN DENGAN KESIAPAN SARANA &
LAYANAN KESEHATAN, KURVA BELUM TURUN
86
Tidak yakin, karena:
• Kasus korona masih tinggi
(misal Surabaya).
• Negara lain mulai saat kurva
melandai, Indonesia masih naik.
• Potensi gelombang ke-2
corona.
• Jumlah test masih kecil.
• Seperti perang tanpa senjata.
Kasus korona masih
tinggi
Kurva masih naik
Potensi gelombang
kedua
Test masih kecil
Perang tanpa
senjata
TREN EMOSI
87
Tidak disiplin
Perlu sosialisasi dulu Kurva masih naik
Selamatkan Ekonomi
Kesiapan BUMN
TOPIK PENELITIAN
SOME TOPICS
• Question Answering System
• Extracting Terms from Text
• Extracting Term Variation
• Extracting Synonyms
• Extracting Abbreviations
• Learning and Extracting Relations
• Identifying Definitional Sentences Using Machine Learning
• Hoax Detection
• Sentiment Analysis
• Emotion Analysis
• Named Entity Recognition
• Etc
89
MY DISSERTATION
90
SITASI DRONE EMPRIT
HOW TO CITE DRONE EMPRIT?
For Drone Emprit Academic
If you use data directly from Drone Emprit Academic dashboard
(academic.droneemprit.id), use this citation:
Fahmi, I. (2018). Drone Emprit Academic: Software for social media monitoring and
analytics. Available at http://dea.uii.ac.id.
For Drone Emprit
If you use data from Ismail Fahmi's analyses shared on the Internet
(Twitter, Facebook, or Slideshare), use this citation:
Fahmi, I. (2016). Drone Emprit: Software for media monitoring and analytics.
Available at http://pers.droneemprit.id.
92
Source:
https://pers.droneemprit.id/how-to-cite-drone-emprit/
THANK YOU
Ismail Fahmi, PhD.

More Related Content

Similar to Linguistik Komputasi Era Digital

Analisis Teks Media Sosial dan Online
Analisis Teks Media Sosial dan OnlineAnalisis Teks Media Sosial dan Online
Analisis Teks Media Sosial dan OnlineIsmail Fahmi
 
Machine Learning, Text Mining, dan Text Analytics
Machine Learning, Text Mining, dan Text AnalyticsMachine Learning, Text Mining, dan Text Analytics
Machine Learning, Text Mining, dan Text AnalyticsIsmail Fahmi
 
Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography Analysis
Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography AnalysisJeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography Analysis
Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography AnalysisIsmail Fahmi
 
Manual Explorer Indonesia OneSearch
Manual Explorer Indonesia OneSearchManual Explorer Indonesia OneSearch
Manual Explorer Indonesia OneSearchIsmail Fahmi
 
Indonesia OneSearch dan Biblio Metric Analysis
Indonesia OneSearch dan Biblio Metric AnalysisIndonesia OneSearch dan Biblio Metric Analysis
Indonesia OneSearch dan Biblio Metric AnalysisIsmail Fahmi
 
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network Analysis
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network AnalysisMembaca Peta di Media Sosial Melalui Analisa Teks dan Social Network Analysis
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network AnalysisIsmail Fahmi
 
Ki kd tkj kelas x xi dan xii
Ki kd tkj kelas x xi dan xiiKi kd tkj kelas x xi dan xii
Ki kd tkj kelas x xi dan xiiheri baskoro
 
manajemen pengetahuan - Lecture 8 perangkat manajemen pengetahuan
manajemen pengetahuan - Lecture 8 perangkat manajemen pengetahuanmanajemen pengetahuan - Lecture 8 perangkat manajemen pengetahuan
manajemen pengetahuan - Lecture 8 perangkat manajemen pengetahuanRobin Yonathan
 
Media and Institutional Branding (for Academic)
Media and Institutional Branding (for Academic)Media and Institutional Branding (for Academic)
Media and Institutional Branding (for Academic)Ismail Fahmi
 
ARTIFICAL INTELLIGENCE.pptx
ARTIFICAL INTELLIGENCE.pptxARTIFICAL INTELLIGENCE.pptx
ARTIFICAL INTELLIGENCE.pptxyudis4ntoso
 
Makalah: Semantic Web
Makalah: Semantic WebMakalah: Semantic Web
Makalah: Semantic WebBachrul Ilmi
 
Knowledge management tools
Knowledge management toolsKnowledge management tools
Knowledge management toolsdiniwidyani
 
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESSISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESHaris Pramudia
 
Pertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxPertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxErfianCOC
 
Indonesia OneSearch (IOS) – versi 2
Indonesia OneSearch (IOS) – versi 2Indonesia OneSearch (IOS) – versi 2
Indonesia OneSearch (IOS) – versi 2Ismail Fahmi
 
Sistem berbasis pengetahuan 2
Sistem berbasis pengetahuan 2Sistem berbasis pengetahuan 2
Sistem berbasis pengetahuan 2mantap bana yaung
 
Slide-INF401-KECERDASAN-BUATAN-PERTEMUAN-1.pptx
Slide-INF401-KECERDASAN-BUATAN-PERTEMUAN-1.pptxSlide-INF401-KECERDASAN-BUATAN-PERTEMUAN-1.pptx
Slide-INF401-KECERDASAN-BUATAN-PERTEMUAN-1.pptxAgusGremory
 
Rifai-Presentasi KI LL2Dikti-5.pptx
Rifai-Presentasi KI LL2Dikti-5.pptxRifai-Presentasi KI LL2Dikti-5.pptx
Rifai-Presentasi KI LL2Dikti-5.pptxssuser258b3a
 

Similar to Linguistik Komputasi Era Digital (20)

Analisis Teks Media Sosial dan Online
Analisis Teks Media Sosial dan OnlineAnalisis Teks Media Sosial dan Online
Analisis Teks Media Sosial dan Online
 
Machine Learning, Text Mining, dan Text Analytics
Machine Learning, Text Mining, dan Text AnalyticsMachine Learning, Text Mining, dan Text Analytics
Machine Learning, Text Mining, dan Text Analytics
 
Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography Analysis
Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography AnalysisJeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography Analysis
Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography Analysis
 
Manual Explorer Indonesia OneSearch
Manual Explorer Indonesia OneSearchManual Explorer Indonesia OneSearch
Manual Explorer Indonesia OneSearch
 
Indonesia OneSearch dan Biblio Metric Analysis
Indonesia OneSearch dan Biblio Metric AnalysisIndonesia OneSearch dan Biblio Metric Analysis
Indonesia OneSearch dan Biblio Metric Analysis
 
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network Analysis
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network AnalysisMembaca Peta di Media Sosial Melalui Analisa Teks dan Social Network Analysis
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network Analysis
 
Perbedaan deep learn
Perbedaan deep learnPerbedaan deep learn
Perbedaan deep learn
 
Ki kd tkj kelas x xi dan xii
Ki kd tkj kelas x xi dan xiiKi kd tkj kelas x xi dan xii
Ki kd tkj kelas x xi dan xii
 
manajemen pengetahuan - Lecture 8 perangkat manajemen pengetahuan
manajemen pengetahuan - Lecture 8 perangkat manajemen pengetahuanmanajemen pengetahuan - Lecture 8 perangkat manajemen pengetahuan
manajemen pengetahuan - Lecture 8 perangkat manajemen pengetahuan
 
Media and Institutional Branding (for Academic)
Media and Institutional Branding (for Academic)Media and Institutional Branding (for Academic)
Media and Institutional Branding (for Academic)
 
ARTIFICAL INTELLIGENCE.pptx
ARTIFICAL INTELLIGENCE.pptxARTIFICAL INTELLIGENCE.pptx
ARTIFICAL INTELLIGENCE.pptx
 
Makalah: Semantic Web
Makalah: Semantic WebMakalah: Semantic Web
Makalah: Semantic Web
 
Knowledge management tools
Knowledge management toolsKnowledge management tools
Knowledge management tools
 
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESSISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
 
Pertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptxPertemuan 1 - Konsep Dasar IR.pptx
Pertemuan 1 - Konsep Dasar IR.pptx
 
Pertemuan 10
Pertemuan 10Pertemuan 10
Pertemuan 10
 
Indonesia OneSearch (IOS) – versi 2
Indonesia OneSearch (IOS) – versi 2Indonesia OneSearch (IOS) – versi 2
Indonesia OneSearch (IOS) – versi 2
 
Sistem berbasis pengetahuan 2
Sistem berbasis pengetahuan 2Sistem berbasis pengetahuan 2
Sistem berbasis pengetahuan 2
 
Slide-INF401-KECERDASAN-BUATAN-PERTEMUAN-1.pptx
Slide-INF401-KECERDASAN-BUATAN-PERTEMUAN-1.pptxSlide-INF401-KECERDASAN-BUATAN-PERTEMUAN-1.pptx
Slide-INF401-KECERDASAN-BUATAN-PERTEMUAN-1.pptx
 
Rifai-Presentasi KI LL2Dikti-5.pptx
Rifai-Presentasi KI LL2Dikti-5.pptxRifai-Presentasi KI LL2Dikti-5.pptx
Rifai-Presentasi KI LL2Dikti-5.pptx
 

More from Ismail Fahmi

HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...
HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...
HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...Ismail Fahmi
 
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024Ismail Fahmi
 
Different Frontiers of Social Media War in Indonesia Elections 2024
Different Frontiers of Social Media War in Indonesia Elections 2024Different Frontiers of Social Media War in Indonesia Elections 2024
Different Frontiers of Social Media War in Indonesia Elections 2024Ismail Fahmi
 
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINE
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINEANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINE
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINEIsmail Fahmi
 
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024Ismail Fahmi
 
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024Ismail Fahmi
 
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO 5-12 FEBRUARI 2024
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO  5-12 FEBRUARI 2024TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO  5-12 FEBRUARI 2024
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO 5-12 FEBRUARI 2024Ismail Fahmi
 
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024Ismail Fahmi
 
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024Ismail Fahmi
 
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024Ismail Fahmi
 
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024Ismail Fahmi
 
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024Ismail Fahmi
 
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024Ismail Fahmi
 
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS - TWITTER 3 – 4 Februari 2024
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS  - TWITTER 3 – 4 Februari 2024ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS  - TWITTER 3 – 4 Februari 2024
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS - TWITTER 3 – 4 Februari 2024Ismail Fahmi
 
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024Ismail Fahmi
 
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024Ismail Fahmi
 
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024Ismail Fahmi
 
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024Ismail Fahmi
 
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAM
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAMMUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAM
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAMIsmail Fahmi
 
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02Ismail Fahmi
 

More from Ismail Fahmi (20)

HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...
HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...
HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...
 
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024
 
Different Frontiers of Social Media War in Indonesia Elections 2024
Different Frontiers of Social Media War in Indonesia Elections 2024Different Frontiers of Social Media War in Indonesia Elections 2024
Different Frontiers of Social Media War in Indonesia Elections 2024
 
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINE
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINEANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINE
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINE
 
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024
 
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024
 
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO 5-12 FEBRUARI 2024
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO  5-12 FEBRUARI 2024TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO  5-12 FEBRUARI 2024
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO 5-12 FEBRUARI 2024
 
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024
 
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
 
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
 
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024
 
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024
 
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024
 
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS - TWITTER 3 – 4 Februari 2024
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS  - TWITTER 3 – 4 Februari 2024ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS  - TWITTER 3 – 4 Februari 2024
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS - TWITTER 3 – 4 Februari 2024
 
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024
 
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024
 
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024
 
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024
 
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAM
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAMMUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAM
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAM
 
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02
 

Linguistik Komputasi Era Digital

  • 1. LINGUISTIK KOMPUTASI SENJATA AHLI BAHASA DI ERA DIGITAL Ismail Fahmi, Ph.D. Director Media Kernels Indonesia (Drone Emprit) Lecturer at the University of Islam Indonesia Ismail.fahmi@gmail.com SEMINAR LINGUISTIK UNAS 29 OKTOBER 2021 UNIVERSITAS NASIONAL
  • 2. 2 1992 – 1997 S1, Teknik Elektro, ITB 2003 – 2004 S2, Information Science, Universitas Groningen, Belanda 2004 – 2009 S3, Information Science, Universitas Groningen, Belanda 2000 – 2003 Inisiator IndonesiaDLN (Digital Library Network pertama di Indonesia) Mengembangkan Ganesha Digital Library (GDL) Mendirikan Knowledge Management Research Group (KMRG) ITB Membangun Digital Library ITB 2009 – Sekarang Engineer di Weborama, Perusahaan berbasis big data (Paris/Amsterdam) 2014 – Sekarang Founder PT. Media Kernels Indonesia, a Drone Emprit Company 2015 – Sekarang Konsultan Perpustakaan Nasional, Inisiator Indonesia OneSearch 2017 – Sekarang Dosen Tetap Magister Teknik Informatika Universitas Islam Indonesia Ismail Fahmi, Ph.D. Ismail.fahmi@gmail.com Lahir: Bojonegoro, 1974 Founder Media Kernels Indonesia
  • 3. AGENDA • Machine Learning dan Text Mining • Arsitektur sistem • Topik penelitian • Tools • Tahapan dalam pengembangan sistem • Bidang pekerjaan • Implementasi dalam Drone Emprit 3
  • 5. MATA NAJWA LIVE ‘HOAX VIRUSES’ 5 confidential
  • 6. #ILC SOCIAL MEDIA WAR (21 AUGUST 2018) 6
  • 8. 8 COMMAND CENTER AIS KOMINFO RI
  • 10. GUBERNUR JAWA BARAT JADI KAPTEN 10
  • 11. BIG DATA DI KEMENTERIAN PERTAHANAN 11
  • 14. BIG DATA – BIG GROWTH 14
  • 15. DATA IS THE NEW GOLD • Ini benar kalau kita bisa mengolahnya menjadi insight. • Ini salah kalau kita “mati gaya” di depan data, tidak punya ide bagaimana memanfaatkannya. • Jadi selain data itu sendiri, kita perlu seorang “Alchemist” yang bisa mengubahnya menjadi “emas.” • Dia adalah: data scientist. 15
  • 21. TEXT MINING VS TEXT ANALYTICS
  • 22. APA ITU “TEXT MINING”? Text mining is an artificial intelligence (AI) technology that uses natural language processing (NLP) to transform the free (unstructured) text in documents and databases into normalized, structured data suitable for analysis or to drive machine learning (ML) algorithms (text analytics). 22 TEXT MINING TEXT ANALYTICS
  • 26. TAHAPAN: TEXT MINING VS TEXT ANALYTICS TEXT MINING • Information Retrieval • Data Preparation and Cleaning • Segmentation • Tokenization • Stop-word numbers and punctuation removal • Stemming • Convert to lowercase • POS tagging • Create text corpus • Term-Document matrix TEXT ANALYTICS • Modelling (this may include inferential models, predictive models or prescriptive models) • Training and evaluation of models • Application of these Models • Visualizing the Models 26
  • 28. RECOMMENDED BOOK Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition by Dan Jurafsky and James H. Martin This book offers a unified vision of speech and language processing covering statistical and symbolic approaches to language processing, and presents algorithms and techniques for speech recognition, spelling and grammar correction, information extraction, search engines, machine translation, and the creation of spoken-language dialog agents. Target readers: • Beginners in natural language and speech processing Why it is good: • The book provides a solid foundational knowledge as it introduces linguistics, computer science and statistics at comprehensive depth. 28
  • 30. BASIC TEXT PROCESSING • Regular Expressions • Word Tokenization • Word Normalization and Stemming • Sentence Segmentation and Decision Trees 30
  • 31. 31
  • 32. 32
  • 33. 33
  • 34. 34
  • 35. 35
  • 36. 36
  • 37. 37
  • 38. TEXT PROCESSING (MORE) • Part-of-speech tagging (POS Tagging) • Named Entity Recognition (NER) • Dependency Parser • Spell Checker • Sentiment Analysis 38
  • 41. AKURASI SPARK NLP (UNTUK NER) 41
  • 42. KEMAMPUAN SPARK NLP DALAM TEXT PROCESSING 42
  • 43. SPARK NLP DAN SPARK ML 43
  • 45. CONTOH: NAMED ENTITY RECOGNITION 45 Inisiasi Input Text Anotasi (processing) Tipe output NER output
  • 50. FUNGSI YANG SUDAH TERSEDIA 50
  • 51. NLP DI DRONE EMPRIT / MEDIA KERNELS
  • 52. ARSITEKTUR SISTEM Ini adalah gambaran sistem yang digunakan untuk membangun Knowledge Explorer Indonesia OneSearch (IOS). Khusus untuk IOS, sumber datanya adalah fullteks dalam bentuk teks abstrak dan file PDF dari artikel jurnal, tesis, disertasi, dll. 52
  • 53. TEKNOLOGI NLP Teknologi yang digunakan untuk mengekstrak fakta dari teks menggunakan NLP (Natural Language Processing), yang meliputi proses- proses berikut: • Segmentation • Part-Of-Speech (POS) Tagging • Automatic Term Recognition (ATR) • Named Entity Recognition (NER) • Term Relationship Extraction • Syntax Analysis (S-P-O) 53
  • 54. CONTOH: UNSTRUCTURED TEXT 54 KANZ PHILOSOPHIA, Volume 3, Number 2, December 2013 201 KEWALIAN DALAM TASAWUF NUSANTARA Artikel ini mendiskusikan dokrin Kewalian (al-walāyah) yang mempunyai basis yang kuat dalam al-Qur’an dan hadis dan isu ini secara sistematis dibahas melalui ajaran Ibn ‘Arabi yang kompleks. Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian, wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari kekeramatan dan wali sebagai penguasa wilayah tertentu. Terlepas dari pengertian dan cakupannya, ajaran kewalian yang sesungguhnya tidak lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan bahwa dunia manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi di balik dunia fi sik terdapat dunia metafi sik yang belum banyak diketahui manusia dan dari sanalah dunia fisik ini dikendalikan. Kata-kata Kunci : wali, karamah, Nur Muhammad, kewalian, kenabian, penutup para wali Fakultas Ushuluddin, UIN Syarif Hidayatullah. E-mail : yunasrilali@ymail.com
  • 55. SEGMENTATION: PARAGRAPH 55 =====page1===== -----------par---------- KANZ PHILOSOPHIA, Volume 3, Number 2, December 2013 201 -----------par---------- KEWALIAN DALAM TASAWUF NUSANTARA -----------par---------- Artikel ini mendiskusikan dokrin Kewalian (al-walāyah) yang mempunyai basis yang kuat dalam al- Qur’an dan hadis dan isu ini secara sistematis dibahas melalui ajaran Ibn ‘Arabi yang kompleks. -----------par---------- Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian, wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari kekeramatan dan wali sebagai penguasa wilayah tertentu. Terlepas dari pengertian dan cakupannya, ajaran kewalian yang sesungguhnya tidak lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan bahwa dunia manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi di balik dunia fi sik terdapat dunia metafi sik yang belum banyak diketahui manusia dan dari sanalah dunia fi sik ini dikendalikan. -----------par---------- Kata-kata Kunci : wali, karamah, Nur Muhammad, kewalian, kenabian, penutup para wali 1 Fakultas Ushuluddin, UIN Syarif Hidayatullah. E-mail : yunasrilali@ymail.com
  • 56. SEGMENTATION: SENTENCE 56 -----------par---------- Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian, wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari kekeramatan dan wali sebagai penguasa wilayah tertentu. Terlepas dari pengertian dan cakupannya, ajaran kewalian yang sesungguhnya tidak lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan bahwa dunia manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi di balik dunia fisik terdapat dunia metafi sik yang belum banyak diketahui manusia dan dari sanalah dunia fisik ini dikendalikan.
  • 57. PART-OF-SPEECH TAGGING 57 ----------- par ---------- Sementara_SC dalam_IN kajian_NN tasawuf_VB di_IN Nusantara_NNP ,_Z sebutan_NN wali_NN ini_PR sudah_MD mulai_VB dikenal_VB bersamaan_VB dengan_IN masuknya_X Islam_NNP ke_IN negeri_NN ini_PR yang_SC mengacu_VB kepada_IN dua_CD pengertian_NN ,_Z wali_NN sebagai_IN orang_NN yang_SC memiliki_VB kesaktian- kesaktian_NN -LRB-_-LRB- occulties_FW -RRB-_-RRB- sebagai_IN implikasi_NN dari_IN kekeramatan_NN dan_CC wali_NN sebagai_IN penguasa_NN wilayah_NN tertentu_PR ._Z Terlepas_VB dari_IN pengertian_NN dan_CC cakupannya_NN ,_Z ajaran_NN kewalian_NN yang_SC sesungguhnya_RB tidak_NEG lepas_VB dari_IN ajaran_NN tentang_IN kenabian_NN dan_CC kerasulan_NN yang_SC menyiratkan_VB pesan_NN bahwa_SC dunia_NN manusia_NN bukan_NEG hanya_RB dunia_NN material_NN yang_SC identik_JJ dengan_SC kenikmatan_NN hedonis_JJ ,_Z tetapi_CC di_IN balik_NN dunia_NN fi_X sik_X terdapat_VB dunia_NN metafi_VB sik_X yang_SC belum_NEG banyak_CD diketahui_VB manusia_NN dan_CC dari_IN sanalah_NN dunia_NN fi_X sik_X ini_PR dikendalikan_VB ._Z
  • 58. S-P-O TRIPLE Grafik di kanan ini adalah tree-map, dari relasi subyek, predikat, dan obyek yang berhasil diekstrak dari fullteks. Manfaat dari tree map ini adalah pengguna bisa mendapat insight dengan cepat tentang: • Aktor person, organisasi, konsep (subyek) • Aktifitas terkait dengan aktor • Obyek atau related entitis terkait aktivitas subyek. 58 S P O
  • 59. CO-OCCURRENCE ANTAR KONSEP • Menampilkan aktor, lokasi, dan istilah penting yang sering muncul bersamaan (dalam kalimat atau paragraph yang sama). • Co-occurrence menjadi indikasi adanya korelasi yang kuat antar pelaku dan istilah. • Namun, jenis korelasinya apa, belum bisa dilihat di sini. 59
  • 60. DIRECTED GRAPH Grafik ini menghubungkan Subyek dan Obyek yang saling berhubungan melalui predikat. Dalam grafik, predikat ditampilkan sebagai garis yang memiliki anak panah, dari subyek ke obyek. Relasi antar S dan O dalam sebuah knowledge base yang besar bisa memperlihatkan relasi dalam lingkup yang lebih besar. 60
  • 62. DIAGRAM SISTEM 62 Berita Online Natural Language Processing Engine Person, Organization, Location, Time, S-P-O Relationship Laporan Internal Dokumen Lainnya Semantic Search Engine Visualization
  • 63. CONTOH PENCARIAN: DEMO, UNJUK RASA 63 Tren “demo atau unjuk rasa” selama tahun 2020 hingga hari ini. Kecenderungan naik mulai bulan Mei 2020. Siapa tokoh dalam berita dan organisasi diekstrak dari dokumen.
  • 64. ENTITAS PERISTIWA, WAKTU, DAN LOKASI 64 Selain tokoh dan organisasi, FactMiner juga mengekstrak peristiwa dalam berita, waktu, dan lokasi.
  • 65. CONTOH FAKTA DARI ARTIKEL 65 Dalam kalimat mana di dokumen sumber terdapat kata kunci yang dicari.
  • 66. EKSPLORASI PERISTIWA DALAM DOKUMEN 66 Subyek Predikat Obyek Contoh: Subyek = buruh Predikat = menolak Obyek = sebagian besar tentang Omnibus Law, UU Cilaka, Kenaikan BPJS
  • 68. SEBARAN PERISTIWA DEMO DI INDONESIA 68
  • 69. CONTOH DETAIL BERITA DI “MALUKU UTARA” 69
  • 70. CONTOH DETAIL BERITA DI “PAPUA BARAT” 70
  • 71. MELIHAT CO-OCCURRENCE ANTARA SUBYEK- OBYEK 71
  • 72. EKSPLORASI GRAPH DARI RELASI S-P-O 72
  • 73. ZOOM “FERDINAND”, LALU “EXPAND” 73
  • 79. EVALUASI 79 http://www.sciencedirect.com/science/article/pii/S2090447914000550 ”one model for all” tidak bisa memberi label yang tepat untuk setiap subyek. Lexicon base tergantung dari keberadaan kata dalam kamus sentimen, tidak bisa memberi label yang tepat untuk subyek yang berbeda.
  • 81. SENTIMENT ANALYSIS: DRONE EMPRIT 81 Adaptive Multiple Models
  • 83. MENGGALI LEBIH DALAM EMOSI PUBLIK DALAM PERCAKAPAN • Secara kolosal, dari semua perakapan, kita bisa melihat tren emosi publik terhadap sebuah isu tertentu. • Dengan analisis emosi ini, kita bisa tahu: • Apakah publik cenderung: percaya, tidak percaya, takut, senang, sedih, marah, jijik, terkejut, atau penuh harapan? • Apa yang membuat publik merasa percaya, takut, atau marah? • Bagaimana tren emosi tertentu, dihubungkan dengan peristiwa yang tengah terjadi? • Untuk mengetahui emosi publik kita bisa menggunakan: 83
  • 84. PLUTCHIK’S WHEEL OF EMOTIONS 84 https://www.6seconds.org/2017/04/27/plu tchiks-model-of-emotions/
  • 85. LEXICON BASED ANALYSIS • JOY • senang, bahagia, suka, seneng, hepi, menyenangkan, happy, menggembirakan, gembira, fun, sukacita, riang, ceria, … • TRUST • FEAR • SURPRISE • SADNESS • DISGUST • ANGER • ANTICIPATION 85
  • 86. EMOSI: TIDAK YAKIN DENGAN KESIAPAN SARANA & LAYANAN KESEHATAN, KURVA BELUM TURUN 86 Tidak yakin, karena: • Kasus korona masih tinggi (misal Surabaya). • Negara lain mulai saat kurva melandai, Indonesia masih naik. • Potensi gelombang ke-2 corona. • Jumlah test masih kecil. • Seperti perang tanpa senjata. Kasus korona masih tinggi Kurva masih naik Potensi gelombang kedua Test masih kecil Perang tanpa senjata
  • 87. TREN EMOSI 87 Tidak disiplin Perlu sosialisasi dulu Kurva masih naik Selamatkan Ekonomi Kesiapan BUMN
  • 89. SOME TOPICS • Question Answering System • Extracting Terms from Text • Extracting Term Variation • Extracting Synonyms • Extracting Abbreviations • Learning and Extracting Relations • Identifying Definitional Sentences Using Machine Learning • Hoax Detection • Sentiment Analysis • Emotion Analysis • Named Entity Recognition • Etc 89
  • 92. HOW TO CITE DRONE EMPRIT? For Drone Emprit Academic If you use data directly from Drone Emprit Academic dashboard (academic.droneemprit.id), use this citation: Fahmi, I. (2018). Drone Emprit Academic: Software for social media monitoring and analytics. Available at http://dea.uii.ac.id. For Drone Emprit If you use data from Ismail Fahmi's analyses shared on the Internet (Twitter, Facebook, or Slideshare), use this citation: Fahmi, I. (2016). Drone Emprit: Software for media monitoring and analytics. Available at http://pers.droneemprit.id. 92 Source: https://pers.droneemprit.id/how-to-cite-drone-emprit/