Sentimen analisis menggunakan text mining sosial media Twitter sebagai kontrol pasar pariwisata Indonesia. Studi kasus menganalisis sentimen terhadap 10 destinasi wisata populer di Indonesia dengan mengambil data dari Twitter, melakukan klasifikasi sentimen menggunakan metode Naive Bayes, dan menampilkan hasil visualisasi.
2. 1.Kebutuhan Sentiment Analysis
2.Text Mining untuk Sentiment Analysis
3.Pengolahan kata Text Mining menggunakan Machine
Learning
4.Studi Kasus Sentiment Analysis
Overview
4. Social Media
Berbagi
Informasi
Opini Publik
Peran
Pengawasan
• Meningkatnya penggunaan social
media di masyarakat, berdampak
pada bertambahnya peran
berbagi infromasi di ruang
public, yang selanjutnya
menyebabkan berkembangnya
opini publik.
• Kemudian hal tersebut
dimanfaatkan menggunakan
metoda tertentu untuk tujuan
pengawasan terhadap suatu
objek.
Kebutuhan Sentiment Analysis
5. SentimenAnalisis adalah jenis natural language yaitu
pengolahan kata untuk melacak mood masyarakat tentang
produk atau topik tertentu.Analisis sentimen, disebut opinion
mining.
Definisi Sentiment Analysis
(G.Vinodhini, M.Chandrasekaran 2012)
8. Pemilihah Sumber data
Untuk sentiment.
Pemilihan harus
berdasar pada kegunaan
sosmed.
•Ada fasilitas Repost yang memiliki
istilah Reshared, jadi kita langsung
bisa mengutip sebuah status dari
teman yang ada pada circle kita.
Ini mirip seperti Retweet di Twitter
•-Atur status Status yang kita buat
bisa diatur apakah itu tidak boleh
dishare kembali atau tidak boleh
dikomentari.
G+
•media bisnis online melalui jaringan
pertemanan yang telah dimiliki.
•-Upload gambar mudah, dan bisa dibuat
album foto.
•-Terdapat aplikasi chat yang membuat
pangguna yang sedang online bisa chat
dengan temannya yang sedang online juga.
•-Pengguna bisa membuat/bergabung
dengan group
kesukaan/hobi/bisnis/pertemanan yang
memungkinkan pembagian informasi lebih
spesifik, mudah, dan tepat sasaran.
Facebook
•Menjangkau tidak hanya antara teman,
tetapi komunikasi antara artis dengan fans-
nya juga menjadi lebih mudah.
•-Komunikasi di twitter terjadi sangat cepat.
Sering terjadi berita-berita terupdate,
seperti terjadinya suatu bencana misalnya,
lebih dahulu didapatkan infonya melalui
twitter.
•-Terdapat fitur trending topic yang
memungkinkan kita untuk mengetahui apa
saja yang sedang in atau happening
dibicarakan oleh para pengguna twitter.
•-Dapat memasarkan produk secara geratis.
Twitter
•Memperindah foto kita
•bisa menshare video
•memasarkan produk atau
berjualan online
Instagram
•sharing apa saja yang kita mau,
maupun itu lagu, curhatan, foto,
tempat/lokasi kita berada.
•Path bersifat privasi, tidak seperti
facebook dan twitter
•Path memiliki 8 Free Filter Lenses
utk mempercantik foto/video
Path
http://suckrockers.blogspot.co.id/20
13/12/sosial-media-beserta-
kelebihan-dan.html
Pemilihan Sumber Data (Sosmed)
9. Text Mining untuk Sentiment
Analysis
Goals:
Audience mengerti dan memahami apa yang
dimassud dengan tText Mining
11. • Komputational
• Visualisasi
Statistika
• Machine
Learning
Artificial
Intelleigence
• Asosiasi
• Sekuensial
Pattern
Recognition
• Basis Data
Basis Data
Definisi Text Mining
Text mining mengacu pada pencarian
informasi, pertambangan data, mesin-
learning, statistik, dan komputasi
linguistic terhadap informasi yang
disimpan sebagai teks(Bridge, C 2011).
12. Proses Text Mining
Data
Teks
Tokenisaisi
Sentimen
Positif
Algoritma Machine
Learning
Sentimen
Negatif
End
Input Proses Output
Twitter data
Autentifikasi
berdasarkan
Token akun
Ekstrak
berdasarkan
filter
Data Preparation
Visualisasi
sentimen
analisisdalam
Bentuk grafik
13. WEB Mining
•mengekstraksi kata kunci yang
terkandung pada dokumen web. Isi
data web antara lain dapat berupa
teks, citra, audio, video, metadata,
dan hyperlink.
Web Content
Mining
•struktur link dari hyperlink
•Membangun rangkuman website dan
halaman web.
•Salah satu manfaatnya adlah
untuk menentukan pagerank pada
suatu halaman web
Web Structure
Mining
•teknik untuk mengenali perilaku
pelanggan dan struktur web melalui
informasi yang diperoleh dari log, click
stream, cookies, dan query
Web Usage
Mining
14. Pengolahan Text Mining
menggunakan Machine-Learning
Goals:
Audience mengetahui konsep Machine –Learning,
Tugas, Cara kerja dan Algoritma Machine Learning
16. Tugas Sederhana Tugas rumit
Capaian yang diinginkan Jelas Jelas
Uraiancapaian Dapat dirinci Sulit dirinci
Cara mencapai Prosedur
rumus
Memperkirakan
Coba-coba
Sifat capaian eksak Kira-kira
Cara di komputer Pemrograman, algoritma
konvensional
Machine learning
Tugas Sederhana & Tugas Rumit
17. Tugas Sederhana VS Tugas
Rumit
– Kelulusan Siswa
– Profit/Lost
– Suku Bunga Deposito
– Menentukan kadar gula dalam darah
– Prediksi harga saham
– Menentukan kalimat positif dan
negatif
– Keindahan Gunung Bromo sangat
mempesona
– Penduduk disekitar taman nasional
gunung bromo baik dan ramah
– Fasilitas dibukit pananjakan kurang
memadai
– Gunung Bromo banjir pengunjung
– Fasilitas di tempat itu tidak jelek
– Keindahan bukit mandalika selama
ini tidak banyak yang tau
18. – Regresi
Input kontinyu/diskrit, output kontinyu, dengan target
spesifik
– Klasifikasi
Input kontinyu/diskrit,outputdiskrit, dengan target spesifik
– Clustering
Input kontinyu/diskrit,outputdiskrit, dengan target terbuka
Jenis Tugas Machine-Learning
22. R- Package Sentiment (classify)
R menyediakan library sentiment dalam R package yang di
buat oleh Timothy Jurka. Dalam package sentiment ini
berfungsi dua fungsi yaitu classify_emotion dan
classify_polarity.
• classify_emotion. Fungsi ini membantu
mengklasifikasikan emotion kedalam beberapa klasifikasi
yaitu: anger, fear, joy, sadness and supprise.
• classify_polarity. Mengkasifikasikan kedalam respon
positive, negative dan neutral.
23. teknik analisis sentimen dapat diklasifikasikan ke dalam dua kategori:
• Lexicon based: Teknik ini bergantung pada kamus kata yang
dijelaskan dengan orientasi, digambarkan sebagai polaritas
positive, negative dan netral. Metode ini memberikan hasil presisi
tinggi selama leksikon digunakan memiliki cakupan yang baik dari
kata-kata yang dihadapi dalam teks yang dianalisis.
• Learning Based: Teknik ini memerlukan pelatihan classifier dengan
contoh polaritas dikenal disajikan sebagai teks diklasifikasikan ke
dalam kelas yang positif, negatif dan netral.
Teknik Analisis Sentiment
25. Sentimen Analisis Menggunakan Text
Mining Social Media Twitter sebagai
Controling Pasar Pariwisata Indonesia
Goals: Audience turut berpartisipasi aktif
dalam Studi Kasus
27. Twitter
Naïve
bayes
Visualisasi
Data social media twitter dengan filter 10
destinasi wisata yang akan diprioritaskan
yaitu:
1. Danau Toba,
2. Tanjung Kelayang,
3. Kepulauan Seribu,
4. Tanjung Lesung,
5. Borobudur
6. Tamana Nasional Bromo-Tengger-
Semeru,
7. Mandalika,
8. Wakataobi,
9. Labuan Bajo dan
10.Pulau Morotai.
Ruang Lingkup Studi Kasus
29. Mengapa
Digunakan R ??
– R adalah bahasa pemrograman dan perangkat lunak untuk
analisis statistikadan grafik
– Kode sumbernya tersedia secara bebas di bawah Lisensi Publik
Umum GNU, dan versi biner prekompilasinya tersedia untuk berbagai
sistem operasi
– R menggunakan antarmuka baris perintah,
– R menyediakan berbagai teknik statistika (permodelan linier dan
nonlinier, uji statistik klasik, analisis deret waktu, klasifikasi,
klasterisasi,dan sebagainya)
Tool