Permodelan Topik Menggunakan Latent Dirichlet Allocation

Permodelan Topik Menggunakan
Latent Dirichlet Allocation
pada Tweet @kompas.com
oleh
15.11.9382 | 15.11.9379 | 15.11.9353 | 15.11.9362

Permodelan Topik
Topic Modeling adalah proses untuk
secara otomatis mengidentifikasi
topik yang ada dalam objek teks dan
untuk mendapatkan pola tersembunyi
yang ditunjukkan oleh korpus[1]
teks. Dengan demikian, membantu
pengambilan keputusan yang lebih
baik.
[1]Korpus (corpus) adalah bagian dari pustaka teks elektronik, tetapi korpus dibangun dengan
kreteria untuk tujuan khusus. Korpus dalam bentuk jamak disebut korpora (corpora)

Latent Dirichlet Allocation (LDA)
Latent Dirichlet Allocation atau LDA merupakan algoritma
untuk mendeteksi topik melalui permodelan probabilistik dalam
sekumpulan data. LDA mengasumsikan setiap dokumen memiliki
topik dan dibentuk dari kata-kata yang berkaitan dengan topik
tersebut, sehingga suatu dokumen dapat direpresentasikan
sebagai campuran dari topik topik tersembunyi dengan proporsi
yang berbeda-beda.

Latent Dirichlet Allocation
Algoritme pertama adalah
menginisiasi parameter, seperti:
jumlah dokumen, banyak kata dalam
sebuah dokumen, jumlah topik,
jumlah iterasi, dan koefisien LDA.

Inisialisasi Parameter
Langkah selanjutnya adalah menandai
sebuah kata dengan topik yang telah
ditentukan secara semi random
distribution yang berdasarkan
distribusi dirichlet. Dalam sebuah
dokumen terdapat semua topik.

Inisialisasi pemberian topic secara acak
Selanjutnya adalah tahap iterasi,
di mana akan dihasilkan parameter
yang dapat menentukan distribusi
dari jumlah topik dalam dokumen dan
juga distribusi kata dari topik.
Hal inilah yang akan terus
dievaluasi untuk mengukur seberapa
lazim sebuah kata terhadap topik
tersebut. Selain itu juga untuk
melihat seberapa lazim topik
tersebut berada dalam sebuah
dokumen.

Permodelan Topik Menggunakan Latent Dirichlet Allocation

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Permodelan Topik Menggunakan Latent Dirichlet Allocation

Similar to Permodelan Topik Menggunakan Latent Dirichlet Allocation (18)

More from David Rigan

More from David Rigan (8)

Recently uploaded

Recently uploaded (20)

Permodelan Topik Menggunakan Latent Dirichlet Allocation

Editor's Notes