Dokumen tersebut membahas tentang Natural Language Processing (NLP) yang merupakan bidang ilmu komputer yang berfokus pada interaksi antara komputer dengan bahasa alami manusia. Dokumen tersebut menjelaskan tujuan dari NLP untuk memahami bahasa alami, komponen-komponen NLP seperti sintaksis, semantik, dan tag part of speech, serta tantangan yang dihadapi dalam NLP seperti ambiguitas bahasa.
Week 1 Natural Language Processing IntroductionSARCCOM
Here are some of the key challenges in Natural Language Processing:
- Ambiguity at all levels of language:
- Lexical ambiguity (a word having multiple meanings) depending on context. For example, in the sentence "Kemarin dia datang memberi tahu", the word "tahu" could mean "information" or the food "tofu".
- Syntactic ambiguity where the structure of a sentence can have more than one parse. For example, in "Cahyo mengejar anak itu dengan mobil sedan", it's not clear if Cahyo chased the child with a sedan car or if the sedan car was being chased.
- Semantic ambiguity where the
Pemrograman non prosedural adalah paradigma pemrograman yang tidak memerlukan penulisan logika tradisional. Bahasa non prosedural seperti Prolog menentukan 'apa yang akan diselesaikan' daripada 'bagaimana' seperti bahasa prosedural. Prolog populer untuk sistem pakar dan pengenalan pola karena mampu menggunakan penalaran untuk menyelesaikan masalah.
[JANGAN LUPA UNTUK COMMENT dan masukannya]
Perkembangan Chatbot dalam Satu Dekade Terakhir
Kali ini merupakan resume paper dari Survey on Chatbot, yang menganalisis perkembangan chatbot dari 2003 hingga 2013 yang mayoritas masih menggunakan AIML dan Pattern Matching.
Paper ini sebagai bantuan anda didalam membaca paper aslinya yang berbahasa Inggris, sehingga membantu anda untuk memahami yang dimaksud oleh paper tersebut.
Dokumen tersebut membahas tentang pengertian kecerdasan buatan, sejarahnya, tujuan, dan perkembangannya hingga saat ini. Beberapa topik utama yang dibahas antara lain definisi kecerdasan buatan, kategori definisinya, basis pengetahuan dan motor inferensi sebagai dua bagian utama kecerdasan buatan, serta perkembangan kecerdasan buatan dari masa ke masa."
Teks tersebut membahas tentang pemodelan bahasa dan pemrosesan bahasa alami dengan menggunakan model probabilitas dan pembelajaran mesin, termasuk model n-gram, GPT, dan BERT. Teks tersebut juga membandingkan pendekatan GPT dan BERT dalam melatih model bahasa.
Week 1 Natural Language Processing IntroductionSARCCOM
Here are some of the key challenges in Natural Language Processing:
- Ambiguity at all levels of language:
- Lexical ambiguity (a word having multiple meanings) depending on context. For example, in the sentence "Kemarin dia datang memberi tahu", the word "tahu" could mean "information" or the food "tofu".
- Syntactic ambiguity where the structure of a sentence can have more than one parse. For example, in "Cahyo mengejar anak itu dengan mobil sedan", it's not clear if Cahyo chased the child with a sedan car or if the sedan car was being chased.
- Semantic ambiguity where the
Pemrograman non prosedural adalah paradigma pemrograman yang tidak memerlukan penulisan logika tradisional. Bahasa non prosedural seperti Prolog menentukan 'apa yang akan diselesaikan' daripada 'bagaimana' seperti bahasa prosedural. Prolog populer untuk sistem pakar dan pengenalan pola karena mampu menggunakan penalaran untuk menyelesaikan masalah.
[JANGAN LUPA UNTUK COMMENT dan masukannya]
Perkembangan Chatbot dalam Satu Dekade Terakhir
Kali ini merupakan resume paper dari Survey on Chatbot, yang menganalisis perkembangan chatbot dari 2003 hingga 2013 yang mayoritas masih menggunakan AIML dan Pattern Matching.
Paper ini sebagai bantuan anda didalam membaca paper aslinya yang berbahasa Inggris, sehingga membantu anda untuk memahami yang dimaksud oleh paper tersebut.
Dokumen tersebut membahas tentang pengertian kecerdasan buatan, sejarahnya, tujuan, dan perkembangannya hingga saat ini. Beberapa topik utama yang dibahas antara lain definisi kecerdasan buatan, kategori definisinya, basis pengetahuan dan motor inferensi sebagai dua bagian utama kecerdasan buatan, serta perkembangan kecerdasan buatan dari masa ke masa."
Teks tersebut membahas tentang pemodelan bahasa dan pemrosesan bahasa alami dengan menggunakan model probabilitas dan pembelajaran mesin, termasuk model n-gram, GPT, dan BERT. Teks tersebut juga membandingkan pendekatan GPT dan BERT dalam melatih model bahasa.
Dokumen tersebut merupakan pengantar pembelajaran mesin yang menjelaskan konsep dasar pembelajaran mesin seperti belajar dari data, algoritma yang digunakan untuk berbagai aplikasi seperti deteksi spam, rekomendasi buku, dan jenis-jenis pembelajaran mesin seperti pembelajaran berbasis konsep, pembelajaran Bayesian, pembelajaran berbasis instance, jaringan saraf, algoritma genetika, dan pembelajaran penguatan.
Dokumen ini membahas tentang pengantar pemrograman berorientasi objek (PBO) dan struktur data. Ia menjelaskan perbedaan antara pemrograman terstruktur dan PBO, serta konsep-konsep utama PBO seperti class, object, encapsulation, inheritance, dan polymorphism. Contoh kode C++ juga diberikan untuk mengilustrasikan konsep inheritance dalam PBO."
Machine Learning, Text Mining, dan Text AnalyticsIsmail Fahmi
Dokumen tersebut membahas tentang machine learning dan text mining. Isi utamanya mencakup definisi, proses, tools, topik riset, dan implementasi dari machine learning dan text mining. Dokumen ini juga menjelaskan tentang arsitektur sistem, tahapan pengembangan sistem, dan contoh penerapan di bidang drone emprit.
Practical Deep Learning for Natural Language ProcessingAinul Yaqin
Seminar dua hari ini membahas pengenalan singkat tentang pemrosesan bahasa alami dan pembelajaran mendalam serta persiapan data dan model teks untuk aplikasi klasifikasi teks dan penerjemahan mesin."
Maaf, saya tidak bisa langsung menyusun state of the art dalam bentuk tabel karena itu melibatkan penelusuran literatur yang signifikan. Berikut ini saya sampaikan beberapa poin penting yang dapat Anda jadikan bahan untuk menyusun state of the art tersebut:
- Topik adopsi chatbot AI sebagai sumber informasi kesehatan semakin banyak diteliti terutama setelah pandemi Covid-19. Chatbot dapat dimanfaatkan untuk menyebarkan informasi ke
Dokumen tersebut membahas tentang data mining dan pengajaran desain pembelajaran. Secara singkat, dokumen tersebut menjelaskan tentang konsep-konsep dasar data mining, algoritma yang digunakan dalam data mining seperti estimasi, prediksi, klasifikasi, dan klastering, serta tahapan proses data mining mulai dari input data hingga evaluasi hasilnya.
Dokumen tersebut merangkum materi perkuliahan Interaksi Manusia dan Komputer selama 18 minggu. Materi utama meliputi prinsip desain berbasis pengguna, analisis tugas, prototyping, dialog, penanganan kesalahan, evaluasi, website, kerjasama berbasis komputer, visualisasi informasi, dan audio user interface. Topik-topik khusus seperti usability, kognisi manusia, dan teknik evaluasi diperkenalkan untuk mendukung pemahaman tentang desain antarmuka
Karya Ilmiah,
dapat di tambahkan dengan api Google Voice.
Untuk aplikasi full dapat mengirim email ke : nico.nandika@gmail.com
dengan menjelaskan di email :
1. Tujuan meminta full aplikasi
2. Nama Anda
3. Background Anda
Sistem informasi enterprise berkaitan dengan desain, perbaikan, dan instalasi sistem terintegrasi yang terdiri atas manusia, material, informasi, energi, dan peralatan untuk mencapai tujuan tertentu. Sistem ini memanfaatkan pengetahuan dan keterampilan khusus dari berbagai bidang ilmu untuk merancang, memprediksi, dan mengevaluasi hasil yang diharapkan dari sistem tersebut.
This document provides instructions for installing Flutter in Visual Studio Code on Windows. It outlines downloading and extracting the Flutter SDK, setting the environment path variable to the Flutter bin folder location, and installing Flutter extensions in VS Code. This allows a developer to create, run, and test mobile applications using Flutter and VS Code.
Dokumen tersebut merupakan pengantar pembelajaran mesin yang menjelaskan konsep dasar pembelajaran mesin seperti belajar dari data, algoritma yang digunakan untuk berbagai aplikasi seperti deteksi spam, rekomendasi buku, dan jenis-jenis pembelajaran mesin seperti pembelajaran berbasis konsep, pembelajaran Bayesian, pembelajaran berbasis instance, jaringan saraf, algoritma genetika, dan pembelajaran penguatan.
Dokumen ini membahas tentang pengantar pemrograman berorientasi objek (PBO) dan struktur data. Ia menjelaskan perbedaan antara pemrograman terstruktur dan PBO, serta konsep-konsep utama PBO seperti class, object, encapsulation, inheritance, dan polymorphism. Contoh kode C++ juga diberikan untuk mengilustrasikan konsep inheritance dalam PBO."
Machine Learning, Text Mining, dan Text AnalyticsIsmail Fahmi
Dokumen tersebut membahas tentang machine learning dan text mining. Isi utamanya mencakup definisi, proses, tools, topik riset, dan implementasi dari machine learning dan text mining. Dokumen ini juga menjelaskan tentang arsitektur sistem, tahapan pengembangan sistem, dan contoh penerapan di bidang drone emprit.
Practical Deep Learning for Natural Language ProcessingAinul Yaqin
Seminar dua hari ini membahas pengenalan singkat tentang pemrosesan bahasa alami dan pembelajaran mendalam serta persiapan data dan model teks untuk aplikasi klasifikasi teks dan penerjemahan mesin."
Maaf, saya tidak bisa langsung menyusun state of the art dalam bentuk tabel karena itu melibatkan penelusuran literatur yang signifikan. Berikut ini saya sampaikan beberapa poin penting yang dapat Anda jadikan bahan untuk menyusun state of the art tersebut:
- Topik adopsi chatbot AI sebagai sumber informasi kesehatan semakin banyak diteliti terutama setelah pandemi Covid-19. Chatbot dapat dimanfaatkan untuk menyebarkan informasi ke
Dokumen tersebut membahas tentang data mining dan pengajaran desain pembelajaran. Secara singkat, dokumen tersebut menjelaskan tentang konsep-konsep dasar data mining, algoritma yang digunakan dalam data mining seperti estimasi, prediksi, klasifikasi, dan klastering, serta tahapan proses data mining mulai dari input data hingga evaluasi hasilnya.
Dokumen tersebut merangkum materi perkuliahan Interaksi Manusia dan Komputer selama 18 minggu. Materi utama meliputi prinsip desain berbasis pengguna, analisis tugas, prototyping, dialog, penanganan kesalahan, evaluasi, website, kerjasama berbasis komputer, visualisasi informasi, dan audio user interface. Topik-topik khusus seperti usability, kognisi manusia, dan teknik evaluasi diperkenalkan untuk mendukung pemahaman tentang desain antarmuka
Karya Ilmiah,
dapat di tambahkan dengan api Google Voice.
Untuk aplikasi full dapat mengirim email ke : nico.nandika@gmail.com
dengan menjelaskan di email :
1. Tujuan meminta full aplikasi
2. Nama Anda
3. Background Anda
Sistem informasi enterprise berkaitan dengan desain, perbaikan, dan instalasi sistem terintegrasi yang terdiri atas manusia, material, informasi, energi, dan peralatan untuk mencapai tujuan tertentu. Sistem ini memanfaatkan pengetahuan dan keterampilan khusus dari berbagai bidang ilmu untuk merancang, memprediksi, dan mengevaluasi hasil yang diharapkan dari sistem tersebut.
This document provides instructions for installing Flutter in Visual Studio Code on Windows. It outlines downloading and extracting the Flutter SDK, setting the environment path variable to the Flutter bin folder location, and installing Flutter extensions in VS Code. This allows a developer to create, run, and test mobile applications using Flutter and VS Code.
Dokumen tersebut membahas tentang SQL (Structured Query Language) yang merupakan bahasa komputer standar untuk mengakses dan memanipulasi database relasional. SQL digunakan untuk membuat, mengubah, dan menghapus database serta tabel, serta menambahkan, mengubah, dan menghapus data dalam tabel tersebut.
Dokumen tersebut membahas tentang kompleksitas algoritma dan efisiensi algoritma. Kompleksitas algoritma diukur berdasarkan jumlah langkah yang dibutuhkan untuk menyelesaikan masalah, yang dapat diukur dalam waktu eksekusi atau ruang memori yang dibutuhkan. Notasi Big-O digunakan untuk mengelompokkan kompleksitas waktu algoritma berdasarkan orde pertumbuhannya sebagai fungsi dari ukuran masukan.
Implementasi basis data menggunakan Microsoft Access untuk memasukkan, mengedit, menghapus, dan mencari data record menggunakan form dan fitur pencarian.
Dokumen tersebut membahas tentang transformasi model Entity Relationship Diagram (ERD) menjadi basis data. Beberapa poin kuncinya adalah: (1) setiap entitas akan diimplementasikan sebagai tabel data, (2) implementasi hubungan 1-1, 1-n, n-m, generalisasi, dan agregasi antar entitas, (3) contoh tabel yang dihasilkan dari transformasi ERD tertentu seperti tabel Dosen, Matakuliah, dan Pasien.
Model Entity Relationship Diagram (ERD) membahas komponen ERD termasuk relasi. Relasi menunjukkan hubungan antar entitas dan dapat berupa unary, binary, atau ternary. Kardinalitas relasi dapat one-to-one, one-to-many, many-to-many. Tahapan pembuatan ERD meliputi mengidentifikasi entitas, atribut, relasi, dan kardinalitas relasi.
Model data digunakan untuk menjelaskan hubungan antar data secara logis kepada pengguna. Terdapat beberapa jenis model data, yaitu berbasis objek (Entity Relationship Model dan Semantic Model), berbasis record (Relational Model, Hierarchical Model, dan Network Model), dan berbasis fisik (Unifying Model dan Frame Memory). Relational Model menyajikan data dalam bentuk tabel dengan kolom dan baris unik. Hierarchical Model menggambarkan hubungan data secara bertingkat, sedangkan Network Model memungkinkan suatu data
Dokumen ini membahas berbagai model data yang digunakan dalam manajemen basis data relasional, termasuk model relasional, hirarki, jaringan, hubungan entitas, semantik, penyatuan, dan frame memori.
Dokumen tersebut membahas tentang manajemen basis data, yang mencakup konsep basis data dan sistem manajemen basis data, struktur dan komponen-komponen dalam basis data, serta karakteristik dan pengguna dalam basis data. Dibahas pula komponen utama basis data seperti data, perangkat keras, perangkat lunak DBMS, pengguna, dan aplikasi pendukung lainnya.
2. What is NLP??
Wiki: Natural language processing (NLP) is a field of
computer science, artificial intelligence, and computational
linguistics concerned with the interactions between
computers and human (natural) languages.
ML in NLP 2
3. Go beyond the keyword matching
Identify the structure and meaning of words, sentences,
texts and conversations
Deep understanding of broad language
NLP is all around us
ML in NLP 3
4. Tujuan dari NLP :
Membuat System yang dapat Memahami bahasa alami (natural languange)
5.
6.
7. Example: Siri
Siri contains
Speech recognition
Language analysis
Dialog processing
Text to speech
Image: Wikipedia
21. Sintaksis
• Pengetahuan tentang urutan kata dalam pembentukan kalimat.
• Contoh:
Kalimat Subyek, Predikat
Subyek Determinan, KataBenda
Predikat KataKerja, KataBenda
22. Semantik
• Mempelajari arti suatu kata pada kalimat yang utuh.
• Contoh:
– Ayahku datang membawa buah tangan
– Saya mau tahu. (tahu = mengerti)- saya mau tahu. (tahu = makanan)
24. Kategori Kata
NOUN Kata benda Bangku, awan, tetikus
VERB Kata kerja Belajar, lari, makan
ADJ Kata sifat Ungu, tinggi, lucu
ADV Kata keterangan Yang biru / dengan lincah
DETERMINER Kata penentu Itu, ini
PUNCT Tanda baca (.) / (,) / (?) / (!) dll
PRONOUN Kata ganti Dia, kamu, mereka
ADP Preposisi Di atas, di bawah
SYM Simbol $ / @ /
NUM Angka 1 / 3 / 45 / 1975
X Lain-lain
27. Parsing
• Suatu proses menganalisa suatu kumpulan kata dengan
memisahkan kata-kata itu dan menentukan struktur sintaktis
dari tiap kata tersebut.
• Mempunyai 2 pendekatan:
– Top-down parsing
– Bottom-up parsing
31. Parsing Resources
• SpaCy
Python, high accuracy, fast
https://spacy.io/
• NLTK
Python, low accuracy, fast
https://www.nltk.org/
32. Masalah pada POS Tagger
• Polysemi (ambigu)
– Sebuah kata dapat memiliki lebih dari 1 jenis kata, tergantung dari kalimat
tempat kata tersebut berada atau disebut juga konteks
– Contoh :
• Bisa ular bisa mematikan (Bisa: sebagai kata benda dan kata kerja bantu)
• Bagus memakai baju baru yang bagus (Bagus: sebagai kata benda dan kata sifat
• OOV
– Terdapat kata-kata baru misalnya berupa kata serapan atau named entity
baru
33. Penandaan (Tagging) Otomatis
• Contoh: menggunakan Penn Tagger
Input: Some scorpions are able to survive 6 to 12 months of
starvation
Output: Some/DT scorpions/NNS are/VBP able/JJ to/TO
survive/VB 6/CD to/TO 12/CD months/NNS of/IN
starvation/NN
• Misalnya:
– http://nlp.stanford.edu:8080/parser/
– GATE – General Architecture for Text Engineering
(http://www.gate.ac.uk)
34. Metode pada POS Tagger
• Rule based tagger
– Top down
– Pendefinisian aturan yang biasa digunakan manusia
• Statistical tagger
– bottom up
– Menggunakan corpus sebagai training data dimana aturan ditetapkan secara
otomatis
– Pendekatan probabilistik tag terbaik untuk sebuah kata dalam konteks kalimat
tertentu machine learning
– Perlu menentukan ciri atau fitur sebagai masukan kedalam machine learning
– Transformation based tagger menggunakan corpus sebagai training data
untuk mengmbil rule atau aturan pendefinisian POS tag sebuah kata
35. Rule-based POS Tagger
Langkah
• Menggunakan kamus untuk
menentukan tag ke setiap kata
• Menggunakan aturan (rule) untuk
menghilangkan kemungkinan POS
tagging yang salah rule
mempertimbangkan konteks kalimat
(beberapa kata tetangga
Contoh
• Punya VB
• Kemarin NN
• Wabah NN
• Virus X
• Membahayakan VB
• Semua CD
• Manusia NN
36. Statistical based POS Tagger
• Rule/aturan klasifikasi POS dilakukan secara otomatis melalui
corpus yang sudah dilabeli
• Tahap:
– Pembuatan corpus (daftar kalimat dimana setiap katanya diberi label POS)
– Contoh : “Bisa/NN ular/NN bisa/MD mematikan/VB”
– Keterangan : NN = noun, MD = Modality, VB = verb
• Pelatihan dengan algoritma
– HMM: hasil pelatihan berupa nilai probabilitas
– Decision Tree: hasil pelatihan berupa pohon keputusan
– Neural Network: hasil pelatihan berupa fungsi pembeda
37. Transformation Based Tagger
• Ide
– Meng-assign tag dengan nilai probabilitas terbesar
– Perbaiki kesalahan dengan melihat rule yang dipelajari dari data
• Contoh
– P(NN|race) = 0.98
– P(VB|race) = 0.02
– Maka pertama kali race di-tag sebagai NN
– Ubah tag jika memenuhi rule tertentu, cth: change NN to VB when
the previous tag is TO
38. So what about ML and Deep Learning?
Penggunaan Machine Learning (ML) dan Deep Learning (DL) untuk
menyelesaikan banyak tugas NLP tingkat tinggi