Dokumen tersebut membahas tentang usulan perbaikan proses penapisan konten internet di Indonesia, yaitu dengan fokus pada analisis konten (bukan domain utama), menggunakan teknik big data dan machine learning, serta kolaborasi terbuka antara pemerintah dan masyarakat. Hal ini dimaksudkan agar penanganan konten negatif di internet menjadi lebih tepat dan proporsional.
Edge Exploration of QR Code Technology Implementation
Kominfo-Content Filtering
1. Analisa Konteks Web
dan Usulan Proses Normalisasi
Blokir untuk Proses Penapisan
Internet Sehat Indonesia
Dony Riyanto (a.donyriyanto@gmail.com)
Maret 2016
2. Pembuka
Pemerintah, dalam hal ini Kemenkominfo, memiliki tugas
dan tanggung jawab untuk mengatur pemanfaatan media
Teknologi Informasi dan Komunikasi secara umum,
maupun konten internet secara khusus, demi menjaga
kedaulatan Republik Indonesia.
Berbagai upaya sudah di-inisiasi dan dilakukan, baik
legislatif maupun eksekutif, salah satunya dengan
diberlakukannya UU ITE, berbagai Permen dan aturan
terkait konten negatif, dan sebagainya.
3. Latar Belakang
Dengan potensi jumlah pengakses internet terbesar di ASEAN, dan salah satu negara dengan
kontribusi dan akses konten Internet/Media Sosial terbesar dunia, Indonesia memiliki posisi
strategis dalam pengembangan teknologi internet kedepan, sekaligus memiliki potensi ancaman
serius.
Upaya pemblokiran konten/domain website yang menyalahi peraturan perundangan (KUHP, UU
ITE, UU HAKI, dsb) sudah dilakukan sejak beberapa tahun ke belakang antara lain untuk web yang
mengandung konten ponografi, perjudian, hingga pelanggaran hak atas kekayaan intelektual dan
yang terkait.
Namun hal itu masih dirasa kurang efektif dan/atau tetap butuh pengembangan serta perbaikan
kedepan. Bagaimana cara penapisan yang cepat, tepat, tidak menghalangi kebebasan untuk
mendapatkan informasi dan ber-ekspresi, tanggap remediasi, dan dapat mengikuti pola
perkembangan konten internet yang berkembang super cepat, tanpa menyalahi netralitas internet?
Slide ini mencoba memberikan usulan mengenai pengembangan proses penapisan yang
diharapkan lebih baik daripada proses yang sudah ada saat ini.
4. Regulasi
●
UUD45
●
KUHP
● UU ITE
●
Dirjen Aplikasi Informatika, Kemkominfo, No. 70/DJAI/KOMINFO/02/2011 tanggal 11 Februari
2011, tentang “Penerapan Internet Sehat dan Aman oleh Para Penyelenggara Jasa Akses
Internet (ISP)”.
●
Permen Kominfo no 19 tahun 2014 tentang “Penanganan Situs Internet Bermuatan Negatif”.
●
Peraturan Bersama Menkumham No. 14 tahun 2015 dan Menkominfo No. 26 tahun 2015
tentang “Pelaksanaan Penutupan Konten dan/atau Hak Akses Pengguna Pelanggaran Hak
Cipta dan/atau Hak Terkait Dalam Sistem Elektronik”.
Pelaksana dan penegakan hukum:
●
Teknis pelaksanaan blokir dilakukan oleh masing-masing ISP/penyedia jasa internet, sesuai
peraturan yang diterbitkan Kemenkominfo.
●
Aparat penegak hukum (kepolisian/kejaksaan), khususnya pada delik aduan.
5. Penanggungjawab
Dalam Permen Kominfo no. 19 tahun 2014
jelas disebutkan, siapa saja pihak yang
bertanggungjawab untuk melaksanakan
penapisan, yaitu:
● Kementrian atau lembaga pemerintah
● Penyedia Layanan Pemblokiran
● Penyelenggara Jasa Akses Internet
● Peran serta masyarakat pengguna jasa internet
6. Cara Penapisan Saat ini
Bekerja secara tersentralisasi
Berdasarkan data terstruktur
(keywords search,kajian dan pengaduan)
Di monitor Control Room
Di evaluasi (normalisasi) manual
Distribusi secara manual (download/rsync)
Satu arah.Tidak ada pemeriksaan
implementasi yang terintegrasi dengan ISP
ISP dan masyarakat tidak bisa
melakukan pemeriksaan
TRUST Positif
7. Beberapa Permasalahan Teknis
● Dengan metode DNS poisoning, akses user mudah lolos ketika menggunakan
VPN/tunneling
● Beberapa ISP bahkan bisa dengan mudah di bypass dengan mengganti setting
DNS server di komputer lokal.
● Sistem profiling automatic masih bersifat teks nama domain/subdomain (pencarian
keywords) bukan dengan analisa konteks, sementara tiap hari laju kemunculan situs
pornografi dan perjudian sangat cepat, sehingga masih sangat banyak yang bisa
lolos. Justru sebaliknya, beberapa domain yang tidak berunsur pornografi justru di
blokir (false alarm)
● Karena daftar pemblokiran hanya menggunakan nama domain/subdomain utama,
maka ketika sebuah domain masuk dalam daftar, akan di blokir, walaupun yang
menyalahi aturan hanya sebagian konten (url) didalamnya. Yang ter-blokir termasuk
sub-sub domain/direktori-nya, yang bisa jadi memiliki konten yang legal dan tidak
melanggar aturan.
● Pada saat normalisasi juga memakan waktu lama karena berdasarkan laporan
masyarakat dan review manual
● Dan berbagai masalah lain
9. Usulan Solusi
● Fokus pada penapisan (filter) konten internet, secara bertahap, tanpa melakukan sadap
(tapping). Mulai dari konten per URL (full path URL) bukan per domain/sub domain
● Analisa data secara komprehensif berdasarkan data terstruktur dan tidak ter-struktur. Contoh
data ter struktur: daftar putih/dafar kajian domain web/daftar pengaduan. Contoh data tidak ter
struktur: keywords, konten web (teks/gambar/dsb) baik dari web itu sendiri, maupun dari
trending topic, jejaring sosial, web analisa traffic, maupun sumber lain terkait.
● Melakukan web search dengan metode pencarian berdasarkan model asosiatif untuk
menemukan pola/memahami konteks web.
● Konten internet (dalam hal ini diasumsikan dengan full path URL sebuah web) yang terindikasi
kuat berdasarkan aturan (rules) yang terprogram, bisa langsung secara otomatis dimasukkan
dalam blacklist, dan faktor penyebabnya juga ikut dipublikasikan supaya bisa diketahui
masyarakat. Namun juga harus diimbangi dengan mekanisme review yang cepat, akurat,
berkala, bersifat terbuka dan kolaboratif, sehingga dapat dinormalisasi segera apabila
memang terjadi salah blokir (false alarm) atau sudah dilakukan remediasi konten.
● Bentuk kolaborasi terbuka ini bisa bersifat seperti wiki, dimana informasi diisi dan dikonfirmasi
bersama-sama, sehingga lebih akuntabel dan terpercaya.
● Daftar hitam/putih tidak berhenti sebagai database begitu saja, namun juga harus
memudahkan ISP/masyarakat untuk menerima dan menggunakannya. Juga harusnya
membuka peluang masyarakat secara aktif memasang sendiri di komputer miliknya (agent).
Dan harus ada mekanisme dua arah antara kominfo dengan ISP/masyarakat
10. Solusi (1)
“Its content filtering (not traffic sniffing), not to be confused with domain blocking
(DNS poisoning)”
● Sistem yang diusulkan adalah menganalisa content internet (web/files/dsb)
● Analisa meliputi: NLP, text mining, dsb.
● Contoh analisis sentimen (Positive/Negative) dari dua buah web berbeda.
11. Solusi (2)
“Analyzing unstructured input (existing only based on structured user report &
keyword search, then manual processing)”
● Untuk memahami konteks sebuah konten web maka perlu analisa mendalam pada
daat terstruktur dan tidak ter struktur, antara lain berupa:
● User generated content (Twitter, Facebook, blog)
● Trending topic/search, search engine, suggestion engine, traffic ranking
● Data-data ini di kumpulkan dan di analisa dengan sistem 'Big Data' dan 'Machine
Learning'
12. Summary
● Dampak dari pemblokiran internet masih kontroversif
● Untuk itu perlu dilakukan penanganan yang lebih baik dan lebih moderat
● Salah satunya dengan fokus pada konten (bukan pada situs utama), dan
harus bisa mengikuti pertumbuhan konten internet