Sistem temu kembali informasi perpustakaan digital bertujuan untuk menemukan informasi digital dengan bantuan metadata. Prosesnya meliputi pengindeksan konten untuk disimpan dalam metadata, sehingga konten dapat dicari melalui metadata dan hasil pencarian dapat diakses. Metadata memainkan peran penting dalam merepresentasikan konten dan memungkinkan pencarian informasi.
AKSI NYATA Strategi Penerapan Kurikulum Merdeka di Kelas (1).pdf
Perancangan
1. RANCANGAN
SISTEM TEMU KEMBALI INFORMASI PERPUSTAKAAN DIGITAL
Oleh: Supriyadi
1. Pendahuluan
Penelusuran informasi merupakan bagian dari sebuahproses temu kembali
informasi dengan bantuan berbagai alat penelusuran dan temu kembali informasi
yang dimiliki perpustakaan/unit informasi. Penelusuran informasi menjadi penting
dalam
rangka
memenuhi
kebutuhan
informasi
pengguna,
bagaimana
menemukaninformasi yang diminta pengguna, dan bagaimana memberikan
“jalan” kepada pengguna untuk menemukaninformasi yang dikehendaki. Dalam
proses penelusuran,penggunaan alat yang tepat akan menghasilkan informasi yang
tepat pula.
Perkembangan teknologi informasi saat ini menuntut penyedia informasi untuk
selalu update dan terus melakukan inovasi. Dalam perpustakaan konvensional
misalnya dalam membuat sistem temu kembali informasi, perpustakaan cukup
mengolah buku dalam badan luarnya saja yang dianggap mewakili isi buku ketika
dibutuhkan pengguna, seperti yang ada dalam deskripsi delapan daerah dalam
pembuatan sebuah pengkatalogan.
Dalam kontek perpustakaan digital sistem temu kembali tentu mengalami
perubahan atau perbedaan dari pada sistem temu kembali perpustakaan
konvensional, sebab konten, jenis media dan model pelayanannyapun berdeda.
Temu kembali informasi dalam perpustakaan digital mengacu pada teori yang
diungkapkan oleh Hers (2003) adalah bertujuan untuk mengkases informasi yang
mungkin dalam bentuk perpustakaan digital, agar konten dapat diakses maka
harus dijelaskan dengan metadata.
1
2. 2. Pembahasan
Tujuan utama dari sistem temu kembali informasi pada perpustakaan digital
adalah untuk memberikan informasi kepada pengguna untuk tugas-tugas tertentu.
Hal ini berguna untuk mengklasifikasikan berbagai jenis informasi berbasis
pengetahuan untuk lebih memahami masalah dalam pengindeksan dan temu
kembali. Sedangkan penyediaan
sistem
temu
kembali
di
perpustakaan
merupakan salah satu fasilitas yang diberikan perpustakaan sebagai fasilitator
bagi pengguna denganinformasi.
Menurut
informasi
Hasugian (2003)
padadasarnya
dalam kusumawardani sistem
adalah
suatu
proses
untuk
temu
kembali
mengidentifikasi,
kemudian memanggil (retrieval) suatu dokumen dari suatu simpanan (file),
sebagai
jawaban
atas permintaan informasi. Sistem temu kembali pada
perpustakaan merupakan bentuklayanan pasif yang diberikan perpustakaan
sebagai penyedia informasi untuk useratau pengguna. Walaupun sistem temu
kembali merupakan layanan pasif tetapi layanan ini tidak bisa dianggap remeh,
karena dengan sistem ini akan membantupengguna untuk mengakses koleksi yang
ada di perpustakaan.
Dalam sistem temu kembali informasi yang menjadi kemasannya adalah konten
dari informasi itu sendiri, sehingga yang utama pada sistem temu kembali
informasi adalah pengindeksan dan pencarian sebagaimana proses temu kembali
informasi dalam perpustakaan digital seperti yang digambarkan oleh Hers (2003)
adalah sebagai berikut:
2
3. Pada bagian ini menggambarkan tentang alur kerja sistem temu kembali informasi
pada perpustakaan digital, yang dalam proses ini menunjukkan ada kegiatan
utama dalam temu kembali informasi yaitu indexing dan retrieval, sedangkan
metadata mempunyai peran sebagai pusat tumpuan dari content, queries dan
search engine.
Metadata merupakan perwakilan dari content yang sudah diindeks, dengan kata
lain bahwa konten yang sudah diindek dapat dipanggil melalui metada, sehingga
query melakukan pencarian langsung pada metadata dengan fasilitas mesin
pencari.
a. Content
Konten yang dikelola perpustakaan digital adalah berbasis digital dalam
pengelolaan informasinya menggunakan model pengindekan untuk di simpam
dalam metadata, sehingga konten dipanggil oleh metadata berdasarkan pada
hasil pengindekan dari konten. Pada bagian ini, kamimengklasifikasikankonten
kedalam bibliografi,teks lengkap,database /koleksi, image, vedeo, audiodan
kategorigabungandanmemberikan
gambaranmasing-masing
dalam
bentuk
digital.
b. Indeks
Menurut Pendit (2007:98), untuk memudahkan pencarian, maka hal utama
yang perlu dilakukan adalah membuat dewan perwakilan dukumen. Jika kita
ingin mencari sebuah dokumen diantara dukumen-dukumen lainnya, maka
pencarian dilakukan terhadap perwakilan dewan dokumen tersebut, bukan
langsung pada dokumennya.
Bentuk perwakilan dokumen yang paling populer dan sejak lama dilakukan
adalah pengindeksan atau pembuatan indeks (indexing). Pengindeksan adalah
cara yang paling populer dalam membuat wakil dokumen, dalam dunia teks,
indeks ini dibuat dengan menggunakan istilah(kata atau frasa) baik yang
3
4. diambil langsung dari dokumen maupun diambil dari luar dokumen tetapi
dianggap serupa dengan yang ada di dokumen (pendit:2007).
Indexing
merupakan
sebuah
proses
untuk
melakukan pengindeksan
terhadap kumpulan dokumen yang akan disediakan sebagai informasi
kepada pemakai. Proses pengindeksan bisa secara manual ataupun secara
otomatis dan dewasa ini, sistem pengindeksan secara manual mulai digantikan
oleh sistem pengindeksan otomatis.
Elemen dari indeks adalah istilah indeks ( index term) yang didapatkan dari
teks yang dipecah di dalam sebuah dokumen. Elemen lainnya adalah bobot
istilah (term weighting ) sebagai penentuan rangking da ri kriteria relevan
sebuah dokumen yang memiliki istilah yang sama.
Baeza-Yates dan RibeiroNeto (1999) menjelaskan tentang proses pembuatan
indeks dari sebuah dokumen teks atau dikenal dengan proses analisis teks
(automatic teks analysis) melalui beberapa tahap:
1. Proses penentuan digit, tanda hubung, tanda baca dan penyeragaman dari
huruf yang digunakan.
2. Penyaringan kata meliputi penghilangan kata yang memiliki arti niliai
paling rendah (stopwords) untuk proses penemu-kembalian.
3. Penghilangan imbuhan kata, baik awalan maupun akhiran kata.
Penghilangan imbuhan kata ini dikenal dengan stemming .
4. Pemilihan istilah untuk menentukan kata atau stem (atau kelompok kata)
yang akan digunakan sebagai elemen indeks.
5. Pembentukan kategori istilah terstruktur seperti kelompok persamaan kata
yang digunakan untuk perluasan dari query dasar yang diberikan oleh
pengguna sistem temu-kembali informasi dengan istilah lain yang sesuai.
4
5. Tahapan pemprosesan teks menurut Baeza-Yates dan RibeiroNeto (1999) dapat
digambarkan sebagai berikut:
c. Metadata
Menurut pendit (2007) bahwa metadata ialah data terstruktur tentang data.
Metadata hanya lah istilah baru bukan merupakan konsep baru di dunia
pengelola informasi, Perpustakaan sudah lama menciptakan metada dalam
bentuk pengkatalokan koleksi .
Makna metadata sangat beragam ada yang mengatakan “data tentang data” atau
“informasi tentang informasi”, pengertian dari beberapa definisi tersebut
bahwa metadata adalah sebagai bentuk pengindentifikasian, penjelasan suatu
data, atau diartikan sebagai struktur dari sebuah data.
5
6. Menurut Pendit (2007) Secara garis besar metadata dapat dikelompokkan
menjadi 3 jenis diantaranya adalah sebagai berikut:
1. Metadata deskriptif
Data ini mengidentifikasi sumber informasi sehingga memperlancar proses
penemuan (resourcediscovery) dan seleksi. Data ini mencakup unsur-unsur
seperti pengarang, judul, tahun terbit, tajuk subyek atau kata kunci dan
informasi lain yang lazimnya dicatat dalam proses pengatalogan tradisional.
Di lingkungan perpustakaan dilakukan pembuatan cantuman bibliografi
berdasarkan ISBD (International Standard Bibliographic Description),
AACR, bagan klasifikasi seperti DDC (Dewey Decimal Classification),
UDC
(Universal
Classification,
Decimal
Classification),
Library
of
Congress
daftar tajuk subyek yang menghasilkan suatu wakil
dokumen ringkas (document representation atau document surrogate)
standar yang berfungsi sebagai cantuman bibliografi. Dunia arsip
menciptakan finding aids.
2.Metadata administratif
Data yang memberikan informasi untuk pengelolaan sumber informasi,
seperti kapan dan bagaimana diciptakan, tipe file, data teknis lain, dan siapa
pemiliknya, serta siapa yang berhak mengaksesnya. Metadata administratif
mencakup pula data berkenaan dengan hak kekayaan intelektual dan selukbeluknya (rights management metadata), penyimpanan (archiving) dan
pelestarian sumber informasi (preservation metadata).
3. Metadata struktural
Data ini menjelaskan bagaimana suatu obyek digital terstruktur sehingga
dapat digabungkan menjadi satu kesatuan logis. Sumber digital berupa
buku misalnya, terdiri atas beberapa bab, dan tiap bab terdiri atas halamanhalaman yang masing-masing merupakan suatu file digital tersendiri.
6
7. Metadata struktural diperlukan untuk mengetahui hubungan antara file fisik
dan halaman, halaman dan bab, dan bab dengan buku sebagai produk akhir.
Inilah kemudian memungkinkan perangkat lunak menampilkan daftar isi
buku lalu langsung memunculkan bab yang dipilih (dengan click) oleh
pengguna, atau bernavigasi ke bagian (halaman) lain dari “buku”. Contoh
lain: Obyek multimedia yang terdiri atas komponen audio dan teks perlu
sinkronisasi, dan untuk ini harus ada metadata struktural.
Fungsi utama metadata antara lain:
a. Membantu Pencarian Data.
b. Memungkinkan data bisa ditemukan sesuai dengan criteria yang
diinginkan, mengidentifikasi sumber data, mengumpulkan data yang
sama, membedakan data dengan sumber/informasi yang berbeda,
memberikan informasi lokasi data disimpan.
c. Mengatur Sumberdata Elektronik
Sejalan dengan semakin besarnya jumlah data, semakin banyak data
dalam suatu system informasi yang dibangun, maka diperlukan suatu
system yang mampu mengatur data tersebut. Misalnya perkembangan
dalam dunia internet, semakin banyak data html yang dibuat, harus
dibarengi dengan bentuk pengelolaan data, sehingga data data diolah
secara lebih cepat, efesion, dikelompokkan sesuai dengan kategori yang
dibuat.
d. Interoperability/Multi Sistem Operasi
Dalam pengelolaan data lebih sering dilakukan bukan hanya satu jenis
data dengan system yang berbeda operasi-nya. Pembangunan metadata
dengan menggunakan protocol yang sama memungkinkan dilakukan
manajemen data dari system yang berbeda. Salah satu bentuk protocol
yang sering digunakan adalah protokal Z39.50 yang merupakan protocol
lintas system operasi.
7
8. e. Identifikasi Secara Digital
Kebanyakan skema metadata menggunakan standar angka yang sifatnya
unik untuk tujuan identifikasi. Lokasi dari suatu data dapat juga dibuat
dalam suatu system penamaan, misalnya system URL (Uniform Resource
Locator) merupakan suatu system penentuan lokasi yang mengacu pada
data tertentu. Perubahan alamat data bisa membuat system pendataan
invalid. Penentuan system penamaan, standarisasi memungkinkan obyek
data dapat ditelusuri.
f. Arsip dan Perawatan
Seringkali disebutikan bahwa data digital merupakan data yang „rentan‟,
bisa saja rusak, korup, atau terhapus. Perubahan system data, peralihan
dari satu system operasi dapat membuat data rusak. Metadata menjadi
kunci dalam system penyimpanan data, dengan mengetahui informasi
mengenai suatu data, maka dapat dilakukan proses pengelompokan data,
penyimpanan serta pemanggilan kembali data secara teratur.
c.1. Skema Metada
Dalam sistem temu kembali informasi Perpustakaan Digital dalam metada
setidaknya ada tiga pihak yang terlibat yaitu pihak penghasil (Produsen),
pihak pengelola sistem, dan pihak pengguna (konsumen). Seperti yang
dijelaskan dalam bukunya Pendit (2009:85-86) bahwa pada dasarnya
komunikasi di dunia digital adalah komunikasi yang mengandalkan bahasa
tertulis, maka skema metadata adalah bagian dari “bahasa” yang digunakan
oleh manusia maupun mesin komputer untuk saling memahami pada apa
yang mereka pertukarkan dalam proses komunikasi, khususnya komunikasi
yang melibatkan sistem simpan dan temu kembali informasi.
8
9. Sebagai bahasa setiap skema metadata mengandung 3 aspek yang ada
disemua bahasa yaitu semantik, isi dan sintaksis, sebagaimana uraian
berikut:
1. Semantik (semantics), merupakan kesepakatan mengenai makna
bagaimana mengartikan suatu unsur sebuah skema metadata.
2. Isi (Content), merupakan isi dari unsur yang sudah diberi makna
kesepakatan.
3. Sintaksis (syntax), merupakan bahasa yang terbacakan mesin atau
komputer. Dalam konteks perpustakaan digital dan internet, sintaksis
metadata mengikuti bahasa yang sudah terstandar seperti SGML
(Standard Generalized Mark up Languange)atau XML (Extensible
Mark-up Language)
d. Sistem Temu Kembali Informasi (Information Retrieval)
Temu-kembali informasi adalah seni dan ilmu dalam pencarian informasi di
sekumpulan dokumen-dokumen, pencarianinformasi di dokumen itu sendiri,
pencarian metadata yang menjelaskan sekumpulan dokumen, atau pencarian di
dalam basis data (wikipedia, 2014).
Menurut Lancaster (1968)
temukembali
informasi
di dalam Rijsbergen (1979):
tidak
memberitahu
(yakni
“sebuah sistem
tidak
mengubah
pengetahuan) pengguna mengenai masalah yang ditanyakannya. Sistem
tersebut hanya emberitahukan keberadaan (atau ketidakberadaan) dan
keterangan dokumen-dokumen yang berhubungan dengan permintaannya”.
Untuk memahami temu kembali informasi menurut Chu (2003) dalam pendit
(2007:96) menguraikan komponen dasar dari sebuah sistem informasi yaitu:
a. Sebuah pangkalan data (database) sebagai tempat meletakkan dan
menyimpan wakil dari dokumen atau informasi,
b. Sebuah mekanisme pencarian untuk menemukan apa yang sudah
tersimpan di pangkalan data,
9
10. c. Seperangkat bahasa pencarian, yaitu bahasa yang digunakan manusia
pengguna sistem yang dikenali oleh mesin komputer yang ia gunakan
d. Sebuah antar muka yaitu segala sesuatu yang terlihat, terdengar, atau
tersentuh oleh pengguna ketika dia melakukan pencarian informasi
Sedangkan sistem temu-kembali informasi menurut Baeza-Yates dan
RibeiroNeto(1999)memiliki
tujuan
untuk
menemu-kembalikan
semua
dokumen yang relevan berdasarkan query yang dimasukan oleh pengguna dan
menemu-kembalikandokumen tidak relevan sedikit mungkin.
Kerangka dari sistem temu kembali informasi secara sederhana terbagi
menjadidua bagian. Bagian yang pertama adalah bagian si pencari informasi
atau pengguna dari sistem. Pengguna dari sistem temu kembali informasi
harusmenerjemahkan informasi yang dicarinya agar dapat diproses oleh sistem
dengancara memasukan kata kunci. Kata kunci te rsebut nanti di proses
menjadi sebuah query yang dapat dimengerti oleh komputer. Bagian yang
kedua adalah bagiandari dokumen. Pada bagian ini doku men-dokumen
direpresentasikan dalam bentuk indeks. Nanti query dari pengguna akan dipros
es melalui fungsi kesamaan untuk membandingkan query dengan indeks dari
dokumen untuk mendapatkan dokumen yang relevan.
Teknik Temu Kembali Informasi
Ada beberapa teknik temu-kembali informasi yang telah dikembangkan
yaitu
teknik Boolean
sederhana
dan teknik Boolean berperingkat
(Fitriyanti,1997), serta teknik Extended Boolean berdasarkan p-norm model
(Andri,1997). Untuk lebih jelasnya mengenai perbedaandan keungulan
masing-masing teknik ini dapat dilihat pada penjelasan berikut.
a. Teknik Boolean
Teknik
Boolean
merupakan
suatu
cara
dalam mengekspresikan
keinginan pemakai ke sebuah queri dengan mamakai operator-operator
Boolean(Salton,1989) yaitu : “and”, “or”, dan “not”. Adapunmaksud dari
10
11. operator “and” adalah untuk menggabungkan istilah-istilah kedalam
sebuahungkapan, dan operator “or” adalah untukmemperlakukan istilahistilah sebagai sinonim, sedangkan operator “not” merupakan sebuah
pembatasan. Pada teknik Boolean sederhana, kueri diproses sesuai
dengan
operator
yang
digunakan
dan menampilkan
dokumen
berdasarkan urutan dokumen ditemukan. Sedangkan pada teknik Boolean
berperingkat,
dokumen
diperingkat
berdasarkan bobot
dari
dokumen.Adapun pembobotan dari masing-masing dokumen berdasarkan
aturan sebagai berikut :
Dimana dAmenyatakan bobot istilah A pada dokumen D. Bobot istilah ini
didapat dari hasil proses indexing. Min (dA, dB) berarti bahwa sebuah
dokumen di retrieve, dengan bobot sebesar nilai terkecil dari bobot-bobot
istilah yang dipunyai. Max (dA,dB) berarti bahwa sebuah dokumen di
retrieve dengan bobot sebesar nilai terbesar dari bobot-bobot istilah yang
yang dipunyai.
b.Teknik Extended Boolean
Teknik
Extended
Boolean
berdasarkan
p-norm
model
merupakan
pengembangan lebih lanjut dari model Boolean. Teknik ini memakai
operator
yang dikomputasi
berdasarkan
rumus Savoy(1993) sebagai
berikut :
11
12. Dimana :
p adalah nilai p-norm yang dimasukkan pada kueri
Wia adalah bobot istilah A dalam indeks pada dokumen Di
Wib adalah bobot istilah B dalam indeks pada dokumen Di
Pemeringkatan yang dipakai bisa dua cara :
Langsung mengurutkan dokumen (dari besar ke kecil) berdasarkan
bobot dokumen yang didapat dengan rumus RSV (retrieval status
value) di atas.
Memakai rumus Learning Scheme
Dimana :
RSVinit(Di) merupakan retrieval status value dari dokumen i yang
dikomputasi berdasarkan rumus teknik retrieval P-norm model.
∝ik merupakan bobot keterhubungan antara dokumen i dan k.
Bobot keterhubungan ini didapat dari nilai relevance link yang
merupakan hasil dari proses pembelajaran.
12
13. 3 SIMPULAN
Berdasarkan pada uraian diatas tentang rancangan sistem temu kembali pada
perpustakaan digital dapat disimpulkan sebagai berikut:
1. Sistem temukembali informasi yang dibuat untuk mencari informasi dari isi file
dokumen yang disimpan di dalam sistem.
2. Dalam sistem temu kembali informasi Perpustakaan Digital setidaknya ada tiga
pihak yang terlibat yaitu pihak penghasil (Produsen), pihak pengelola sistem,
dan pihak pengguna (konsumen)
3. Proses pembuatan indeks dari sebuah dokumen teks atau dikenal dengan proses
analisis teks (automatic teks analysis) melalui beberapa tahap diantaranya
adalah Proses penentuan digit, tanda hubung, tanda baca dan penyeragaman
dari huruf yang digunakan, stopwords, stemming,stem (atau kelompok kata)
yang akan digunakan sebagai elemen indeks.
4. Ada beberapa teknik temu-kembali informasi yang telah dikembangkan
yaitu teknik Boolean sederhana dan teknik Boolean berperingkatserta teknik
Extended Boolean berdasarkan p-norm model.
DAFTAR PUSTAKA
Andri, Yofi. 1997. Teknik Learning Scheme Berdasarkan Model P-Norm pada
Sistem Temu-kembali Informasi. Fakultas Ilmu Komputer, Universitas
Indonesia, Skripsi.
Baeza-Yates dan Ribeiro-Neto , 1999, Modern Information Retrieval, Harlow,
Addison- Wesley.
Devita Kusumawardan, Temu Kembali Informasi dengan keyword (Studi
deskriptif tentang sistem temu kembali informasi dengan controlled
vocabulary pada field judul, subyek, dan pengarang di Perpustakaan
Universitas Airlangga). http://zero-fisip.web.unair.ac.id/artikel_detail69655-Artikel%20Ilmiah. Akses 10 Januari 2014
Firnas Nadirman. 2006.Sistem Temu-Kembali Informasi Dengan Metode Vector
Space Model Pada Pencarian File Dokumen Berbasis Teks. SKRIPSI.
http://kabulkurniawan.web.ugm.ac.id/wp-content/uploads/SKRIPSI.pdf.
Akses 10 Januari 2014
13
14. Fitriyanti,
Masayu.1997.
Sistem
Temu-kembali
Informasi
dengan
Mengimplementasikan Operasi Boolean, Sistem Peringkat, Perbaikan
Query, dan Pemanfaatan Tesaurus. Fakultas Ilmu Komputer, Universitas
Indonesia. Skripsi.
Hasugian, Jonner (2006)
Penggunaan Bahasa Alamiah dan Kosa Kata
Terkontrol Dalam Sistem Temu Kembali Informasi Berbasis Teks. Dalam
USU digital library. Perpustakaan Universitas Sumatra Utara.
Medanhttp://repository.usu.ac.id/bitstream/123456789/17059/1/pusdes2006-1.pdfAkses 10 Januari 2014
Hersh,
William R. Information Retrieval And Digital Libraries.
http://ai.arizona.edu/mis596A/book_chapters/medinfo/Chapter_09.pdfAks
es 10 Januari 2014.
Kusumawardan,Devita. Temu Kembali Informasi dengan keyword(Studi deskriptif
tentang sistem temu kembali informasi dengan controlled vocabulary pada
field judul, subyek, dan pengarang di Perpustakaan Universitas
Airlangga)http://zero-fisip.web.unair.ac.id/artikel_detail-69655Artikel%20Ilmiah- Akses 12 Januari 2014
Pendit, Putu Laxman.2009. Perpustakaan Digital: Perspektif Perpustakaan
Perguruan Tinggi Indonesia. Jakarta: CV. Sagung Seto.
__________________.2007. Perpustakaan Digital:
dinamika, Jakarta: Cita Karyakarsa Mandairi
Kesinambungan
dan
Rijsbergen, C.J. van., 1979, Information Retrieval, Second Edition . Butterworths,
London.
Savoy, J. 1993. “A Learning Scheme for Information Retrieval in Hypertext”.
Information Processing & Management, 30(4), 515-533. Akses 12 Januari
2014
Wikipedia. 2014. Information retrieval Wikipedia, the free encyclopedia.
http://en.wikipedia.org/wiki/Information_retrieval akses 13 Januari 2014
Zainal A. Hasibuan dan Yofi Andri.Penerapan Berbagai Teknik Sistem
TemuKembali Informasi Berbasis Hiperteks.
http://repository.ui.ac.id/dokumen/lihat/6396.pdfAkses 10 Januari 2014
14