Bioinformatik melibatkan analisis data biologi seperti jujukan DNA dan protein menggunakan komputer. Ia merangkumi penyimpanan data dalam pangkalan data, pengembangan algoritma untuk menganalisis hubungan antara data, dan pengenalpastian gen, protein, dan interaksi molekul. Penglibatan ahli sains komputer dan biologi penting untuk menyelesaikan masalah komputasi dan biologi dalam bidang ini.
1. Soalan C : DNA adalah salah satu molekul penting yang kerap dikenalpasti dalam setiap
penemuan fosil organisma hidup. Ia mempunyai perkaitan rapat di antara
organisma hidup menerusi hubungan filogenetik yang seterusnya boleh
mengakui kebenaran sebahagian teori evolusi. Huraikan teknik pengelasan
organisma hidup dengan cara sistematik molekul dan bioinformatik.
Jawapan :
Penggunaan komputer sangat meluas dalam pelbagai bidang. Antara kelebihan
penggunaan komputer adalah keupayaan untuk mengira pelbagai penyelesaian dan
menentukan penyelesaian yang paling sesuai dan tepat dalam masa yang terhad. Amnya
tugas-tugas ini sangat sukar atau mustahil dilakukan tanpa komputer. Bagi bidang
Bioinformatik, kegunaan komputer adalah kerana kepantasan pemprosesan dan
keupayaan menyelesaikan masalah yang dimiliki.
Bioinformatik adalah suatu bidang hasil gabungan Teknologi Maklumat dan
Komunikasi (TMK) dan Biologi. Ia melibatkan tugas analisa berasaskan komputer
terhadap suatu set data berkaitan biologi.Lazimnya terdapat dua aktiviti utama yang
dilakukan iaitu pembangunan pangkalan data untuk menyimpan dan mencapai maklumat,
serta pembangunan alat statistik dan algoritma untuk menganalisis dan menentukan
hubungan antara set-set data biologi. Misalnya jujukan, struktur, expression profile dan
laluan biokimia molekul makro.
Set-set data biologi yang dianalisa bersumberkan maklumat DNA
(Deoxyribonucleic Acid), satu unsur utama dalam sel hidupan. Bioinformatik asasnya
melibatkan manipulasi, carian dan perlombongan data terhadap data jujukan DNA, selain
struktur protein. Antara penyelidikan yang dijalankan adalah carian rentetan dan
algoritma padanan yang dibangunkan untuk mencari jujukan tertentu nukleotid (elemen
DNA). Selain itu penjajaran (alignment) jujukan juga dilakukan untuk mengenal pasti
jujukan yang homolog dan mengesan mutasi tertentu yang menyebabkan jujukan berbeza.
Semua ini bermatlamat untuk menentukan hubungan phylogenetic dan fungsi protein.
Selain itu jujukan DNA yang mempamerkan ciri tertentu berkaitan protein (seperti gen
pengekod-RNA) boleh dikenal pasti melalui algoritma pencarian gen.
Ini membolehkan penyelidik meramalkan kehadiran produk gen organisma
tertentu walaupun protein itu secara fizikalnya belum diasingkan (melalui eksperimen dan
2. lain-lain). Oleh kerana bioinformatik menggabungkan kemahiran dua bidang, maka untuk
mengembangkannya memerlukan penglibatan golongan yang mahir TMK dan ahli
biologi. Ahli TMK diperlukan sebagai sumber pengetahuan mengenai aspek sintaktik
data, pangkalan data dan algoritma (carian, capaian, dan dapatan maklumat yang relevan,
mengurus dan menyelenggara pelbagai pangkalan data, membangunkan sistem
pengintegrasian maklumat, memodelkan objek biologi dan menyokong pembangunan
sistem antaramuka pengguna). Manakala ahli biologi pula penting bagi membekalkan
pengetahuan atau menjadi rujukan tentang data biologi, aspek semantik pangkalan data,
dan algoritma saintifik.
Maka ini memerihalkan tentang bidang penyelidikan dan pengembangan
Bioinformatik dengan skop dan keutamaan disasarkan terhadap lulusan berkaitan TMK.
Berdasarkan pengamatan terhadap tren semasa, bidang bioinformatik di Malaysia sangat
kurang disertai oleh oleh golongan terbabit. Sebahagian besar individu yang terlibat
secara aktif (berkaitan penyelidikan dan pengembangan ilmu) dalam bidang ini
merupakan ahli biologi serta lulusan pengajian Bioinformatik yang lebih cenderung
kepada pengetahuan, kemahiran dan matlamat ilmu biologi. Penglibatan ahli TMK di
dalam bidang Bioinformatik merupakan satu keperluan bagi mengimbangi hala tuju
Bioinformatik. Ini kerana bagi ahli biologi atau mereka yang mahir ilmu biologi,
Bioinformatik hanya dilihat dari perspektif dan kepentingan pengembangan ilmu biologi
sahaja (seperti kaitan antara DNA x dengan fungsi protein y dan lain-lain). Maka
kepentingan ilmu berkaitan sains komputer tidak menyerlah dan menyebabkan komputer
hanya dilihat sebagai alat semata-mata, justeru mengehadkan perkembangan dan potensi
sains komputer berbanding bidang biologi. Tetapi, melalui penerapan ilmu dan
penglibatan ahli sains komputer dalam bidang Bioinformatik akan dapat mengembangkan
ilmu dan algoritma khusus bagi menyelesaikan masalah komputasi berkaitan biologi. Ini
dapat mewujudkan satu perspektif berbeza dalam Bioinformatik, di mana penyelesaian
masalah komputasi dilihat sama pentingnya dengan menyelesaikan masalah biologi.
Algoritma komputasi yang dibangunkan dalam bidang sains komputer lebih bersifat
umum.
Melalui pendedahan terhadap maklumat berkaitan biologi di dalam Bioinformatik
membolehkan masalah komputasi yang spesifik berkaitan biologi dapat dibangunkan.
Amnya, pembangunan teknik untuk penyimpanan dan pencarian jujukan DNA telah
3. membawa kepada meluasnya kemajuan dalam aplikasi sains komputer, terutama
algoritma carian, pembelajaran mesin (machine learning) dan teori pangkalan data. Hari
ini, ilmu yang dikembangkan melalui sains komputer seperti bahasa formal dan algoritma
carian teks telahpun digunakan dalam algoritma dan perisian bioinformatik, seperti yang
digunakan dalam perisian BLAST dan FASTA. Berdasarkan kepentingan ini, penerangan
dan galakan perlu diajukan kepada lulusan TMK supaya sedar tentang keperluan
penglibatan mereka. Maka makalah ini cuba memerihalkan tentang bidang Bioinformatik
dan juga prospek (lulusan TMK) berkaitan bidang ini, supaya lebih ramai lulusan TMK
yang memahami dan berminat menceburinya. Makalah ini terbahagi kepada 5 bahagian.
Bahagian 1 merupakan pengenalan kepada bidang Bioinformatik. Bahagian ini
merangkumi konsep dan proses-proses asas dalam bidang terbabit. Bahagian 2
menerangkan konsep penting TMK seperti ciri pembangunan perisian (pengaturcaraan),
dan infrastruktur seperti pangkalan data serta internet yang penting dan berguna bagi
Bioinformatik. Bahagian 3 pula menerangkan serba-sedikit tentang isu dan cabaran yang
dihadapi dalam bidang Bioinformatik. Ini bertujuan memberi panduan tentang potensi-
potensi yang boleh dimanfaatkan oleh mereka yang sedang atau ingin menceburi bidang
ini. Bahagian 4 pula mengulas perkembangan bidang bioteknologi dan
bioinformatik di Malaysia iaitu berkisar tentang pelaksanaan program NBBnet. Sementara
bahagian 5 menerangkan tentang prospek dan peluang, serta keperluan yang perlu
dipenuhi oleh lulusan TMK untuk menceburi bidang Bioinformatik.
1.0 Asas Bioinformatik
1.1 Sel, Kromosom dan DNA
Benda hidup terdiri daripada sel, dan setiap satu sel benda hidup mengandungi nukleus.
Nukleus mengandungi jalinan kromosom yang terbina oleh molekul DNA
(Deoxyribonucleic Acid). DNA merupakan kunci kepada pewarisan ciri dan fungsi
daripada satu benda hidup (pewaris) kepada benda hidup yang lain (waris). Struktur DNA
juga adalah unik bagi setiap benda hidup. Salah satu peranan DNA ialah membawa
maklumat seperti ciri dan fungsi suatu sel daripada suatu generasi kepada generasi yang
lain. Maklumat ini ’tersimpan’ dalam kawasan yang dinamakan gen, iaitu kawasan-
kawasan tertentu dalam seutas rantaian DNA4. Ringkasnya pemindahan maklumat
genetik melalui gen ialah melalui pasangan bes pelengkap (complementary base pairing).
Molekul DNA wujud dalam bentuk pasangan heliks (double-helix). Pasangan utas
(strand) DNA ini terbina melalui ikatan-ikatan molekul nukleotid. Molekul nukleotid
4. ialah gabungan antara monomer, fosfat dan gula. Terdapat 4 jenis monomer nukleotid
dalam DNA – Adenine (A) dan Guanine (G), Cytosine (C) dan Thymine (T). Struktur
nukleotid ini dipaparkan dalam Rajah 1 dibawah. Jujukan bes dalam utas DNA
menentukan jujukan asid amino, dan seterusnya menentukan bentuk dan fungsi protein
yang akan disintesis (berdasarkan maklumat yang dibawa dalam jujukan asid amino).
Setiap protein yang terbentuk akan memainkan fungsi tertentu dalam sesebuah sistem
biologi, misalnya enzim dalam tubuh manusia.
Rajah 1: Struktur am jalinan molekul DNA.
Sumber : http://www.accessexcellence.org/RC/VL/GG/images/dna2.gif
1.2 Genomik
DNA wujud sebagai kromosom linear dalam eukaryotes (tumbuhan dan haiwan), dan
kromosom gegelang dalam prokaryotes (bakteria, virus). Set kromosom dalam sel
membentuk genom. Genomik adalah kajian terhadap genom sesuatu organisma. Kajian
ini meliputi usaha untuk menentukan keseluruhan jujukan DNA sesuatu organisma dan
juga pemetaan genetik skala-halus (fine-scale genetic mapping). Bidang ini juga
merangkumi kajian fenomena intragenomik seperti heterosis, epistasis, pleiotropy dan
interaksi-interaksi lain antara loki (loci) dan alel dalam sesuatu genom. Sebaliknya,
penyelidikan terhadap fungsi dan peranan sesuatu gen adalah fokus utama biologi
molekular atau genetik. Ini merupakan topik utama dalam bidang penyelidikan perubatan
dan biologi moden. Penyelidikan terhadap sesuatu gen tidak digolongkan dalam
5. genomik, melainkan tujuan analisis maklumat genetik, laluan dan fungsi adalah untuk
menjelaskan kesan kedudukan dan tindak balasnya terhadap keseluruhan rangkaian
genom.
1.3 Proteomik
Proteomik merujuk kepada kajian mengenai proteom, iaitu pelengkap kepada protein
yang hadir dalam sel atau jenis sel. Genomik struktural pula menentukan secara sistematik
struktur protein yang mewakili semua gumpalan (fold) yang mungkin. Kaedah
eksperimen utama dalam kajian proteomik termasuk 2D elektrophoresis, mass
spectrometry, protein microarrays, dan penapisan/penyaringan two-hybrid. 2D
elektrophoresis membolehkan pengasingan protein dalam jumlah yang banyak. Manakala
mass spectrometry membolehkan kekerapan throughput yang tinggi dalam
pengenalpastian protein dan penjujukan peptide. Protein microarrays pula membolehkan
pengesanan paras relatif sebilangan besar protein yang wujud dalam sel, dan penyaringan
two-hybrid membolehkan penjelajahan sistematik terhadap interaksi antara protein-
protein.
1.4 Proses Penghasilan Data dan Maklumat
Sebahagian besar set data yang dihasilkan dalam Bioinformatik merupakan data jujukan
biologi dan maklumat yang diterbitkan daripadanya. Data jujukan biologi ini merangkumi
jujukan asid nukleik seperti DNA yang diwakilkan dalam bentuk set 4 huruf – C, G, A, T.
Setiap huruf mewakili monomer DNA yang digelar bes (base). Selain itu data biologi
juga merangkumi jujukan protein yang diwakilkan kepada 20 huruf bagi mewakili
monomer protein asid amino. Amnya gen adalah jujukan asid nukleik yang
memegang maklumat berkenaan jenis protein yang disintesis (dijana) berdasarkan
maklumat tersebut. Jujukan asid amino menggambarkan bentuk 3-dimensi protein
berkenaan, manakala bentuk protein menentukan fungsi biologi yang akan dilaksanakan
oleh protein terbabit. Anotasi dan data struktur protein merupakan maklumat berkenaan
susunan protein. Anotasi yang dihubungkan kepada jujukan merupakan fungsi biologi
yang akan terhasil. Contoh 264 jujukan asid amino tertentu berfungsi sebagai enzim
tertentu. Penjujukan data dihasilkan melalui proses penjujukan. Salah satunya dinamakan
chain termination reaction (juga dikenali sebagai dideoxy sequencing atau Sanger
method). Dua kaedah utama yang digunakan adalah Sanger-Coulson method dan
chemical degradation method (Maxam-Gilbert method). Proses ini akan menghasilkan
6. jujukan data yang mewakili struktur asid nukleik. 3 jenis jujukan DNA yang digunakan
adalah genomic DNA, cDNA (copy DNA) dan recombinant DNA. Teknologi terkini
hanya membenarkan ~800bp untuk sekali bacaan reaksi (reaction). Maka molekul
DNA yang bersaiz besar memerlukan bacaan beberapa kali. Untuk menggabungkan
kesemua bacaan melibatkan proses pengawalan kualiti, seperti base calling dan penilaian
kualiti (menggunakan Phred), membuang jujukan vektor (menggunakan vector_clip atau
CrossMatch), menapis jujukan berulang (menggunakan RepeatMasker), dan akhirnya
menggabungkan semula semua bacaan menjadi contigs atau contiguous sequence reads
(menggunakan Phrap). Secara keseluruhannya, proses analisis dijalankan dari peringkat
yang terperinci (genomik) kepada peringkat yang lebih umum (fungsi biologi). Proses
analisis bermula dengan mendapatkan data jujukan di peringkat pengekstrakan sampel di
makmal. Melalui proses ekstrak akan menghasilkan data jujukan asid nukleik. Kemudian
data jujukan akan dianalisis melalui beberapa peringkat sehinggalah kepada mengenal
pasti fungsi biologi sesuatu protein dalam sebuah sistem biologi. Peringkat proses ini
digambarkan dalam Rajah 2 di bawah. Setiap peringkat analisis akan melibatkan
penggunaan pelbagai pangkalan data dan alat analisis untuk menghasilkan maklumat-
maklumat yang tertentu. Pada peringkat genomik, jujukan data diekstrak dan
dikumpulkan. Kemudian pangkalan data digunakan untuk mencari jujukan yang baru
diperolehi. Carian data digunakan untuk mengenal pasti sekiranya jujukan
sampel itu pernah ditemui/tidak sebelumnya. Manakala kaedah komputasi menggunakan
alat adalah untuk meramal gen putative. Peringkat seterusnya adalah melibatkan
penggunaan tatasusunan-mikro (mikroarray) untuk mengesan profil ekspresi atau
penampilan sesuatu gen atau jujukan. Kemudian algoritma pengelompokan (clustering
algorithm) digunakan untuk mengurangkan kompleksiti data.
7. Rajah 2: Penemuan berpandu-maklumat (Information driven discovery)
Analisis proteomik pula melibatkan analisis berbilang-dimensi ke atas kelompok gen.
Analisis ini berdasarkan kepada ekspresi corak protein, struktur/fungsi dan data interaksi
protein-ke-protein. Ini membolehkan analisis dibuat terhadap struktur yang bersambung
di pelbagai peringkat kedalaman (depth). Kemudian analisis dalam konteks sistem biologi
dilakukan. Analisis ini adalah untuk meneliti laluan (pathway) protein dan metabolik,
rangkaian pengawalaturan atau proses selular/jaringan yang lebih kompleks. Maka
jujukan proses ini secara tidak langsung menimbulkan beberapa masalah. Antara cabaran
yang dihadapi adalah integrasi maklumat eksperimental dan terkomputasi supaya setiap
maklumat ini saling melengkapi antara satu sama lain. Namun dengan adanya sejumlah
besar data genomik dan proteomik bagi pelbagai organisma dan hidupan membolehkan
penyelidik mengenal pasti, misalnya, protein yang homolog dalam organisma yang sangat
jauh kaitannya (distantly related) dengan lebih efisien menerusi penjajaran
jujukan. Jadi berdasarkan peringkat-peringkat di atas, bidang bioinformatik secara
keseluruhannya cuba untuk menghimpun, menganotasi dan menganalisis data genomik
dan proteomik, kemudian mengaplikasikan teknik komputasi kepada masalah biologi
seperti pencarian gen dan cladistics.
2.0 Pembangunan perisian dan sistem pangkalan data
2.1 Pengaturcaraan dan pembangunan perisian
Perisian dihasilkan melalui proses pengaturcaraan. Pengaturcaraan ialah tugas menulis
atur cara atau program. Kemudian atur cara akan dikompil untuk menghasilkan perisian
komputer. Setiap bahasa pengaturcaraan menyediakan perisian yang dipanggil
8. pengkompil / penterjemah. Pengaturcaraan perisian terbahagi kepada dua jenis – yang
terkompil dan berskrip (diterjemah). Bahasa terkompil menggunakan pengkompil,
manakala bahasa berskrip menggunakan penterjemah. Atur cara terkompil lebih pantas
tetapi pengemaskinian dan penyuntingan agak remeh. Manakala pengaturcaraan
berskrip menghasilkan atur cara yang lebih perlahan, tetapi mudah untuk diselenggara dan
dikemaskini. Contoh bahasa terkompil ialah C, C++, Java, Ocaml, Visual Basic.
Manakala bahasa berskrip termasuk Perl, Python, Ruby, HTML, PHP dan sebagainya.
Namun dalam kes tertentu ada juga bahasa yang tergolong dalam kedua-dua kategori,
misalnya BASIC dan Perl, iaitu boleh dikompil atau diterjemah. Keupayaan pemprosesan
komputer yang semakin pantas menjadikan atur cara skrip lebih pantas berbanding
sebelumnya. Ini mendorong penggunaan atur cara berskrip bagi konteks aplikasi. Namun
pada konteks sistem, aplikasi terkompil tetap menjadi pilihan kerana kepantasan dan
pelaksanaan yang lebih efisien berbanding atur cara berskrip. Pengatur cara perlu tahu
membezakan kelebihan dan kekurangan sesuatu sistem pembangunan perisian (seperti
memilih antara terkompil atau berskrip) bagi membolehkan mereka membangunkan
perisian yang terbaik dan sesuai dengan matlamat projek. Terdapat beratus bahasa
pengaturcaraan. Umumnya, pemilihan bahasa pengaturcaraan bergantung kepada
keupayaan pengatur cara untuk menguasai bahasa pengaturcaraan tersebut dan keupayaan
bahasapengaturcaraan untuk menghasilkan perisian yang dikehendaki. Selain itu,
pemilihan bergantung kepada:
• Kesesuaian dengan sistem/perisian yang dibangunkan – bahasa pengaturcaraan
dibangunkan dengan matlamat tertentu seperti pemprosesan teks.
• Sokongan pustaka (library) bagi bahasa pengaturcaraan – lebih banyak lebih baik
• Bahasa yang terkenal – jika terkenal kemungkinan lebih banyak sokongan
Pengaturcaraan tidak mempunyai satu kaedah umum yang tetap. Sebaliknya bergantung
pada pengatur cara untuk menghasilkan atur cara yang dapat menyelesaikan masalah yang
cuba diselesaikan. Oleh itu pengatur cara perlu ada kemahiran menganalisis masalah
(pengaturcaraan), mereka bentuk dan mengimplimentasi sistem, menguji serta mampu
mendokumentasi atur cara yang mereka hasilkan. Semua proses ini merupakan peringkat-
peringkat dalam kitar hayat pembangunan sistem (System/Software Development Life
Cycle atau SDLC). Bagi projek/sistem yang besar, individu yang berbeza ditugaskan pada
setiap peringkat. Namun bagi sistem yang kecil, pengatur cara boleh melakukan
kesemuanya. Oleh sebab masalah pengaturcaraan yang semakin kompleks, ditambah pula
kemampuan sistem pembangunan sistem yang semakin canggih, maka pengatur cara
9. (individu yang membangunkan/menulis atur cara) perlu lebih dinamik dan mempunyai
pelbagai kemahiran. Antaranya kemahiran menganalisis masalah. Perisian boleh
menyelesaikan banyak masalah pengiraan, namun masalah perlu dianalisis dan
diterjemahkan dengan betul kepada bentuk atur cara. Antara kaedah analisis masalah yang
semakin digemari ialah analisis berorientasi/berasaskan objek (Object Oriented Analysis
atau OOA). Hasil analisis ini membolehkan pengatur cara mereka bentuk penyelesaian
masalah menggunakan reka bentuk berasaskan objek (Object-Oriented Design atau
OOD). Oleh itu kemampuan untuk berfikir menggunakan konsep objek dan modul sangat
penting. Apabila menggunakan OOA dan OOD, sebaiknya pengatur cara membina atur
cara menggunakan bahasa yang mampu membina atur cara berorientasi objek juga
(Object-Oriented Programming atau OOP). Bahasa seperti Perl, Python, C++ dan Java
menyokong OOP. Bahasa OOP perlu membolehkan pengatur cara membina atur cara
dalam bentuk kelas dan objek. Ini supaya selaras dengan reka bentuk daripada peringkat
OOD. Seterusnya pengujian boleh dilakukan berasaskan konsep dan fungsi objek dalam
sistem aplikasi. Selain itu pengatur cara perlu mahir membina algoritma dan membentuk
penyelesaian menggunakan atur cara. Algoritma yang baik dan penggunaan struktur data
yang tepat boleh mendorong penghasilan atur cara/perisian yang efektif dan efisien.
Algoritma adalah susunan langkah penyelesaian masalah. Manakala struktur data merujuk
kepada struktur yang digunakan untuk menyimpan dan mengorganisasi data dalam
atur cara. Contohnya tatasusunan, senarai berpaut (linked list), pepohon (tree) dan cincang
(hash). Kelebihan sesuatu algoritma atau struktur data diukur berdasarkan tahap
kompleksiti. Kompleksiti diukur menggunakan unit O (big-oh). Jika suatu algoritma
menghasilkan O(n) manakala yang lain menghasilkan O(n2) atau O(mn), maka algoritma
dengan kompleksiti O(n) adalah yang terbaik.
2.2 Bahasa pengaturcaraan untuk Bioinformatik
Antara bahasa pengaturcaraan yang popular bagi bidang Bioinformatik adalah Perl. Perl
adalah bahasa berskrip, dan diterjemah menggunakan penterjemah Perl. Selain berbentuk
skrip, kelebihan Perl adalah keupayaan pemprosesannya untuk memproses data berjenis
rentetan (teks). Ia mampu menyokong OOP atau sekadar pengaturcaraan bermodul. Selain
itu Perl disokong oleh ramai individu dan mempunyai sokongan pustaka yang
komprehensif. Perl banyak digunakan sebagai asas perisian Bioinformatik kerana Perl
cekap memproses data jenis teks, menghubungkan aplikasi dengan pangkalan data dan
keupayaan yang tinggi bagi pengaturcaraan internet. Misalnya modul Bioperl Toolkit
10. menyediakan pelbagai kemudahan untuk membina perisian aplikasi berkaitan biologi dan
sains hayat (life sciences). Malah Perl digunakan bagi membangunkan perisian sistem
BioGrappler. Selain Perl, PHP, Python, Java, C, C++ juga turut digunakan dalam bidang
Bioinformatik.
2.3 Sistem pangkalan data
Pangkalan data ialah sistem perisian yang digunakan untuk menyimpan data dan
maklumat. Pangkalan data biasanya diurus oleh sebuah perisian khas yang dinamakan
sistem pengurusan pangkalan data (DataBase Management System atau DBMS). DBMS
merupakan enjin kepada pangkalan data dan merupakan sebahagian sistem pangkalan
data. DBMS menyediakan kemudahan mengurus penyimpanan dan dapatan semula data,
carian dan kemaskini. Antara DBMS yang terkenal adalah Oracle RDBMS (atau Oracle),
MySQL dan Microsoft-SQL server (MS-SQL). DBMS beroperasi ke atas pangkalan data
dengan menggunakan bahasa queri berstruktur yang dinamakan sebagai SQL (Structured
Query Language). SQL merupakan bahasa query pangkalan data standard yang
digunapakai oleh kesemua DBMS masakini. Oleh itu bagi pengatur cara perisian
berkaitan pangkalan data perlu mengetahui kaedah mengaturcara dalam bahasa SQL.
Terdapat dua jenis pangkalan data iaitu pangkalan data berskala kecil (MS-Access, dBase)
dan berskala besar (MS-SQL, MySQL dll). Skala ini menentukan kemampuan DBMS
untuk mengurus data. Bagi DBMS berskala kecil, kemampuannya terhad untuk mengurus
data dalam jumlah yang kecil. Biasanya ia hanya untuk kegunaan peribadi (cth desktop)
atau organisasi yang kecil. Manakala bagi DBMS skala besar, ia lebih sesuai digunakan
bagi tujuan penyimpanan data yang banyak. Sistem pangkalan data boleh dicapai dalam
pelbagai reka bentuk capaian. Setiap capaian boleh ditetapkan ciri-ciri keselamatan sama
ada bagi tujuan perlindungan/pengasingan atau menghalang capaian yang tidak
dibenarkan. Ciri keselamatan ini boleh diubah mengikut keperluan pemilik pangkalan
data. Seorang (atau sekumpulan) pentadbir akan menguruskan penetapan dan
penyelenggaraan pangkalan data. Pentadbir akan menetapkan hak capaian melalui akaun
pengguna dan mereka mempunyai penguasaan sepenuhnya terhadap data yang disimpan
di dalam pangkalan data. Dari sudut reka bentuk sistem, pangkalan data boleh dipasang
pada komputer pengguna atau dipasang pada sebuah pusat perkhidmatan (di dalam
pelayan atau komputer kerangka) dan semua pengguna akan dihubungkan kepada
pangkalan data melalui sistem rangkaian intranet mahupun internet. Hasil perkembangan
teknologi komputer dan internet, banyak pihak yang menyediakan perkhidmatan
11. pangkalan data secara percuma di internet. Bioinformatik memerlukan sistem pangkalan
data kerana jumlah data yang dihasilkan melalui eksperimen dan komputasi (perisian)
adalah sangat banyak. Justeru sistem pangkalan data adalah sangat penting bagi
membolehkan data disimpan dan diurus dengan baik. Selain itu DBMS membolehkan
carian semula maklumat dilakukan dengan cepat dan pantas. Proses seperti penjajaran
jujukan memerlukan perisian pengkomput (cth BLAST) mencari semula jujukan-jujukan
yang pernah direkodkan sebelumnya dalam pangkalan data dan membuat perbandingan
supaya penjajaran (alignment) boleh dilakukan.
2.4 Sistem pangkalan data untuk Bioinformatik
Kebanyakan sistem pangkalan data atau DBMS mampu melaksanakan fungsi berkaitan
bidang Bioinformatik. Keperluan utama bagi pangkalan data berkaitan Bioinformatik
ialah DBMS tersebut mestilah mampu mengurus sejumlah data dan maklumat yang
banyak (maka MS-Access dan DBMS lain setaraf dengannya bukan satu pilihan bagi
tugas ini). Selain itu ia mesti mempunyai antaramuka sistem dan pengaturcaraan aplikasi
(Application Programming Interface atau API) yang membenarkan pelbagai jenis
aplikasi berhubung dengan DBMS tersebut. Sistem keselamatan bagi DBMS ini juga
perlu bertaraf tinggi kerana aplikasi berkaitan Bioinformatik selalunya akan dihubungkan
melalui internet. Antara DBMS yang popular adalah MySQL kerana ia percuma, selamat,
mudah diselenggara dan dipertingkatkan keupayaannya (kod terbuka atau open source).
Bahasa Perl mempunyai modul API bagi antaramuka pangkalan data iaitu DBI (DataBase
Interface), yang membenarkan pengatur cara menghubungkan perisian Bioinformatik
menggunakan skrip Perl dengan pelbagai jenis DBMS7. Ini termasuklah MySQL. Modul
pustaka seperti DBI sangat berguna untuk menghubungkan perisian dengan DBMS.
Selain DBI bagi Perl, wujud juga antaramuka pangkalan data yang lain. Misalnya ODBC
(Open Database Connectivity) bagi sistem pangkalan data yang menggunakan pelantar
Windows, manakala bahasa Java dengan JDBC (Java Database Connectivity). Melalui
antaramuka pangkalan data, proses menghubungkan perisian pengguna dengan
DBMS/pangkalan data akan jadi lebih mudah dan seragam. Secara teknikal DBI berlainan
kategori daripada ODBC dan JDBC kerana DBI adalah API bagi Perl untuk sambungan
pangkalan data. Malah DBI boleh berinteraksi dengan ODBC dan JDBC.
12. 2.6 Kepentingan internet untuk Bioinformatik
Perkembangan internet sangat berguna bagi perkembangan bidang Bioinformatik. Ini
kerana penggunaan pangkalan data menjadi sangat penting bagi tujuan rujukan dan
perbandingan (cth aplikasi BLAST8). Melalui teknologi internet, proses pencarian dan
capaian maklumat menjadi lebih mudah dan pantas. Misalnya pangkalan data GenBank di
Amerika Syarikat dan SwissProt di Switzerland mengandungi koleksi data yang sangat
komprehensif. Melalui penggunaan internet, penyelidik di Arab Saudi boleh merujuk
pangkalan data GenBank hampir serta-merta. Ini membolehkan penyelidikannya
dijalankan dengan lebih pantas. Selain itu, penyelidik atau sesiapa saja yang terlibat
dalam penyelidikan biologi boleh merujuk mana-mana pangkalan data melibatkan
maklumat biologi dengan mudah dan cepat. Aplikasi Bioinformatik juga memerlukan
keupayaan pemprosesan dan pengiraan yang tinggi. Ini kerana data-data yang dihasilkan
melalui eksperimen dan penggunaan perisian adalah sangat banyak. Maka pengurusan
data perlu cekap, efektif dan efisien. Selain mengurus pangkalan data, perisian juga
digunakan bagi melakukan komputasi. Komputasi yang dilakukan ada kalanya sangat
kompleks (seperti aplikasi pengaturcaraan dinamik atau dynamic programming), atau
pengiraan yang melibatkan sejumlah data yang banyak. Sistem grid adalah satu pilihan
yang digunakan untuk melaksanakan aplikasi perisian Bioinformatik kerana ia lebih
murah berbanding sistem kerangka utama, selain efektif dan efisien. Melalui penggunaan
internet dan rangkaian, sistem grid yang dipasang di satu tempat boleh dimanfaatkan
oleh pengguna yang berada di tempat lain. Misalnya EmasGrid merupakan sistem grid
yang diwujudkan hasil kerjasama di antara universiti utama di Malaysia bagi tujuan
penyelidikan, termasuk berkaitan aplikasi Bioinformatik. Sementara infrastruktur
NBBnet, iaitu usaha pembangunan bioteknologi kebangsaan, turut lebih mudah diwujud
dan dibangunkan dengan adanya kemudahan rangkaian.
6.0 Kesimpulan
Bidang Bioinformatik sedang berkembang dengan pesat sama ada di peringkat
kebangsaan mahupun global. Di peringkat tempatan, rangkaian NBBnet diwujudkan agar
dapat merancakkan usaha pembangunan bidang Bioteknologi dan Bioinformatik.
Kewujudan rangkaian ini dan GENOMalaysia, selain pelbagai usaha lain berkaitan bidang
Bioteknologi seharusnya diambil berat oleh lulusan TMK. Perkembangan bidang
Bioinformatik negara sememangnya menjanjikan potensi yang besar kepada lulusan
13. bidang TMK. Dengan memperkenalkan mereka terhadap bidang ini dan menghuraikan
perkembangan semasa diharap dapat memberi perspektif baru terhadap potensi bidang
TMK. Ini sekaligus memberi harapan yang lebih luas kepada lulusan TMK untuk
mendalami bidang masing-masing, dan juga melihat potensi ilmu mereka di bidang-
bidang lain yang berkaitan khususnya Bioinformatik. Namun yang lebih penting adalah
pengembangan dan pembangunan bidang Bioinformatik dan Bioteknologi. Melalui
penyertaan lulusan TMK, akan dapat mengisi keperluan dalam penyelidikan yang
memerlukan kemahiran TMK. Ini akan memberi impak dan rangsangan kepada bidang ini
untuk lebih maju. Sekaligus dapat meningkatkan perkembangan serta memajukan bidang
ini.Insyaallah….