Sumber
Bioinformatika merupakan ilmu terapan yang lahir
dari perkembangan teknologi informasi dibidang molekular. Pembahasan dibidang
bioinformatik ini tidak terlepas dari perkembangan biologi molekular modern,
salah satunya peningkatan pemahaman manusia dalam bidang genomic yang terdapat
dalam molekul DNA.
Sejarah
Istilah bioinformatics mulai dikemukakan
pada pertengahan era 1980-an untuk mengacu pada penerapan komputer
dalam biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika
(seperti pembuatan basis data dan pengembangan algoritma
untuk analisis sekuens biologis) sudah
dilakukan sejak tahun 1960-an.
Kemajuan teknik biologi
molekular dalam mengungkap sekuens biologis dari protein (sejak awal
1950-an)
dan asam nukleat
(sejak 1960-an) mengawali perkembangan basis data dan teknik analisis sekuens
biologis. Basis data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika
Serikat, sementara basis data sekuens DNA dikembangkan pada akhir
1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology Laboratory,
Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing
DNA yang lebih cepat pada pertengahan 1970-an menjadi landasan terjadinya
ledakan jumlah sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an,
menjadi salah satu pembuka jalan bagi proyek-proyek pengungkapan genom, meningkatkan
kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan
lahirnya bioinformatika.
Perkembangan Internet
juga mendukung berkembangnya bioinformatika. Basis data bioinformatika yang
terhubung melalui Internet memudahkan ilmuwan mengumpulkan hasil sekuensing ke
dalam basis data tersebut maupun memperoleh sekuens biologis sebagai bahan
analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui Internet
memudahkan ilmuwan mengakses program-program tersebut dan kemudian memudahkan
pengembangannya.
Penerapan utama bioinformatika (Prediksi struktur protein)
Model protein hemaglutinin
dari virus
influensa
Secara kimia/fisika, bentuk struktur protein
diungkap dengan kristalografi sinar-X
ataupun spektroskopi NMR, namun
kedua metode tersebut sangat memakan waktu dan relatif mahal. Sementara itu,
metode sekuensing
protein relatif lebih mudah mengungkapkan sekuens asam amino
protein. Prediksi struktur protein berusaha meramalkan struktur tiga dimensi
protein berdasarkan sekuens asam aminonya (dengan kata lain, meramalkan
struktur tersier dan struktur sekunder berdasarkan struktur primer protein).
Secara umum, metode prediksi struktur protein yang ada saat ini dapat
dikategorikan ke dalam dua kelompok, yaitu metode pemodelan protein komparatif
dan metode pemodelan de novo.
Pemodelan protein komparatif (comparative protein
modelling) meramalkan struktur suatu protein berdasarkan struktur protein
lain yang sudah diketahui. Salah satu penerapan metode ini adalah pemodelan
homologi (homology modelling), yaitu prediksi struktur tersier
protein berdasarkan kesamaan struktur primer protein. Pemodelan homologi didasarkan
pada teori
bahwa dua protein yang homolog memiliki struktur
yang sangat mirip satu sama lain. Pada metode ini, struktur suatu protein
(disebut protein target) ditentukan berdasarkan struktur protein lain (protein
templat) yang sudah diketahui dan memiliki kemiripan sekuens dengan protein
target tersebut. Selain itu, penerapan lain pemodelan komparatif adalah protein
threading yang didasarkan pada kemiripan struktur tanpa kemiripan
sekuens primer. Latar belakang protein threading adalah bahwa struktur
protein lebih dikonservasi daripada sekuens protein selama evolusi;
daerah-daerah yang penting bagi fungsi protein dipertahankan strukturnya. Pada
pendekatan ini, struktur yang paling kompatibel untuk suatu sekuens asam amino
dipilih dari semua jenis struktur tiga dimensi protein yang ada. Metode-metode
yang tergolong dalam protein threading berusaha menentukan tingkat
kompatibilitas tersebut.
Dalam pendekatan de
novo atau ab initio, struktur protein ditentukan dari sekuens
primernya tanpa membandingkan dengan struktur protein lain. Terdapat banyak
kemungkinan dalam pendekatan ini, misalnya dengan menirukan proses pelipatan (folding)
protein dari sekuens primernya menjadi struktur tersiernya (misalnya dengan
simulasi dinamika molekular), atau
dengan optimisasi global fungsi energi protein. Prosedur-prosedur ini cenderung
membutuhkan proses komputasi yang intens, sehingga saat ini hanya digunakan
dalam menentukan struktur protein-protein kecil. Beberapa usaha telah dilakukan
untuk mengatasi kekurangan sumber daya komputasi tersebut, misalnya dengan superkomputer
(misalnya superkomputer Blue Gene dari IBM) atau komputasi terdistribusi (distributed
computing, misalnya proyek Folding@home)
maupun komputasi grid.