Sequence Alignment di BioEdit
Kalau di dunia pengolah kata ada Microsoft Word dan sejenisnya, maka di dunia bioinformatika ada BioEdit. BioEdit adalah sebuah program Sequence Alignment Editor buatan Tom Hall dari Ibis Biosciences Carlsbad USA, yang berguna untuk melakukan analisa-analisa bioinformatika terhadap sekuen-sekuen DNA, RNA maupun protein. Kita dapat melakukan ‘manipulasi’ sekuen dan mengolah sekuen tersebut sesuai keperluan. Mari kita lihat salah satu kemampuan BioEdit diantara seabreg kemampuan lainnya, yaitu Sequence Alignment. Saat ini kita fokuskan pada cara melakukan sequence alignment untuk hasil pembacaan sekuen suatu fragment DNA yang dibaca secara bi-directional alias dua arah (forward-reverse atau sense-antisense).
Teori Dasar
Pairwise Sequence Alignment
Sebelum melangkah ada baiknya kita tilik dulu sedikit mengenai apa yang akan kita kerjakan dan teori seputar sequence alignment ini.
Misalkan Anda memiliki sebuah gen (misal 16S rRNA bakteri) hasil amplifikasi (PCR) dengan ukuran 1300bp yang akan ditentukan urutan-urutan basa nukleotidanya. Maka yang dilakukan adalah mensekuen gen tersebut pada kedua utasnya menggunakan dua primer (16S Forward dan 16S Reverse) karena panjang hasil pembacaan alat sequencer ini terbatas tidak mampu menjangkau seluruh gen. Proses berikutnya adalah menyambungkan kedua hasil pembacaan alat sehingga menjadi sequen utuh menggunakan teknik Pairwise Sequence Alignment.
Berikut ini diagram proses yang terjadi dalam proses analisanya.
Antarmuka BioEdit
Antarmuka BioEdit sangat sederhana, jika kita membuka satu file hasil sequencing (*.ab1 atau *.abi) maka akan terbagi menjadi dua jendela, satu jendela berisi electropherogram dan satunya lagi teks sekuen DNA-nya.
Let’s Practise
Persiapan
Pastikan Anda sudah mempersiapkan hal-hal berikut ini:
- Software BioEdit yang sudah terinstall di komputer.
Jika belum ada bisa diunduh secara gratis di http://www.mbio.ncsu.edu/BioEdit/BioEdit.html. BioEdit hanya bisa diinstall dan dijalankan pada sistem operasi Windows 95/98/NT/2000/XP.
- Dua buah file hasil pembacaan alat DNA Sequencer.
File yang digunakan adalah hasil pembacaan sebuah fragment DNA dengan dua arah pembacaan (menggunakan sepasang primer forward dan reverse). File ini biasanya memiliki format *.ab1 atau *.abi jika alat yang digunakan bermerk Applied Biosystems.
Lanjut! Anda siap untuk memulai.
Langkah-langkah
Menjalankan program BioEdit
- Jalankan program BioEdit dari Start Menu
- Buka file sekuen DNA (*.ab1 atau *.abi)
- File > Open > Pilih kedua file yang akan dialignment
Masing-masing file terdiri dari 2 jendela, yaitu chromatogram dan teks sekuen DNA.
Perhatikan chromatogram, lihat posisi peak terakhir yang masih menunjukkan kualitas pembacaan yang baik, karena peak dengan kualitas buruk atau setelah produk PCR-nya berakhir harus dibuang (trim). Selengkapnya bisa dibaca pada tulisan Interpretasi Chromatogram Hasil DNA Sequencing.
Pada contoh ini misalnya posisi 750.
Menghapus bagian sekuen yang tidak perlu
- Pindah ke jendela text sequence yang bersangkutan dan pastikan mode-nya adalah “Edit”-“Overwrite”.
- Letakkan kursor sebelum basa terakhir (misal 750)
- Klik “Edit” > “Select to End”
- Tekan tombol “Del” pada keyboard, atau klik “Edit” > “Delete”
- Jika bagian depan electropherogram juga kualitasnya buruk, bisa dihapus dengan cara yang sama.
- Lakukan hal yang sama untuk sekuen pasangannya (Reverse).
Menggabungkan 2 sekuen yang akan dialignment dalam satu jendela
- Seleksi Nama salah satu sekuen (misal yang Reverse)
- Tekan Ctrl+F8 pada keyboard, atau klik “Edit” > “Copy Sequence(s)”
- Pindah ke jendela sekuen pasangannya (misal yang Forward)
- Tekan Ctrl+F9 pada keyboard, atau klik “Edit” > “Paste Sequence(s)”
Sekarang kedua sekuen sudah berada dalam satu jendela
Melakukan Reverse Complement untuk menyamakan orientasi sekuen
- Seleksi nama salah satu sekuen (misal yang Reverse)
- Klik “Sequence” > “Nucleic Acid” > “Reverse Complement”
Melakukan Pairwise Alignment
- Seleksi kedua nama sekuen dengan kombinasi tombol “Shift” atau “Ctrl” dan Klik.
- Klik “Sequence” > “Pairwise Alignment” > “Align two sequences (Allow Ends to slide)”
- Hasil Alignment akan muncul pada jendela baru
Membuat Sekuen Konsensus
- Klik “Alignment” > “Create Consensus Sequence”
- Sekuen Consensus akan muncul di bawah kedua sekuen yang telah dialignment
- Lakukan Pengeditan pada Consensus Sequence dengan membandingkannya kepada Chromatogram
- Simpan file dengan mengklik “File” > “Save As”
Untuk memudahkan pengeditan, tampilan sekuen bisa diubah ke bentuk titik untuk sekuen yang conserve, artinya jika basa pada suatu sekuen sama dengan basa di atasnya, maka akan ditampilkan sebagai titik. Ini akan memudahkan kita dalam mencari sekuen mana yang tidak sesuai (mismatch). Anda bisa bereksperimen dengan berbagai tampilan sekuen pada BioEdit dengan mengaktifkan dan menonaktifkan tombol-tombol view.
Selamat Mencoba!
Other articles you may like:
- Membuat Pohon Filogenetik
- Memetakan Situs Enzim Restriksi
- VecScreen; Membersihkan Sekuen dari Kontaminasi Vektor
- PeakTrace; Meningkatkan Kualitas Electropherogram
- PUBGET; Cara Express Mendapatkan PDF Jurnal
- Yuk Mendesain Primer dengan Primer3Plus
- Menguji Spesifisitas Primer





























22 Comments
makasih Mas Yepy….berguna sekali utk mahasiswa yg penelitiannya berhubungan dengan sekuensing, btw,,,mau kursus teh belum jadi yah.
sama-sama mbak.. wah syukur deh kalau ternyata SB bisa membantu mahasiswa penelitian. Keep update dgn info-info dari kita ya.. kalau mbak atau mahasiswanya mau kontribusi kirim tulisan ke SB juga boleh.
Oh iya, kapan-kapan kalo mau ngadain kursus bioinformatics, insyaAllah kita siap.
hmm, mas yepy, sekarang aku lagi kerja praktik di lembaga biologi molekkular eijkman, dan baru pertama kali sekuensing, hasil sekuensnya sudah kellar, tapi aku bingung intrepetasinya mas, aku sudah nge-alignment hasil sekuens sampelnya tapi bagamana caranya kita dapt melihat kalau primer yang kita gunakan telah berhasil menghibridisasi dna templatenya dan pembacaan sekuens conservenya bagaimana?
Halo mbak Asri,
Saat kita melakukan sequencing pake metode dye-terminator (yang saat ini umum digunakan), sekuen primer yang kita gunakan pada reaksi cycle sequencing tidak akan terbaca oleh alat, karena primer yang digunakan tidak dilabel fluorescent, otomatis tidak akan terbaca oleh detektor lasernya.
Tapi jangan khawatir, primer yang kita gunakan justru akan terbaca pada pembacaan dari arah sebaliknya. Jadi kalo primer Forward akan terbaca dari reaksi Reverse, dan sebaliknya, primer Reverse akan terbaca dari reaksi Forward. Tepatnya sekuen pada ujung 3′ (paling terakhir muncul) adalah sekuen dari primer arah sebaliknya itu.
Contoh nih, kita mensekuen dengan primer Forward, hasil pembacaan alat misalnya kayak gini (saya tampilkan ujung 3′-nya aja):
……tgatagatagaACGTGTCGTAGTG
Maka sekuen primer arah sebaliknya (reverse) adalah yang tercetak dengan huruf kapital. Tapi ingat, karena posisinya terbalik, maka sekuen tersebut harus di-reverse-complement-kan. Jadi sekuen Primer Reversenya adalah:
CACTACGACACGT
Begitu juga sebaliknya.
Perlu diingat juga, sekuen primer kita akan terbaca oleh alat jika produk PCR yang kita analisa tidak terlalu panjang, jadi masih dalam batas kemampuan alat sekuensernya. Soalnya setiap mesin sekuenser memiliki kemampuan panjang pembacaan yang berbeda-beda. So.. kalo produk PCR kita lebih dari 1 kb misalnya, sepertinya gak mungkin kita bisa dapetin sekuen primer.
Cara lainnya adalah dengan melakukan analisa BLAST dari hasil sekuen, tapi ini sifatnya perkiraan saja. Jadi jika primer yang kita gunakan adalah primer yang spesifik untuk gen tertentu atau daerah-daerah sekuen tertentu yang sudah diketahui, maka jika hasil BLAST menunjukkan identitas yang kita harapkan (sesuai dengan fungsi primernya), berarti bisa diduga kuat bahwa primer kita sudah bekerja dengan baik mengamplifikasi daerah yang dimaksud.
Pembacaan Sekuen Conserve
Pada artikel di atas, yang mbak maksud sekuen conserve mungkin yang saya tulis sebagai “Consensus” itu. Jadi, dari hasil pembacaan sekuen dari kedua arah, dilakukan pairwise alignment, dan setelah disejajarkan dibuatlah sekuen yang merupakan gabungan keduanya (consensus).
Terkadang ada ketidakcocokan hasil pembacaan dari suatu arah dengan arah sebaliknya, misalnya dari arah forward terbaca “C” sementara sebaliknya terbaca “A”. Ini bisa saja terjadi terutama jika terjadi error pembacaan karena satu dan lain hal. Nah kalo terjadi yang seperti ini maka kita harus merujuk kembali ke kedua electropherogramnya, pada posisi tersebut peak mana yang benar-benar peak, apakah C atau A, lalu kemudian ditentukan mana yang kita ambil.
OK mbak? semoga bisa membantu…
Halo mas Yepy, terima kasih atas postingannya ya…saya sangat terbantu sekali memahami hasil sequencing, terutama karena saya belajar otodidak aja nih. Kebenaran kemarin kami sequencing di CPI, selanjutnya kami ingin menentukan homology sekuens kami dengan sekuens yang udah dipublish di genebank, bisa nggak ya dengan bioedit? kalo bisa pake program yang mana? pairwise atau ClustalW? thank u in advance
Halo mbak, untuk mencari homology dgn database pada GenBank bisa menggunakan program BLAST. BLAST ini bisa dijalankan secara online di alamat http://blast.ncbi.nlm.nih.gov/blast.cgi, lalu dipilih “nucleotide blast”, atau kalau di BioEdit bisa diakses dari menu “Accessory Application” > “BLAST” > “NCBI BLAST”. Semoga bisa membantu…
Mas Yepy saya ingin sekali belajar lebih lanjut mengenai program Bioedit karena program ini akan saya gunakan untuk riset S3 saya. Apakah ada pelatihan untuk menggunakan program Bioedit ini ?
Wah, sepertinya kalo pelatihan khusus untuk BioEdit tidak ada (saya kurang tahu), tapi di situsnya sendiri mbak bisa mendownload manualnya. Coba cek di http://www.mbio.ncsu.edu/BioEdit/bioedit.html.
Mas, saya bingung dengan gen 16 S rRNA. Apakah arti 16 dan S nya? apakah 16S rRNA itu sama dengan 16S rDNA? Mas, kita butuh berapa lama waktu untuk sekuensing DNA? dan tempat2 mana yang bisa kita tuju untuk melakukan pembacaan urutan basa nukleotidanya? Terima kasih mas
Halo Frederika,
16S rRNA adalah RNA ribosom sub unit 16S, sebagaimana kita tahu RNA ribosom pada sel ada bermacam-macam, misalnya pada prokaryota ada sub unit 5S, 23S dan 16S. Sedangkan 16S rDNA adalah gene pada DNA yang menyandikan 16S rRNA, jadi gak perlu bingung dan ketuker-tuker
S pada 16S berarti satuan Svedberg, yaitu satuan fisika untuk koefisien sedimentasi alias pengendapan. Satuan ini digunakan untuk mengukur karakteristik suatu senyawa ketika diendapkan. Jadi RNA ribosom ketika diendapkan memiliki koefisien sedimentasi yang berbeda-beda, unit yang kecil memiliki koefisien sedimentasi yang kecil juga (5S), yang sedang 16S dan yang besar 23S.
Informasi lebih lengkap bisa dilihat di http://en.wikipedia.org/wiki/Svedberg dan http://en.wikipedia.org/wiki/Ribosomal_RNA.
Pembacaan sekuen DNA bisa dilakukan baik di Indonesia maupun di luar negeri. Untuk di Indonesia ada Lembaga Biologi Molekular Eijkman di Jakarta atau di PT. Wilmar Benih Indonesia di Cikarang. Kalau di luar negeri sangat banyak, misalnya di Malaysia (1st base) atau di Korea (Macrogen). Lama pengerjaan bervariasi mulai dari 1 hari hingga 2 mingguan, tergantung perusahaan/penyedia jasanya.
dear mas yepy..
wah, artikelnya memang sangat menarik skali ni mas..
jujur saya tertarik sama bioinformatik
kira2 kalau saya ingin belajar lbih dalam, dimana ya mas?
adakah tempat kursus atau kuliah khususnya y?
sbenernya background saya analis kimia hehe..
jadi saya msh ngerasa baru untuk ilmu yg ini..
Terima kasih..
Wika..
Dear Wika,
Thanks atas comment & ketertarikannya sama bioinformatika. Saya juga memiliki latar belakang pendidikan Kimia, namun karena pekerjaan sehari-hari adalah riset di bidang biologi molekuler, jadi mau tidak mau mesti berkutat juga dengan bidang bioinformatika ini.
Saat ini memang belum ada jurusan atau bidang studi khusus bioinformatika di Indonesia, setahu saya masih merupakan bagian mata kuliah dari fakultas bioteknologi yang sudah ada di beberapa universitas.
Untuk kursus, sebetulnya kami memang berencana untuk mengadakan kursus bioinformatika bagi siapa saja yang membutuhkan. Bagi yang berminat bisa mengumpulkan beberapa teman untuk bersama-sama mengikuti kursus/pelatihan bioinformatika tersebut.
Tunggu aja ya tanggal mainnya ^_^
Thanks…
Dear Mas Yepi,
selintas melihat artikel tentang BioEdit ini sudah menjadi makanan Saya sehari2 karena Saya bekerja sebagai bioinformatics officer di sebuah oil palm plantation. Beberapa software dan programing language Saya harus handle. Tidak hanya software saja, pada saat Saya pertama menjadi seorang bioinformatician, tantangan terbesar yang harus Saya hadapi adalah pada handling high throughput genotyping data sehingga dapat dilakukan analisa selanjutnya seperti genetic diversity.
Bioinformatika memang ilmu yang relatif baru di Indonesia, Saya melihat belum ada universitas yang mempunyai jurusan ini, akan tetapi jika program studi atau minor beberapa sudah ada.
Saya tunggu jika ada informasi pelatihan bioinformatika, terutama yang lebih cenderung ke computational Biology karena basic IT Saya kurang.
Mas Yeppi, thanks for your help to me about sequen my isolate last month ago, and now i will try to make of phylogenetic tree design. My be i found difficulty in make this design, i hope you can help me again. Thank’s
Dear pak Riza,
Sorry for late reply. Please find our article focusing on Phylogenetic tree here (http://sciencebiotech.net/membuat-pohon-filogenetik/)
Assalamu’alaykum
Sangat suka semua artikel yang ada di web ini. Banyak pertanyaan yg terjawab setelah buka web ini. Kebetulan penelitian skripsi saya juga tentang ini. Terimakasih mas yepy..
Kalau ada yang bingung, boleh ya mas tanya2..^^
Wa’alaikumussalam wr.wb.
Halo Rike, thanks buat comment-nya… Kita seneng kalo tulisan2 kita bisa membantu… Kalo ada yg masih bingung bisa tanya via comment ini, via Facebook Page Sciencebiotech.net atau via email…
assalamu’alaikum
mas yepy
saya mau nanya
tp ga terkait postingan ini
gpp ya
jadi riset saya
hasil sekuensingnya tidak full
seharusnya sampe 580 pb
tapi hasilnya cuma sampe 270 pb
itu kenapa yah?
mohon penjelasannya yah
trims
Halo kiki, penyebabnya bisa macam2.
- kapiler yg digunakan terlalu pendek jd cm bisa baca sampai 270an bp saja.
- coba dilihat electropherogramnya, kl peaknya tinggi/bagus trus stlh itu jadi garis lurus, berarti memang dna yg disekuen panjangnya cuma segitu (plus kira2 50 bp pertama yg tdk bisa dibaca oleh alat). Tp kalo sampai ujung peak msh tinggi dan sepertinya msh ada peak lanjutan, kemungkinan pertama tadi penyebabnya.
- coba cek lg panjang produk yg disekuen dgn elektroforesis gel utk meyakinkan. Apakah ada unspecific band pd panjang 270+/-50 bp. Bisa jadi itu yg tersekuen.
Buka juga http://sciencebiotech.net/topics/biotechnique/dna-sequencing/
Semoga bisa membantu..