Dalam tulisan terdahulu yang berjudul Troubleshooting Guide. ‘Keanehan-keanehan’ pada Electropherogram, kita bisa tahu bahwa tidak selamanya hasil pembacaan alat DNA sequencer kualitasnya baik. Nah, jika kebetulan electropherogram sampel kita jelek, jangan dulu frustasi, mungkin masih ada jalan keluar untuk meningkatkan kualitas electropherogram sehingga dapat terbaca dengan baik. Memang tidak semua electropherogram yang jelek bisa diselamatkan, jika kualitasnya sangat parah tentu jangan berharap bisa ‘disulap’ menjadi bagus. Tapi jika kualitas awalnya cukup bagus, bolehlah berharap kekurangannya dapat diperbaiki.
Software Basecaller

Kualitas electropherogram dapat ditingkatkan dengan menggunakan perangkat lunak (software) basecaller, software ini berfungsi untuk menterjemahkan data mentah (raw data) pembacaan laser pada mesin sequencer menjadi peak-peak electropherogram yang dapat dibaca komputer dan manusia (trace file). Selama ini pun setiap komputer mesin sequencer pasti memiliki software basecaller ini, namun kemampuan mereka masih ‘standar’ dan masih ada celah untuk ditingkatkan lagi. Beberapa software basecaller yang sangat terkenal yaitu Phred, TraceTuner, KB Basecaller dan PeakTrace. Semuanya dapat memproses data electropherogram yang dihasilkan oleh mesin sequencer bermerk ABI (Applied Biosystems, USA) berbagai tipe.
Pemrosesan Trace File vs Raw Data
Bagaimana software-software basecaller itu bekerja? Mari kita selidiki:
- Phred dan TraceTuner bekerja dengan melakukan re-basecalling data peak yang sudah diproses dalam trace file (bukan raw data), sehingga akurasi basecalling mereka sangat bergantung pada kualitas peak yang dihasilkan oleh ABI data collection software.
- KB Basecaller adalah software basecaller yang terintegrasi pada beberapa “Data Collection Software” bawaan mesin sequencing ABI generasi baru seperti seri 3100 dan 330/xl. Raw data diproses oleh KB Basecaller hingga menghasilkan trace file lengkap dengan Quality Value (QV) dari peak-peaknya.
- PeakTrace —seperti halnya KB Basecaller— bekerja dengan memproses kembali langsung dari raw datanya, namun dengan kelebihan yaitu mampu membaca raw data mesin generasi lama seperti ABI seri 3700 dan 377, yang sudah tidak didukung lagi oleh KB Basecaller. Dengan prinsip kerja seperti ini, PeakTrace bisa memberikan basecall yang lebih baik secara signifikan dengan error lebih sedikit dan pembacaan yang lebih panjang.
Dari keempat software di atas, kita akan membahas PeakTrace saja, selain tersedianya versi gratis, software ini pun diklaim memberikan output yang lebih baik.
PeakTrace
Peak trace dapat diakses langsung dari websitenya (www.nucleics.com) secara free alias gratis, tapi dibatasi maksimum 10 file yang dapat di-trace per hari. Jika jumlah file Anda sangat banyak dan rutin, Anda bisa menggunakan versi berbayar. PeakTrace dapat menangani electropherogram dari berbagai jenis mesin ABI baik keluaran baru atau lama, dan mesin sequencer MegaBACE.
Langsung Praktek
Untuk men-trace electropherogram menggunakan layanan PeakTrace gratis online, ikutilah langkah-langkah berikut, sangat simple:

- Klik tombol ‘Choose…‘ untuk mencari file electropherogram yang akan Anda trace (format *.ab1 atau *.abi). Anda dapat mengunggah (upload) 1 atau 2 file sekaligus.
- Tekan tombol ‘Upload Traces‘.
- Tunggulah sekitar 5-20 detik (waktu tunggu bergantung pada jumlah dan jenis trace dan juga load server saat itu).
- Klik link ‘Go to the PeakTrace basecalling results page now’.

- Hasil trace siap untuk diunduh (download) dengan mengklik link file output (sama dengan nama file yang anda submit).

Berikut ini adalah contoh tracing yang berhasil menggunakan PeakTrace. Nilai Q20+ meningkat sebesar 169 poin (32.50%). Bandingkan antara peak-peak sebelum (atas) dan setelah di-PeakTrace (bawah), terasa sangat membantu bukan?

Selalu berhasilkah?
Seperti telah disinggung di awal tulisan, tidak semua electropherogram dapat ditingkatkan kualitasnya menggunakan PeakTrace maupun software basecaller lainnya. Faktor utama yang membuat peak tidak dapat diperbaiki adalah:
- Panjang pembacaan. Untuk sampel DNA yang pendek, dimana pembacaan oleh KB Basecaller sudah sempurna maka kualitasnya tidak dapat ditingkatkan lagi oleh PeakTrace. Jadi kalau electropherogram Anda sudah bagus tidak perlulah ditrace lagi, hanya membuang waktu dan energi. Kemampuan PeakTrace akan lebih terasa pada sampel DNA yang cukup panjang dimana biasanya resolusi peak electropherogram pada bagian belakang (mendekati ujung 3′) sudah berkurang.
- Kekuatan signal raw data. Jika signal sangat lemah (mendekati level signal noise) maka PeakTrace tidak akan mampu berbuat apa-apa lagi. Kekuatan signal sangat penting terutama pada bagian ujung 3′. Ingat bahwa tugas PeakTrace adalah meningkatkan kualitas peak yang sudah cukup bagus, bukan membuat peak yang jelek jadi bagus.
- Kegagalan reaksi sequencing. Sudah pasti, PeakTrace dan software basecaller lainnya bukanlah pesulap yang dapat membuat suatu reaksi sequencing yang tidak terjadi menjadi seolah-olah berhasil. Signal yang bercampur akibat adanya dua template atau lebih. Kalau sudah begini, meskipun software basecaller mampu men-trace-nya, tetapi hasilnya tetap saja tidak berguna dan tidak memberikan hasil apa-apa.
 |
 |
 |
Sekuen pendek dengan pembacaan yang sudah bagus oleh software sequence collection
|
Kualitas electropherogram dengan signal yang lemah tidak dapat ditingkatkan lagi
|
PeakTrace tidak dapat menyulap reaksi yang gagal menjadi tiba-tiba berhasil
|
Bagaimana? Anda pun bisa langsung mencobanya sekarang dan membagi pengalaman Anda dengan pengunjung lainnya di kolom komentar di bawah.
Istilah pencarian terpopuler untuk artikel ini:
Teknologi DNA Sequencing yang umum digunakan saat ini adalah Dye-terminator sequencing, dimana output alat sequencer-nya adalah peak-peak yang terdiri atas 4 warna yang mewakili masing-masing nukleotida yaitu hijau untuk Adenine (A), merah untuk Thymine (T), biru untuk Cytosine (C) dan hitam untuk Guanine (G). Peak inilah yang dinamakan electropherogram. Electropherogram ini sudah diinterpretasikan (call) secara otomatis oleh program computer DNA Sequencer menjadi urutan-urutan basa nukleotida (A-C-G-T), namun masalahnya seringkali program komputer melakukan ‘kesalahan’ interpretasi pada electropherogram yang bermasalah sehingga urutan basa nukleotida yang dihasilkannya pun bisa salah. Hal ini tentu saja berpengaruh terhadap hasil penelitian dan juga analisa lanjutan yang akan kita lakukan terhadap hasil sekuensing tersebut.
Oleh karena itu, mutlak adanya interpretasi manual menggunakan ‘mata kepala sendiri’ untuk mencari peak-peak yang ambigu dan membuang bagian electropherogram yang mengandung terlalu banyak error. Berikut ini akan diuraikan masalah yang sering timbul pada electropherogram, apa penyebabnya dan bagaimana kita bisa mendapatkan interpretasi yang benar.
Seberapa bersihkah electropherogram kita?
Electropherogram yang bersih memiliki ciri sebagai berikut:
- jarak/spasi antar peak yang sama
- setiap peak hanya terdiri dari satu warna
- ketinggian peak bisa bervariasi hingga berbeda 3 kali lipat antara peak tertinggi dengan terendah
- mungkin saja terdapat peak-peak ‘noise’ pada baseline, namun jika kualitas template dan primernya bagus biasanya noise ini sangat minim dan tidak berpengaruh secara signifikan terhadap pembacaan
Berikut ini adalah contoh electropherogram, coba perhatikan tingkat kebersihan baseline-nya.
Gambar 1. Electropherogram tanpa baseline noise
Gambar 1. Electropherogram tanpa baseline noise
|
Gambar 2. Electropherogram dengan sedikit baseline noise
Gambar 2. Electropherogram dengan sedikit baseline noise
|
Gambar 3. Electropherogram dengan baseline noise yang cukup mengganggu
Gambar 3. Electropherogram dengan baseline noise yang cukup mengganggu
|
Gambar 1 adalah electropherogram yang sangat bagus, excellent tanpa noise sama sekali. Pada gambar 2 terlihat sedikit noise pada baseline tetapi peak utamanya masih sangat jelas dan komputer tidak melakukan kesalahan pembacaan sama sekali. Sedangkan pada gambar 3 noise-nya cukup tinggi sehingga mempengaruhi pembacaan (call) pada komputer. Coba perhatikan peak nomor 271, 273 dan 279 yang terdiri dari lebih satu warna, begitu pula pada posisi 291 dan 301 dimana terdapat peak yang menyisip diantara dua peak, dan yang paling parah pada posisi 310 yang sangat sulit untuk ditentukan manakah peak yang sebenarnya.
Noise seperti itu umum terjadi ketika sinyal sampel sequencingnya terlalu redup, ini bisa dilihat dari ‘signal intensity’ dari electropherogram yang ada pada windows yang berbeda pada program ‘Electropherogram viewer’ di komputer atau pada bagian atas hasil print-out electropherogram. Biasanya terlihat seperti berikut ini:
Signal G:168 A:110 T:160 C:186
Signal yang sangat baik memiliki nilai antara 500 – 2000 (meskipun nilai ini bervariasi antar instrument sequencer), signal antara 50 – 100 pun kadang-kadang memberikan hasil yang bagus namun tentu saja disertai dengan ‘bonus’ berupa noise. Biasanya bagian awal Electropherogram memiliki noise yang rendah dan semakin ke bagian akhir semakin meningkat pula noisenya, hal ini termasuk ‘normal’ karena keterbatasan teknologi kapiler yang digunakan, namun noise ini semakin menjadi-jadi jika dalam sampel masih terdapat sisa-sisa garam.
Komputer juga bisa salah
Namanya juga komputer, buatan manusia, tentu saja bisa salah menginterpretasikan peak pada electropherogram, malahan mata manusia bisa lebih baik dalam hal ini. Kadangkala komputer membaca peak-peak yang ambigu menjadi ‘N’, padahal mata manusia bisa melihat dengan jelas peak apa sebenarnya yang ada di situ. Oleh karena itu kita perlu melakukan pemindaian alias ‘scanning’ pada electropherogram untuk mencari peak-peak yang sangat kecil/rendah, nukleotida yang terbaca sebagai ‘N’ atau peak-peak yang jarak/spasinya lain daripada yang lain.
Peak-peak dengan jarak/spasi yang aneh
Cobalah perhatikan electropherogram sampel kita, pindailah peak-peaknya apakah terdapat spasi antara 2 peak yang terlalu rapat atau terlalu renggang, begitu pula pada spasi antar huruf ACGT yang ada di atas peak. Seperti pada gambar 4 berikut, jarak antara G dan A pada posisi 271 dan 272 lebih renggang dibanding peak-peak lainnya, ini memang error yang umum pada sequencer kapiler ABI, namun karena software sudah memprediksi error ini, dimana jarak antara peak G yang langsung diikuti oleh peak A umumnya lebih besar, maka hasil pembacaan electropherogram tidak terpengaruh.
Gambar 4. Electropherogram dengan mis-spacing yang tidak mempengaruhi pembacaan
Gambar 4. Electropherogram dengan mis-spacing yang tidak mempengaruhi pembacaan
|
Gambar 5. Electropherogram dengan mis-spacing yang memunculkan pembacaan ‘N’
Gambar 5. Electropherogram dengan mis-spacing yang memunculkan pembacaan ‘N’
|
Gambar 6. Electropherogram dengan mis-spacing yang memunculkan pembacaan ‘G’
Gambar 6. Electropherogram dengan mis-spacing yang memunculkan pembacaan ‘G’
|
Tetapi terkadang spasi yang terlalu lebar diartikan sebagai ‘N’ oleh software, padahal secara kasat mata terlihat bahwa tidak ada peak di bawah ‘N’ seperti yang terlihat pada gambar 5 pada posisi peak 66. Bahkan pada gambar 6 terlihat ada basa ‘G’ yang disisipkan antara peak 58 dan 60, padahal pada posisi 59 tersebut yang ada hanyalah peak noise pada baseline, tetapi software membacanya sebagai ‘real peak’. Tentu saja hal ini dapat berakibat fatal terhadap pembacaan electropherogram.
Peak heterozygous (double)
Idealnya satu posisi peak hanya terdiri atas satu warna saja, namun bisa saja terjadi satu posisi diisi oleh lebih dari satu warna peak, biasanya jika produk PCR yang disekuensing berasal dari DNA genom diploid, dimana posisi yang polimorfik akan memunculkan kedua nukleotida secara simultan. Hasil pembacaannya bisa jadi ‘N’ atau salah satu peak yang lebih tinggi.
Gambar 7. Dua peak heterozygot dengan signal sama kuat sehingga terbaca sebagai ‘N’
Gambar 7. Dua peak heterozygot dengan signal sama kuat sehingga terbaca sebagai ‘N’
|
Gambar 8. Dua peak heterozygot dengan salah satu signal lebih kuat
Gambar 8. Dua peak heterozygot dengan salah satu signal lebih kuat
|
Gambar 7 merupakan contoh yang sangat jelas akan adanya SNP (single nucleotide polymorphism) heterozygous, pada kasus ini salah satu alel memiliki basa C dan satunya lagi T, dan keduanya nampak jelas sebagai dua peak yang saling menumpuk, dan dibaca oleh software sebagai ‘N’. Sementara itu pada gambar 8 sekilas tidak nampak adanya SNP karena pada posisi peak 192 terbaca sebagai C, padahal di situ terdapat pula peak G yang lebih rendah.
Pemindaian dengan mata bisa saja dilakukan untuk mencari peak heterozygous seperti ini, namun jika jumlah sampelnya sangat banyak tentu menjadi sangat tidak praktis. Untunglah beberapa software berikut dapat menolong kita melakukan pemindaian dan mendeteksi adanya peak heterozygous:
- Sequencher (GeneCodes, Inc)
- Mutation Surveyor (SoftGenetics, Inc)
- PHRED/PHRAP/POLYPHRED/CONSED Suite
Pemisahan/Resolusi Peak yang buruk pada bagian akhir electropherogram
Ini merupakan keterbatasan dari teknologi capillary sequencing yang berbasis metode dye terminator sequencing. Peak yang sempurna sekalipun hanya memberikan data yang akurat hingga batas tertentu, selanjutnya peak-peak yang muncul akan semakin melebar dan bergeser sehingga software maupun mata manusia akan sulit untuk menginterpretasikan electropherogram tersebut secara akurat. Hasil pembacaan software pun seringkali tidak dapat diandalkan.
Tergantung dari kualitas sample sequencing, kapiler, polimer serta bahan-bahan pendukung lainnya, biasanya electropherogram memiliki kualitas peak yang baik hingga posisi 600-700an, setelah itu kualitasnya makin memburuk.
Gambar 9. Peak chromatogram dengan resolusi mulai memburuk
Gambar 9. Peak chromatogram dengan resolusi mulai memburuk
|
Gambar 10. Peak chromatogram dengan resolusi buruk
Gambar 10. Peak chromatogram dengan resolusi buruk
|
Pada gambar 9, kualitas peak sudah tidak sebaik yang seharusnya, selain ‘kaki’ yang makin melebar, dua peak sewarna yang berurutan terlihat menyatu, namun hasil pembacaan software masih akurat dan kita pun masih dapat melihat puncak masing-masing peak yang terlihat menyatu tersebut, seperti pada posisi 790-791, 792-793, 795-796 dan yang lainnya. Di samping itu jarak/spasi antar peak pun masih seragam dan tidak terlihat ‘keanehan’.
Lain halnya dengan electropherogram pada gambar 10, peak-peak yang menyatu sudah tidak nampak lagi masing-masing puncaknya (misalnya posisi 969-970, 973-974), juga muncul ‘N’ pada posisi 982 yang tidak bisa kita pastikan apakah di situ seharusnya G atau A, dan bisakah kita pastikan berapa jumlah A setelah itu?
Jadi kita harus berhati-hati pada bagian akhir electropherogram, lihatlah apakah terdapat nukleotida ganda yang seharusnya hanya satu, lalu benarkah hitungan jumlah nukleotida yang berurutan, dan bahkan kadang-kadang satu nukleotida yang diapit oleh deretan nukleotida yang sewarna ‘tenggelam’ di bawah peak yang sangat lebar tadi. Pokoknya jika melihat spasi yang tidak seragam, waspadalah.
Jika masalahnya sudah terlalu banyak, buang saja bagian tersebut
Jika hasil pembacaan software sudah memiliki banyak error, interpretasi manual dengan ‘mata kepala sendiri’ sudah sangat sulit dilakukan dan error yang terjadi sudah di luar toleransi kebutuhan kita, maka abaikan saja sisa sekuen yang mengandung error tersebut. Hingga batas mana sekuen tersebut akan kita ambil bergantung pada kebutuhan dan tujuan kita melakukan DNA Sequencing. Beberapa peneliti yang hanya ingin melihat posisi intro-ekson atau hanya ingin mengetahui identitas suatu DNA bakteri misalnya, mungkin tidak terlalu terganggu dengan adanya sedikit error. Namun jika tujuan sequencing tersebut adalah untuk publikasi ilmiah atau pencarian SNP, maka error yang sedikit saja tidak dapat ditolerir, hanya sekuen dengan kualitas terbaik saja yang akan diambil.
Untuk mengatasi error yang terjadi, bisa dilakukan dengan cara mensekuen dari arah sebaliknya, sehingga ambiguitas pada satu arah sekuen bisa diatasi dengan hasil sekuen komplemennya.
Sumber: The University of Michigan, DNA Sequencing Core
Istilah pencarian terpopuler untuk artikel ini: