Interpretasi Electropherogram DNA Sequencing

| No Comments

Teknologi DNA Sequencing yang umum digunakan saat ini adalah Dye-terminator sequencing, dimana output alat sequencer-nya adalah peak-peak yang terdiri atas 4 warna yang mewakili masing-masing nukleotida yaitu hijau untuk Adenine (A), merah untuk Thymine (T), biru untuk Cytosine (C) dan hitam untuk Guanine (G). Peak inilah yang dinamakan electropherogram. Electropherogram ini sudah diinterpretasikan (call) secara otomatis oleh program computer DNA Sequencer menjadi urutan-urutan basa nukleotida (A-C-G-T), namun masalahnya seringkali program komputer melakukan ‘kesalahan’ interpretasi pada electropherogram yang bermasalah sehingga urutan basa nukleotida yang dihasilkannya pun bisa salah. Hal ini tentu saja berpengaruh terhadap hasil penelitian dan juga analisa lanjutan yang akan kita lakukan terhadap hasil sekuensing tersebut.

Oleh karena itu, mutlak adanya interpretasi manual menggunakan ‘mata kepala sendiri’ untuk mencari peak-peak yang ambigu dan membuang bagian electropherogram yang mengandung terlalu banyak error. Berikut ini akan diuraikan masalah yang sering timbul pada electropherogram, apa penyebabnya dan bagaimana kita bisa mendapatkan interpretasi yang benar.

Seberapa bersihkah electropherogram kita?

Electropherogram yang bersih memiliki ciri sebagai berikut:

  • jarak/spasi antar peak yang sama
  • setiap peak hanya terdiri dari satu warna
  • ketinggian peak bisa bervariasi hingga berbeda 3 kali lipat antara peak tertinggi dengan terendah
  • mungkin saja terdapat peak-peak ‘noise’ pada baseline, namun jika kualitas template dan primernya bagus biasanya noise ini sangat minim dan tidak berpengaruh secara signifikan terhadap pembacaan

Berikut ini adalah contoh electropherogram, coba perhatikan tingkat kebersihan baseline-nya.

Gambar 1. Electropherogram tanpa baseline noiseGambar 1. Electropherogram tanpa baseline noise
Gambar 1. Electropherogram tanpa baseline noise
Gambar 2. Electropherogram dengan sedikit baseline noiseGambar 2. Electropherogram dengan sedikit baseline noise
Gambar 2. Electropherogram dengan sedikit baseline noise
Gambar 3. Electropherogram dengan baseline noise yang cukup menggangguGambar 3. Electropherogram dengan baseline noise yang cukup mengganggu
Gambar 3. Electropherogram dengan baseline noise yang cukup mengganggu

Gambar 1 adalah electropherogram yang sangat bagus, excellent tanpa noise sama sekali. Pada gambar 2 terlihat sedikit noise pada baseline tetapi peak utamanya masih sangat jelas dan komputer tidak melakukan kesalahan pembacaan sama sekali. Sedangkan pada gambar 3 noise-nya cukup tinggi sehingga mempengaruhi pembacaan (call) pada komputer. Coba perhatikan peak nomor 271, 273 dan 279 yang terdiri dari lebih satu warna, begitu pula pada posisi 291 dan 301 dimana terdapat peak yang menyisip diantara dua peak, dan yang paling parah pada posisi 310 yang sangat sulit untuk ditentukan manakah peak yang sebenarnya.

Noise seperti itu umum terjadi ketika sinyal sampel sequencingnya terlalu redup, ini bisa dilihat dari ‘signal intensity’ dari electropherogram yang ada pada windows yang berbeda pada program ‘Electropherogram viewer’ di komputer atau pada bagian atas hasil print-out electropherogram. Biasanya terlihat seperti berikut ini:

Signal G:168 A:110 T:160 C:186

Signal yang sangat baik memiliki nilai antara 500 – 2000 (meskipun nilai ini bervariasi antar instrument sequencer), signal antara 50 – 100 pun kadang-kadang memberikan hasil yang bagus namun tentu saja disertai dengan ‘bonus’ berupa noise. Biasanya bagian awal Electropherogram memiliki noise yang rendah dan semakin ke bagian akhir semakin meningkat pula noisenya, hal ini termasuk ‘normal’ karena keterbatasan teknologi kapiler yang digunakan, namun noise ini semakin menjadi-jadi jika dalam sampel masih terdapat sisa-sisa garam.

Komputer juga bisa salah

Namanya juga komputer, buatan manusia, tentu saja bisa salah menginterpretasikan peak pada electropherogram, malahan mata manusia bisa lebih baik dalam hal ini. Kadangkala komputer membaca peak-peak yang ambigu menjadi ‘N’, padahal mata manusia bisa melihat dengan jelas peak apa sebenarnya yang ada di situ. Oleh karena itu kita perlu melakukan pemindaian alias ‘scanning’ pada electropherogram untuk mencari peak-peak yang sangat kecil/rendah, nukleotida yang terbaca sebagai ‘N’ atau peak-peak yang jarak/spasinya lain daripada yang lain.

Peak-peak dengan jarak/spasi yang aneh

Cobalah perhatikan electropherogram sampel kita, pindailah peak-peaknya apakah terdapat spasi antara 2 peak yang terlalu rapat atau terlalu renggang, begitu pula pada spasi antar huruf ACGT yang ada di atas peak. Seperti pada gambar 4 berikut, jarak antara G dan A pada posisi 271 dan 272 lebih renggang dibanding peak-peak lainnya, ini memang error yang umum pada sequencer kapiler ABI, namun karena software sudah memprediksi error ini, dimana jarak antara peak G yang langsung diikuti oleh peak A umumnya lebih besar, maka hasil pembacaan electropherogram tidak terpengaruh.

Gambar 4. Electropherogram dengan mis-spacing yang tidak mempengaruhi pembacaanGambar 4. Electropherogram dengan mis-spacing yang tidak mempengaruhi pembacaan
Gambar 4. Electropherogram dengan mis-spacing yang tidak mempengaruhi pembacaan
Gambar 5. Electropherogram dengan mis-spacing yang memunculkan pembacaan 'N'Gambar 5. Electropherogram dengan mis-spacing yang memunculkan pembacaan ‘N’
Gambar 5. Electropherogram dengan mis-spacing yang memunculkan pembacaan ‘N’
Gambar 6. Electropherogram dengan mis-spacing yang memunculkan pembacaan 'G'Gambar 6. Electropherogram dengan mis-spacing yang memunculkan pembacaan ‘G’
Gambar 6. Electropherogram dengan mis-spacing yang memunculkan pembacaan ‘G’

Tetapi terkadang spasi yang terlalu lebar diartikan sebagai ‘N’ oleh software, padahal secara kasat mata terlihat bahwa tidak ada peak di bawah ‘N’ seperti yang terlihat pada gambar 5 pada posisi peak 66. Bahkan pada gambar 6 terlihat ada basa ‘G’ yang disisipkan antara peak 58 dan 60, padahal pada posisi 59 tersebut yang ada hanyalah peak noise pada baseline, tetapi software membacanya sebagai ‘real peak’. Tentu saja hal ini dapat berakibat fatal terhadap pembacaan electropherogram.

Peak heterozygous (double)

Idealnya satu posisi peak hanya terdiri atas satu warna saja, namun bisa saja terjadi satu posisi diisi oleh lebih dari satu warna peak, biasanya jika produk PCR yang disekuensing berasal dari DNA genom diploid, dimana posisi yang polimorfik akan memunculkan kedua nukleotida secara simultan. Hasil pembacaannya bisa jadi ‘N’ atau salah satu peak yang lebih tinggi.

Gambar 7. Dua peak heterozygot dengan signal sama kuat sehingga terbaca sebagai 'N'Gambar 7. Dua peak heterozygot dengan signal sama kuat sehingga terbaca sebagai ‘N’
Gambar 7. Dua peak heterozygot dengan signal sama kuat sehingga terbaca sebagai ‘N’
Gambar 8. Dua peak heterozygot dengan salah satu signal lebih kuatGambar 8. Dua peak heterozygot dengan salah satu signal lebih kuat
Gambar 8. Dua peak heterozygot dengan salah satu signal lebih kuat

Gambar 7 merupakan contoh yang sangat jelas akan adanya SNP (single nucleotide polymorphism) heterozygous, pada kasus ini salah satu alel memiliki basa C dan satunya lagi T, dan keduanya nampak jelas sebagai dua peak yang saling menumpuk, dan dibaca oleh software sebagai ‘N’. Sementara itu pada gambar 8 sekilas tidak nampak adanya SNP karena pada posisi peak 192 terbaca sebagai C, padahal di situ terdapat pula peak G yang lebih rendah.

Pemindaian dengan mata bisa saja dilakukan untuk mencari peak heterozygous seperti ini, namun jika jumlah sampelnya sangat banyak tentu menjadi sangat tidak praktis. Untunglah beberapa software berikut dapat menolong kita melakukan pemindaian dan mendeteksi adanya peak heterozygous:

  • Sequencher (GeneCodes, Inc)
  • Mutation Surveyor (SoftGenetics, Inc)
  • PHRED/PHRAP/POLYPHRED/CONSED Suite

Pemisahan/Resolusi Peak yang buruk pada bagian akhir electropherogram

Ini merupakan keterbatasan dari teknologi capillary sequencing yang berbasis metode dye terminator sequencing. Peak yang sempurna sekalipun hanya memberikan data yang akurat hingga batas tertentu, selanjutnya peak-peak yang muncul akan semakin melebar dan bergeser sehingga software maupun mata manusia akan sulit untuk menginterpretasikan electropherogram tersebut secara akurat. Hasil pembacaan software pun seringkali tidak dapat diandalkan.

Tergantung dari kualitas sample sequencing, kapiler, polimer serta bahan-bahan pendukung lainnya, biasanya electropherogram memiliki kualitas peak yang baik hingga posisi 600-700an, setelah itu kualitasnya makin memburuk.

Gambar 9. Peak chromatogram dengan resolusi mulai memburukGambar 9. Peak chromatogram dengan resolusi mulai memburuk
Gambar 9. Peak chromatogram dengan resolusi mulai memburuk
Gambar 10. Peak chromatogram dengan resolusi burukGambar 10. Peak chromatogram dengan resolusi buruk
Gambar 10. Peak chromatogram dengan resolusi buruk

Pada gambar 9, kualitas peak sudah tidak sebaik yang seharusnya, selain ‘kaki’ yang makin melebar, dua peak sewarna yang berurutan terlihat menyatu, namun hasil pembacaan software masih akurat dan kita pun masih dapat melihat puncak masing-masing peak yang terlihat menyatu tersebut, seperti pada posisi 790-791, 792-793, 795-796 dan yang lainnya. Di samping itu jarak/spasi antar peak pun masih seragam dan tidak terlihat ‘keanehan’.

Lain halnya dengan electropherogram pada gambar 10, peak-peak yang menyatu sudah tidak nampak lagi masing-masing puncaknya (misalnya posisi 969-970, 973-974), juga muncul ‘N’ pada posisi 982 yang tidak bisa kita pastikan apakah di situ seharusnya G atau A, dan bisakah kita pastikan berapa jumlah A setelah itu?

Jadi kita harus berhati-hati pada bagian akhir electropherogram, lihatlah apakah terdapat nukleotida ganda yang seharusnya hanya satu, lalu benarkah hitungan jumlah nukleotida yang berurutan, dan bahkan kadang-kadang satu nukleotida yang diapit oleh deretan nukleotida yang sewarna ‘tenggelam’ di bawah peak yang sangat lebar tadi. Pokoknya jika melihat spasi yang tidak seragam, waspadalah.

Jika masalahnya sudah terlalu banyak, buang saja bagian tersebut

Jika hasil pembacaan software sudah memiliki banyak error, interpretasi manual dengan ‘mata kepala sendiri’ sudah sangat sulit dilakukan dan error yang terjadi sudah di luar toleransi kebutuhan kita, maka abaikan saja sisa sekuen yang mengandung error tersebut. Hingga batas mana sekuen tersebut akan kita ambil bergantung pada kebutuhan dan tujuan kita melakukan DNA Sequencing. Beberapa peneliti yang hanya ingin melihat posisi intro-ekson atau hanya ingin mengetahui identitas suatu DNA bakteri misalnya, mungkin tidak terlalu terganggu dengan adanya sedikit error. Namun jika tujuan sequencing tersebut adalah untuk publikasi ilmiah atau pencarian SNP, maka error yang sedikit saja tidak dapat ditolerir, hanya sekuen dengan kualitas terbaik saja yang akan diambil.

Untuk mengatasi error yang terjadi, bisa dilakukan dengan cara mensekuen dari arah sebaliknya, sehingga ambiguitas pada satu arah sekuen bisa diatasi dengan hasil sekuen komplemennya.

Sumber: The University of Michigan, DNA Sequencing Core

Other articles you may like:

Tags: ,

Tentang Penulis

Belum ada informasi mengenai penulis

Leave a Reply