You are on page 1of 3

Jak liczy komputer DNA

Olgierd UNOLD *
Troch historii Obliczenia biomolekularne, biologia obliczeniowa, DNA komputery to tylko niektre ze stosowanych obecnie okrele na dynamicznie rozwijajc si dziedzin wiedzy z pogranicza biologii molekularnej, inynierii genetycznej i informatyki. Prawdziwe zainteresowanie wiata nauki badaniami nad zastosowaniem reakcji biomolekularnych w obliczeniach przyniosa praca Leonarda Adlemana z 1994 roku, w ktrej zastosowano czsteczki kwasu dezoksyrybonukleinowego (DNA) oraz standardowe techniki inynierii genetycznej w rozwizaniu znanego w matematyce problemu drogi Hamiltona na przykadzie 7 miast poczonych 14 drogami. Problem ten mona sprowadzi do pytania: Jak mona odwiedzi 7 miast poczonych 14 drogami, bez dwukrotnego przechodzenia przez to samo miasto?. Obliczenia, ktre byy w istocie mudnymi laboratoryjnymi dowiadczeniami, trway tydzie, a warto doda, e czowiek rozwizuje to samo zadanie z uyciem kartki i owka (mona take zastosowa dugopis) w czasie ledwie 1 minuty (!). Adleman wybra nie bez powodu zadanie szukania drogi Hamiltona, gdy naley ono do tzw. zada NP-trudnych, czyli takich, dla ktrych nie znamy odpowiednio szybkich dokadnych algorytmw. Wszystkich moliwych cykli Hamiltona dla n miast w grafie penym jest a (n 1)!/2. Dla przykadu, dla 10 miast mamy 181 440 moliwych marszrut, dla 12 miast ju prawie 20 milionw. Poszukiwania optymalnej drogi dla kilkudziesiciu miast z zastosowaniem klasycznego komputera trwayby wiele dziesitkw lat. Obecne komputery DNA osigaj prdko reakcji molekularnych 330 TFLOPS (330 bilionw operacji zmiennoprzecinkowych na sekund, czyli 330 1012 ) i to w objtoci 5 mililitrw (objtoci yeczki od herbaty). Najszybszy komputer krzemowy, Blue Gene/L firmy IBM, osign w poowie ubiegego roku prdko 596 TFLOPS. Komputery DNA s jednak nie tylko szybkie, ale charakteryzuj si niezwyk gstoci upakowania informacji oraz znikomym zuyciem energii. Wystarczy powiedzie, e to, co obecnie wymaga zapisania na ponad bilionie CD-ROM-w, zajoby okoo 1 cm3 rwnowanego 1 gramowi DNA, a 1 dul pozwala na wykonanie okoo 2 1010 krotnie wicej operacji w biokomputerze ni w komputerze krzemowym. Dzisiaj obliczenia biomolekularne stosuje si, midzy innymi, w rozwizywaniu zada NP-trudnych, budowie bardzo duych pamici, masowych obliczeniach rwnolegych czy w konstrukcji molekularnych ukadw elektronicznych. Troch inynierii genetycznej No dobrze mgby teraz kto powiedzie. Rzeczywicie wyglda to wszystko imponujco, ale tak naprawd, jak to dziaa? Jak mona, uywajc moleku DNA, zrealizowa jakiekolwiek obliczenia? W rzeczywistoci komputer DNA opiera si na stosunkowo prostych mechanizmach genetyki molekularnej, a tak naprawd cay problem ley, po pierwsze, w dobrym modelu oblicze, a nastpnie prawidowym doborze wszystkich parametrw laboratoryjnego eksperymentu. W obliczeniach biomolekularnych wszelkie sygnay koduje si za pomoc czsteczek DNA. DNA jest polimerem skadajcym si z cigu nukleotydw: adeniny (oznaczanej symbolem A), tyminy (T), cytozyny (C) oraz guaniny (G). Enzym polimerazy na podstawie jednej nici DNA potrafi stworzy ni komplementarn, w ktrej zgodnie z zasad komplementarnoci WatsonaCricka zamiast C pojawia si G, zamiast T A, i na odwrt. acuch DNA moe by jednoniciowy lub dwuniciowy. acuch dwuniciowy powstaje dziki wizaniom pomidzy naprzeciwlegymi, komplementarnymi nukleotydami (rys. 2). Dwie komplementarne nici DNA owijaj si wok wsplnej osi, tworzc tzw. podwjn helis. acuch dwuniciowy moe mie dwie orientacje, tzw. 3 5 oraz 5 3. Jeeli dwa acuchy jednoniciowe s komplementarne i maj przeciwn orientacj, to s lepkie (ang. sticky).

Rys. 1. Graf uyty w dowiadczeniu Adlemana. Szukamy drogi Hamiltona z A do B.

Rys. 2. acuch DNA (Wikipedia).

Instytut Informatyki, Automatyki i Robotyki, Politechnika Wrocawska

W odpowiednich warunkach mog one w procesie hybrydyzacji utworzy acuch dwuniciowy, ktry stabilizuje si przez dziaanie enzymu ligazy. Istotnym narzdziem w inynierii genetycznej jest endonukleaza restrykcyjna (restryktaza), ktra rozcina podwjn ni DNA. W przypadku restryktaz typu II cicie nastpuje zawsze w okrelonym miejscu. Na przykad restryktaza FokI rozpoznaje w cigu DNA sekwencj startow GGATG CCTAC i rozcina dwuniciowy acuch w sposb nastpujcy ...GGATGNNNNNNNNNNNNNNN... ...CCTACNNNNNNNNNNNNNNN... co zapisuje si GGATG(N)9/13, gdzie N jest dowolnym nukleotydem. Zatem cay mechanizm wykorzystywany w komputerze DNA opiera si w istocie na odpowiednim rozcinaniu acucha dwuniciowego i ponownym sklejaniu jego lepkich kocw. Automat molekularny Shapiry
Rys. 3. Przykadowy automat skoczony z dwoma stanami S0 i S1. Nieetykietowana strzaka wskazuje na stan pocztkowy S0, podwjny okrg oznacza stan kocowy S1. Etykietowane symbolami alfabetu strzaki reprezentuj moliwe przejcia automatu: S0aS0 (bdc w stanie S0, po wczytaniu litery a, mona przej do stanu S0), S0aS1 (ze stanu S0, po wczytaniu a, mona przej do S1), podobnie S1bS0, S1bS1.

W 2001 roku w prestiowym czasopimie Nature ukazaa si praca izraelskich naukowcw z Instytutu Weizmanna w Rehovot opisujca molekularny komputer DNA. Dwa lata pniej ten sam zesp pod kierunkiem prof. Ehuda Shapiry zaprezentowa ulepszon wersj molekularnej maszyny, ktra nie tylko bya w tym czasie najszybszym komputerem na wiecie, ale rwnie i najmniejszym. Co wicej, w komputer praktycznie nie potrzebuje adnej energii zewntrznej dla swego dziaania, gdy dostarczaj jej same czsteczki DNA biorce udzia w obliczeniach. Komputer prof. Shapiry jest przykadem molekularnej realizacji automatu skoczonego. Automat skoczony jest pewn podklas tzw. maszyny Turinga, ktra jest z kolei abstrakcyjnym modelem dowolnego komputera. Automat skoczony operuje na wejciowej sekwencji symboli. Automat moe znajdowa si w jednym z ustalonej liczby stanw wewntrznych (reprezentujcych pami komputera), z ktrych jedne s traktowane jako stany pocztkowe, a inne jako stany kocowe. Oprogramowanie automatu stanowi zbir regu przej, z ktrych kada okrela sposb, w jaki maj zmienia si stany automatu pod wpywem pojawiajcych si symboli wejciowych i aktualnego stanu maszyny. Automat moe nie koczy oblicze, jeeli adna z dostpnych regu nie moe by zastosowana. Obliczenia natomiast kocz si, gdy przetworzony zostanie ostatni symbol wejciowy. Automat akceptuje dane wejciowe, jeeli obliczenia zatrzymuj si w stanie kocowym automatu. Rysunek 3 przedstawia przykad automatu dwustanowego, pracujcego na dwuliterowym alfabecie {a, b}. Automat Shapiry jest wanie molekularn implementacj automatu zoonego z 2 stanw i operujcego na 2 literach. Mona by zapyta, czy tak prosty model moe mie jakie praktyczne zastosowanie? Jeeli wemiemy pod uwag fakt, e w takim automacie mona zdefiniowa 255 rnych zestaww przej, to w poczeniu z 3 rnymi konfiguracjami stanw kocowych (S0 lub S1, lub S0 i S1), daje w rezultacie moliwo implementacji 765 programw. A to ju jest niemao. W modelu Shapiry zaoono, e kady symbol wejciowy kodowany jest na 6 parach nukleotydw (szczegy na marginesie). Molekua wejciowa okrela stan pocztkowy automatu oraz sekwencj wejciow. Architektur danego automatu tworzy zestaw moleku reprezentujcych przejcia automatu, wybrany z grupy 8 moliwych przej automatu dwustanowego. Dodatkowo dostpne s dwie molekuy wyjciowe, zadaniem ktrych jest rozpoznawanie osignicia przez automat stanu kocowego. Kodowanie moleku uwzgldnia miejsce cicia restryktazy FokI. Obliczenia rozpoczynaj si w momencie zmieszania molekuy wejciowej, moleku reprezentujcych przejcia automatu oraz restryktazy FokI. Przedstawimy przykadowe dziaanie automatu z rysunku 3 akceptujcego sowo wejciowe abbab. Oto jak zakodowany zostaje stan pocztkowy i cig wejciowy:

Na przykad, przetwarzajc sowo abbab, automat mgby przechodzi kolejno przez stany S0, S1, S1, S0, S1, S1.

Kodowanie automatu z rysunku 3. W nawiasach podana jest liczba tzw. wypeniaczy (ang. spacers) nukleotydw dodawanych ze wzgldu na dugo cicia restryktazy FokI. Kodowanie symboli a CTGGCT b CGCAGC t TGTCGC

Kodowanie moleku przejcia S0aS0 GGATG(3) CCTAC(3)CCGA S1bS0 GGATG(1) CCTAC(1)GCGT S0aS1 GGATG(5) CCTAC(5)CCGA S1bS1 GGATG(3) CCTAC(3)GCGT

Kodowanie moleku detekcji wyjcia S0-D (161) (161)AGCG S1-D (251) (251)ACAG

Dane wejciowe. Kolorem zaznaczono miejsca, w ktrych zakodowane s dwie litery a ze sowa abbab.

(21)GGATG(7)CTGGCT CGCAGC CGCAGC CTGGCT CGCAGC TGTCGC (21)CCTAC(7)GACCGA GCGTCG GCGTCG GACCGA GCGTCG ACAGCG W pierwszym kroku restryktaza rozcina moleku wejciow, eksponujc 4-nukleotydowy lepki koniec kodujcy stan pocztkowy i pierwszy symbol wejciowy.

Dziaanie restryktazy FokI:

(21)GGATG(7)CT GGCT CGCAGC CGCAGC CTGGCT CGCAGC TGTCGC (21)CCTAC(7)GACCGA GCGTCG GCGTCG GACCGA GCGTCG ACAGCG W nastpnym kroku do lepkiego koca molekuy wejciowej przycza si poprzez dziaanie ligazy pasujcy (komplementarny) koniec jednej z moleku przejcia automatu.

Ligacja z udziaem reguy S0aS1:

GGATG(5)GGCT CGCAGC CGCAGC CTGGCT CGCAGC TGTCGC CCTAC(5)CCGA GCGTCG GCGTCG GACCGA GCGTCG ACAGCG Ta hybrydyzacja oznacza przejcie automatu do kolejnego stanu i wczytanie nastpnego symbolu wejciowego. W kolejnym kroku produkt hybrydyzacji jest znowu rozcinany przez FokI i tworzony jest lepki koniec reprezentujcy kolejny stan i symbol wejciowy. Cay proces przebiega w ptli do momentu poczenia lepkiego koca z moleku wyjciow, reprezentujc stan kocowy:

Dziaanie restryktazy FokI:

GGATG(5)GGCT CGCAGC CGCAGC CTGGCT CGCAGC TGTCGC CCTAC(5)CCGA GCGT CG GCGTCG GACCGA GCGTCG ACAGCG GGATG(3)CGCAGC CGCAGC CTGGCT CGCAGC TGTCGC CCTAC(3)GCGTCG GCGTCG GACCGA GCGTCG ACAGCG GGATG(3)CGCAGC CGCAGC CTGGCT CGCAGC TGTCGC CCTAC(3)GCGTCG GCGT CG GACCGA GCGTCG ACAGCG GGATG(1)CGCAGC CTGGCT CGCAGC TGTCGC CCTAC(1)GCGTCG GACCGA GCGTCG ACAGCG GGATG(1)CGCAGC CT GGCT CGCAGC TGTCGC CCTAC(1)GCGTCG GACCGA GCGTCG ACAGCG GGATG(5)GGCT CGCAGC TGTCGC CCTAC(5)CCGA GCGTCG ACAGCG GGATG(5)GGCT CGCAGC TGTCGC CCTAC(5)CCGA GCGT CG ACAGCG GGATG(3)CGCAGC TGTCGC CCTAC(3)GCGTCG ACAGCG GGATG(3)CGCAGC TGTCGC CCTAC(3)GCGTCG ACAG CG (251)TGTCGC (251)ACAGCG

Ligacja z udziaem reguy S1bS1:

Dziaanie restryktazy FokI:

Ligacja z udziaem reguy S1bS0:

Dziaanie restryktazy FokI:

Ligacja z udziaem reguy S0aS1:

Dziaanie restryktazy FokI:

Ligacja z udziaem reguy S1bS1:

Dziaanie restryktazy FokI:

Ligacja z udziaem reguy detektora S1-D:

Zamiast zakoczenia Wizja komputera pracujcego z olbrzymi prdkoci, praktycznie bez zewntrznej energii, o niewiarygodnym wrcz stopniu upakowania informacji zachca do coraz to nowych poszukiwa. W kwietniowym wydaniu Nature z 2004 r. ukaza si artyku, w ktrym prof. Ehud Shapiro opisa zastosowanie komputera DNA do analizy biologicznych informacji przechowywanych w mRNA. W warunkach laboratoryjnych biokomputer zdiagnozowa typ komrek rakowych oraz rozpocz proces zwalczania ich przez produkcj odpowiednich substancji. Rwnie w 2004 r. piszcy te sowa wraz z doktorantem Maciejem Trociem zaproponowali zastosowanie nowych enzymw restrykcyjnych w konstrukcji molekularnego automatu, a take

zamodelowali dziaanie automatu 3-stanowego, zdolnego wykonywa ju 1 835 001 programw. W innej publikacji wskazali na moliwo realizacji biologicznych funkcji logicznych oraz systemu wnioskowania, ktry moe znale zastosowanie np. w molekularnym systemie ekspertowym. W 2005 r. zesp izraelskich naukowcw opublikowa wyniki realizacji automatu 3-stanowego, nad alfabetem 3-literowym. Praca wskazywaa rwnie na teoretyczne szanse budowy komputera rozpoznajcego 39 rnych symboli wejciowych. W ubiegym roku ukazaa si praca Chiczykw, ktrzy eksperymentalnie udowodnili, e mona konstruowa komputery DNA wykorzystujce restryktazy z tzw. grupy IIS bez uycia ligazy. W sposb istotny moe to uproci przysz realizacj biokomputerw.

10

You might also like