1.02. Geny
Według tradycyjnej definicji gen to fragment nici nukleotydów, wystarczający do powstania jednego białka. Kontynuując wcześniejsze porównania, to jakby odcinek łańcucha lub paleta cegieł.
Gdy zaczynała się przygoda z genetyką nie wiedziano jeszcze o istnieniu DNA i dlatego geny wiązano jedynie z przenoszeniem podstawowych cech fizycznych, takich jak kolor czy liczba włosów oraz podatność lub odporność na choroby. Gen został uznany za podstawową jednostkę dziedziczności, gdyż reprezentacja odpowiednich genów stanowi o przynależności do tego lub innego gatunku roślin i zwierząt, a wadliwe działanie genu wpływa na zróżnicowanie fizyczne i psychiczne organizmu.
W genach ukryta jest informacja:
- o składnikach białka oraz kolejności dodawania tych składników,
- o warunkach przyrządzenia tego białka (w jakich warunkach),
- o sposobie jego przyrządzenia (z jaką intensywnością i przez jaki czas je wytwarzać),
- do jakiej części komórki wysłać zbudowane białko lub – u organizmów wielokomórkowych – w których tkankach je budować.
To bardzo odważne stwierdzenia bowiem – co wykażę niebawem – współczesna genetyka nie potrafi odpowiedzieć, w jaki sposób te zadania są realizowane (zwłaszcza punkty b oraz c). To bardziej lista przypuszczeń niż faktów.
Współcześnie już rozumiemy, że gen nie tylko buduje białka. Bowiem nić DNA nie zostaje schowana w szkatułce po zakończeniu etapu budowy nowego organizmu. W komórkach nieustannie prowadzonych jest wiele procesów metabolicznych, do realizacji których wciąż potrzebne są różne aminokwasy, węglowodany, lipidy. Bez nadzoru związków wytwarzanych przez geny nie budujące białek nie byłoby to możliwe. Różne RNA uruchamiają proces budowania potrzebnych białek, regulują intensywność ich wytwarzania. Nowe pojęcie genu określa go jako odcinek DNA kodujący białka lub cząstki kwasu RNA. Opowiem o tym szczegółowo w dalszej części pracy.
1.02.01. Aminokwasy
O tym, że białka zbudowane są z aminokwasów wiedziano od dawna, ale w jaki sposób z nici DNA jest przekazywana informacja o ich budowie – nie potrafiono odpowiedzieć. Grupowanie cegiełek zasad azotowych po trzy w celu zbudowania aminokwasu pierwszy zauważył Marshall Nirenberg. Mieszając rybosomy bakterii E.coli z aminokwasami i nićmi mRNA zawierającymi wyłącznie nukleotydy jednego rodzaju, zaobserwował, że wystarczą trzy cegiełki zasadowe do określenia jaki aminokwas ma powstać. To tryplety lub kodony, skąd wniosek, że kod genetyczny jest kodem trójkowym. Ważne jest, aby zapamiętać, że określenie kod genetyczny odnosi się do budowania aminokwasów z trójek kodonów.
1.02.01.01. Kod genetyczny
Tu napotykamy na kolejny brak konsekwencji. Możliwy układ czterech liter w sekwencjach trójelementowych kodonach daje możliwość powstanie 64 kombinacji. Powinniśmy więc odnaleźć tyle aminokwasów, a jest ich … tylko 20.
Wyjaśnieniem mniejszej liczby aminokwasów jest fakt, że do budowy niemal wszystkich aminokwasów nie wykorzystuje się trzech nukleotydów. Większość aminokwasów budowanych jest tylko z pierwszych dwóch nukleotydów, a trzeci jest zmienny (np. leucyna kodowana jest przez zestawy: CUU, CUC, CUA, CUG – stałe jest para CU, a na trzecim miejscu są podstawienie wszystkie litery). Kodony odpowiedzialne za budowę tych samych aminokwasów nazywane są synonimami, a różnice między nimi określane jest progiem tolerancji. Tłumaczone jest to tym, że możliwość kodowania powstawania najważniejszych aminokwasów przez różne kodony ogranicza możliwość mutacji. Dla mnie nie jest to wystarczający powód. Uważam, że z równym prawdopodobieństwem zamianie może ulec również pierwszy lub drugi nukleotyd, a wtedy powstanie całkiem inny aminokwas – i w konsekwencji białko o odmiennych właściwościach.
W artykule Ewolucja języka genów Stephena J. Freelanda i Laurence’a D. Hursta znalazłem inną hipotezę. Najczęstsze błędy w trzeciej literze kodonu jest spowodowane słabszym oddziaływaniem w procesie transkrypcji pomiędzy transportowym RNA (tRNA) a informacyjnym RNA (mRNA). Ponadto, Carl R. Woese zaobserwował, że podobne do siebie kodony budują aminokwasy o podobnych skłonnościach do przyciągania lub odpychania cząsteczek wody. To częściowe rozwiązanie problemu. Tylko że nie wiemy jeszcze wszystkiego o związkach chemicznych budujących nasze organizmy. Na obecnym etapie rozwoju nauki często wydają się nam identyczne, ale to nie znaczy, że tak jest. I kiedyś nie odkryjemy drobnych, acz istotnych, różnic.
Wyjaśnienie autorów może dotyczyć glicyny, która jest kodowana na cztery różne sposoby (GGG oraz GGA, GGC i GGU). Glicyna nie jest optycznie czynna, zalicza się do grupy aminokwasów niepolarnych alifatycznych. Zbudowana jest jedynie z atomów węgla i wodoru, połączonych pojedynczym wiązaniem. Ładunki elektryczne tej cząsteczki są rozłożone równomiernie, nie może więc mieć lustrzanego odbicia. Lecz to wyjątek wśród aminokwasów. Inaczej jest już choćby w przypadku aminokwasu fenyloalaniny, który budowany jest w dwóch lustrzanych wariantach. Ten sam wzór chemiczny, te same atomy – lecz różne działanie. Jedna forma występuje w naturze i jest przyswajalna przez organizmy żywe (L-Fenyloalanina). Druga – lustrzana (D-Fenyloalaninę) wytwarzana jest przez bakterie. Lustrzane odbicie posiadają również pozostałe aminokwasy.
Tak więc – wobec obecnego stanu wiedzy – to głównie z tych powodów zamiast 64 możliwych do powstania aminokwasów, mamy do dyspozycji jedynie 20. Głównie, gdyż trzy kodony nie budują żadnego aminokwasu, a są sygnałem do zakończenia procesu translacji. To kodony terminacyjne. Inny kodon, nazywany kodonem inicjującym lub kodonem start, dodatkowo wytwarza białko metioninę.
21 aminokwas
Dwóch genetyków z Medical Research Council Laboratory of Molecular Biology – Sebastian Greiss oraz Jason Chin – w sierpniu 2011 roku do genomu nicienia Caenorhabditis elegans dodali …21 aminokwas, pozwalający na stworzenie nowego białka. Nie muszę wspominać, że podobny aminokwas nie występuje w przyrodzie. To nowe białko pod wpływem promieniowania UV świeci się kolorem czerwonym, tworząc z milimetrowego robaka sznur lampek choinkowych. Celem badaczy jest jednak dodanie podobnego białka do komórek nerwowych mózgu nicienia – i sterowanie jego zachowaniem przy pomocy błysków lasera (http://www.bbc.co.uk/news/science-environment-14492948).
Start
Rozkaz START ukryty jest w cegiełkach AUG nici mRNA. Ten tryplet buduje również aminokwas metioniny. Co ciekawe tylko metonina oraz tryptofan jest kodowana zawsze tym samym kodonem. Z tym że tryptofan – UGG nie ma przypisanego rozkazu. Na razie… U niektórych mikroorganizmów istnieje alternatywny kodon startowy. To GUG – walina lub UUG – leucyna.
U organizmów prokariotów przed kodonem START znajduje się sekwencja Shine-Dalgarno: AGGAGGGU. Gdy jednostka rybosomowa napotka na nici mRNA sekwencję Shine-Dalgarno przygotowuje się do odczytania informacji o budowie aminokwasów. Dopiero po tej sekwencji nukleotydów, znajduje się bezpośredni rozkaz pobierania informacji o składnikach aminokwasowych. Szerzej na ten temat można przeczytać w rozdziale Procesy technologiczne w fabryce białek.
Stop
Rozkazy, a nie rozkaz STOP, są zakodowane w trzech trójkach: UAA – ochre, UGA – opal, UAG – amber. Co ciekawe kodony STOP nie budują żadnego aminokwasu.
1.02.01.02. Jak budowane są białka
Po utworzeniu nici mRNA i przetransportowaniu jej do rybosomów, dochodzi do odczytania zakodowanej w kodonach informacji. Wyjaśnienie procesu składania łańcucha polipeptydowego – czyli montażu białka – na poziomie ideowym jest bardzo proste. Polega na dokładaniu kolejnych aminokwasów, aż do momentu natrafienia na kodon STOP. W szczegółach jest to bardziej skomplikowany proces – wrócimy do niego w dalszej części pracy.
Przyjrzyjmy się w jaki sposób znane nam cegiełki budują białka.

Rys. 6. Odcinek genu zaznaczonymi trójkami nukleotydów nazywanych kodonami (mRNA)
Przetłumaczenie tej informacji można zapisać w ten sposób podany w tabeli poniżej:
Tab. 3. Odczytanie informacji z kodonów (mRNA)
kod | instrukcja odczytywana z kodonu |
---|---|
AUG | start odczytywania informacji o budowie białka oraz dodanie aminokwasu metioniny |
CAG | dodanie aminokwasu glutaminy |
GGU | dodanie aminokwasu glicyny |
GUU | dodanie aminokwasu waliny |
CUA | dodanie aminokwasu leucyny |
AGC | dodanie aminokwasu seryny |
CGU | dodanie aminokwasu argininy |
… | dodanie dalszych aminokwasów |
UGA | ta (lub inna trójka) jest sygnałem, że wszystkie aminokwasy potrzebne do zbudowania białka zostały już dodane. |
Mimo tego, że instrukcja kodu budowy białek składa się czasem z kilkudziesięciu tysięcy aminokwasów – jak np. u człowieka białko tytina jest zbudowane z 38.138 aminokwasów – jest to najprostszy etap odczytywania informacji genetycznej.
1.02.01.03. Ile potrzeba białek
W genomie człowieka znajduje się 26.945 genów. Ich średnia długość to 27.000 cegiełek życia, chociaż gen dystrofiny – budujący białko strukturalne komórki mięśniowej – budowany jest aż z 2 milionów 400 tysięcy cegiełek.
Ale i tu trafiamy na zagadkę. Już wiemy, że większa liczba nukleotydów nie jest związana z ogólnie rozumianym rozwojem ewolucyjnym organizmu. Podobnie jest w przypadku liczby genów. Nie tylko zwykła mysz ma ich więcej niż człowiek, to również często spożywane przez nas rośliny… Na podstawie liczby genów trzeba stwierdzić, że jesteśmy zaledwie dwa razy bardziej skomplikowani niż niepasożytniczy nicień Caenorhabditis elegans, i jedynie trzykrotnie od muszki owocowej Drosophila melanogaster.
Częściowym wyjaśnieniem większej ilości genów u roślin czy zwierząt stałocieplnych jest konieczność budowania różnych wariantów katalizatorów przyśpieszających różne reakcje chemiczne w organizmie – enzymów, które w większości są białkowe. Stałocieplność ssaków i płazów pozwoliła zmniejszyć liczbę genów.
Lecz to jedynie pobieżne wyjaśnienie podobnych niekonsekwencji. Aby poznać bliższe prawdzie, musimy przyjrzeć się bliżej budowie genu.
1.02.02. Eksony i introny
Do tej pory gen widziano jak ciąg trypletów kodujących białko – eksonów – oraz sekwencji regulujących ekspresję genu na jego początku i końcu. To przekonanie pochodziło ze stwierdzenia francuskiego biochemika, laureata Nagrody Nobla Jacquesa Monoda, że „co jest prawdziwe dla bakterii, jest prawdziwe i dla słonia”. Tylko że w 1977 roku zespoły Phillipa A Sharpa z Massechusetts Institute of Technology oraz Richarda J. Robertsa z New England Biolabs Inc. rozbiły tą jedność genową. Z tak prostą metodą budowy białek spotkamy się bowiem …jedynie u bakterii. Prokarioty to organizmy z większości jednokomórkowe, nie zawierające jądra komórkowego i w genach bakterii rzeczywiście nie występują sekwencje intronów – po sekwencji promotorowej występuję jedynie odcinki eksonów. Badania wymienionych zespołów wykazały, że odcinki intronów pojawiają się dopiero w genach organizmów eukariotów, posiadających jądro komórkowe z chromosomami). Wtedy, po sekwencji promotorowej, rejony kodujące są przedzielone odcinkami niekodującymi.
Liczba odcinków intronów w genach jest różna i rośnie wraz ze stopniem złożoności organizmu. To chyba jedyna, tak konsekwentna, zależność. W genomie drożdży odnaleziono jedynie 239 intronów, podczas gdy u człowieka doliczono się ich ponad 300 tysięcy. Wspomniane już białko tytina to 383 sekwencje eksonów rozdzielonych sekwencjami intronów. Ponadto, w większości przypadków, odcinki intronów są dłuższe od odcinków eksonów.

7. Porównanie odcinków genu u prokariotów i eukariotów. W obu przepadkach odnajdziemy sekwencję promotorową. Z tym, że u prokariotów DNA znajdują się jedynie odcinki eksonów, które od razu kodowane na białko, natomiast u Eukariota oprócz odcinków eksonów znajdziemy odcinki intronów, przetwarzanych m.in. na informacyjne RNA (mRNA)
1.02.02.01. Schemat odczytywanie informacji
W artykule Ukryty program genetyczny John S. Mattick zadaje ważne pytanie: „jeśli introny nie kodują białek, to czemu są tak powszechne u organizmów eukariotycznych, a brak ich u prokariota?” Aby odpowiedzieć na to pytanie, najpierw przyjrzyjmy się różnicom w genach tych organizmów.
Geny prokariotów
U prokariotów, prostych organizmów nie ma potrzeby ani czasu, na wycinanie odcinków mRNA z intronów. Informacja o dołożeniu kolejnych aminokwasów pobierana jest z eksonów i od razu układana w rosnącej nici łańcucha polipeptydowego. To proces bardzo prostej budowy – muru lub litej ściany z cegieł, bez otworów drzwiowych lub okiennych. Można go wykonać bez konieczności posiadania projektu.

8. Gen prokariotów. W procesie transkrypcji informacja z podwójnej nici DNA zostaje przepisana na pojedynczą nić RNA, odczytywaną w procesie translacji w czasie montażu białka
DNA bakterii i innych prostych organizmów to niemal wyłącznie geny kodujące białka. U tych organizmów to białka nadzorują pracę nad wszystkimi funkcjami organizmu. Aby w pełni wypełnić zadania – w różnych, zmiennych warunkach środowiskowych – białek musi być bardzo dużo. Inne białka przejmują funkcje związane z metabolizmem w różnych temperaturach, nadmiarze lub braku określonych związków chemicznych, obronie przed atakami intruzów. A także na różnych etapach rozwoju organizmu – osiągania dojrzałości, przygotowaniu do rozmnażania i samego procesu powielenia.
Geny eukariotów
Natomiast gen Eukariotów zawiera już odcinki intronów. Przed zbudowaniem białka odcinki intronów są wycinane i ulegają degradacji, a odcinki eksonów w procesie składania są łączone w ciągłą sekwencję, możliwą do odczytania w rybosomach.
Budowa bardziej skomplikowanych konstrukcji, już całych domów – ze ścianami z drzwiami i oknami, dachem z kominem i rynnami odprowadzającymi opady atmosferyczne, stała się możliwa dopiero po uzupełnieniu o projekt budowy. To w intronach ukryta jest informacja o harmonogramie prac, modyfikacjach przygotowywanych materiałów. U eukariotów stało się to możliwe dzięki rozdzieleniu procesu przepisania informacji DNA na dwa etapy, przebiegających w różnych częściach komórki. Transkrypcja odbywa się w jądrze komórkowym, a translacja w rybosomach znajdujących się w cytoplazmie (rys. 9).

9. Gen eukariotów. Pomiędzy proces transkrypcji a translacji dochodzi do składania mRNA, polegającego na pozbyciu się odcinków intronów
Podsumowanie
Do dzisiaj podręczniki genetyki mówią, że skoro intronowe DNA jest usuwane po transkrypcji, to znaczy, że nie pełni żadnej roli.
Podobna interpretacja roli odcinków intronów to największy błąd genetyki. Rzeczywiście, w montażu białek biorą udział jedynie odcinki eksonów. Ale już obserwacja, że eksony mogą być łączone w różny sposób, powinna zwrócić uwagę genetyków na introny. Alternatywne składanie eksonów w genie zostało zanotowane, wiedziano, że eksony mogą być montowane w różnych porządkach – i odrzucono introny jako zbędne. To nieporozumienie. Z rosołu wybrano mięso i warzywa, a wywar wylano.
Jaka jest więc prawda? Już pierwszy rzut oka na tabelę wskazuje, że im organizm znajduje się na wyższej gałęzi ewolucji, tym większą rolę odgrywają odcinki o nieznanych funkcjach, z których część jest pomijana w analizie złożoności organizmu człowieka (introny, sekwencje rozproszone, mikrosatelity i inne – nazywane śmieciowym DNA). Wrócimy jeszcze do tego problemu w rozdziale Eksony i introny – powrót.
Jakby tego było mało, wymieszanie genów następuje jeszcze w chromosomach podobnych organizmów. Zaraz do tego przejdziemy.