Krótkie wykłady. Genetyka - ebook
Krótkie wykłady. Genetyka - ebook
Krótkie wykłady Genetyka, wydanie czwarte, to publikacja dla studentów poszukujących zwięzłego wprowadzenia do tematu lub podręcznika do nauki do wykorzystania przed egzaminami. Każdy temat zaczyna się od podsumowania podstawowych faktów - listy kontrolnej powtórki – po którym następuje opis tematu, który koncentruje się na podstawowych informacjach, z jasnymi, prostymi diagramami, które są łatwe do zrozumienia i przypomnienia.
Krótkie wykłady Genetyka obejmuje tematy takie jak:
• Genetyka molekularna
• Organizacja genomu
• Mechanizmy dziedziczenia
• Genetyka populacyjna i ewolucja
• Technologia DNA
• Genetyka człowieka
• Zastosowania genetyki
Kategoria: | Biologia |
Zabezpieczenie: |
Watermark
|
ISBN: | 978-83-01-21907-9 |
Rozmiar pliku: | 8,5 MB |
FRAGMENT KSIĄŻKI
Obecne wydanie Krótkich wykładów z genetyki zostało znacznie zmienione i rozszerzone. W sekcji poświęconej genetykce molekularnej dokonaliśmy gruntownej rewizji treści, ograniczając ilość informacji szczegółowych. Opisom procesów transkrypcji i translacji nadaliśmy bardziej zwięzłą i zwartą formę, wprowadzając jednocześnie w tej Sekcji materiał dotyczący mutacji DNA i ich naprawy. Zmodyfikowaliśmy także Sekcję E poświęconą technologii DNA, poszerzając problematykę wykorzystania w badaniach tego związku zdolności nici DNA do znajdowania nici komplementarnych i parowania. Skoncentrowaliśmy się na opisie koncepcji i zasad, pozostawiając zawiłości podręcznikowi Krótkich wykładów biologii molekularnej. Wprowadziliśmy nową jednostkę wykładu poświęconą sekwencjonowaniu DNA z intencją przedstawienia rozwoju tej technologii w minionym czterdziestoleciu. Początkowo znalezienie pojedynczego genu i poznanie jego sekwencji wymagało lat pracy. Obecnie sekwencjonowanie całego genomu człowieka trwa kilka dni. Ilości danych uzyskiwanych w procesach sekwencjonowania są dziś tak gigantyczne, że ich przechowywanie i analiza stały się problemem trudniejszym od samego sekwencjonowania. Pojawiło się także ryzyko produkcji danych dla samej produkcji oraz problemy związane z ich jakością, towarzyszące wszelkiej produkcji masowej. Jest oczywiste, że nie istnieje ‘wzorcowa sekwencja genomu ludzkiego’. Każdy indywidualny genom haploidalny zawiera wiele mutacji recesywnych, ale prace w ramach programu „1000 Genomes Project” pozwoliły na pozyskanie danych genomowych od 1000 osób z różnych części świata w celu możliwości prowadzenia istotnych badań porównawczych. Obecnie poszukiwanie związków między sekwencjami wariantowymi, czyli mutacjami, z konkretnymi wieloczynnikowymi chorobami, takimi jak choroba wieńcowa, wymaga sekwencjonowania rozległych obszarów genomu w celu identyfikacji wariantów. W programie „1000 Genomes Project” udokumentowano już 95% wariantów najbardziej interesujących części ludzkiego genomu, w związku z czym każdy badacz rozpoczynający nowe studium może wybrać odpowiedni wariant, wiedząc czego szukać od samego początku. Istnieje uzasadnione przypuszczenie, że niektóre geny zostaną w przyszłości uznane za niefunkcjonalne u znacznej większości ludzi.
Sekcje dotyczące biotechnologii i organizmów transgenicznych zostały zaktualizowane; dodaliśmy również materiał poświęcony klonowaniu zwierząt i komórkom macierzystym. Zagadnienia te należą do najwyżej zaawansowanej genetyki stosowanej. Genetycznie projektowane ziemniaki są obecnie uprawiane w Europie, między innymi w celu produkcji biodegradowalnych tworzyw sztucznych, ale obawa przed protestami wciąż ogranicza produkcję do celów spożywczych. Innym nowym tematem są ‘Geny w rozwoju’; materiał ten opisuje ogólnie rolę regulacji genów w procesie powstawania ciał o określonych kształtach i cechach. Rzuca on również światło na pochodzenie wszystkich zwierząt od wspólnych przodków, okazuje się bowiem, że te same geny kształtują analogiczne części ciał much, ssaków i ryb. Genetyka mendlowska nie zmieniła się od czasów Mendla, tak jak prawa grawitacji od czasów Newtona, wciąż jednak odkrywamy nowe mechanizmy genetyczne. Genetyka jest nadal nauką szybko rozwijającą się, której przedstawicielom przyznano ostatnio szereg Nagród Nobla, czujemy się więc uprzywilejowani mogąc przekazywać część tej wiedzy następnemu pokoleniu genetyków.WYKAZ SKRÓTÓW
+--------------------------------------+--------------------------------------+
| 3D | trójwymiarowy |
+--------------------------------------+--------------------------------------+
| 5BU | 5-bromouracyl |
+--------------------------------------+--------------------------------------+
| AAV | (z ang. Adeno-Associated Virus) |
| | wirus stowarzyszony z adenowirusem |
+--------------------------------------+--------------------------------------+
| ADA | (z ang. adenine deaminase) deaminaza |
| | adeninowa |
+--------------------------------------+--------------------------------------+
| ADP | difosforan adenozyny |
+--------------------------------------+--------------------------------------+
| AIDS | (z ang. Aquired Immune Deficiency |
| | Syndrome) zespół nabytego niedoboru |
| | odpornościowego |
+--------------------------------------+--------------------------------------+
| ATP | trifosforan adenozyny |
+--------------------------------------+--------------------------------------+
| BAC | (z ang. Bacterial Artificial |
| | Chromosome) sztuczny chromosom |
| | bakteryjny |
+--------------------------------------+--------------------------------------+
| BLAST | Basic Local Alignment Search Tool |
+--------------------------------------+--------------------------------------+
| bp | (z ang. base pair) para zasad |
+--------------------------------------+--------------------------------------+
| BMD | (z ang. Becker muscular dystrophy) |
| | dystrofia mięśniowa Beckera |
+--------------------------------------+--------------------------------------+
| BrdU | bromodeoksyurydyna |
+--------------------------------------+--------------------------------------+
| cAMP | cykliczny adenozynomonofosforan |
+--------------------------------------+--------------------------------------+
| CAP | białko aktywujące katabolizm |
+--------------------------------------+--------------------------------------+
| cdk | kinaza cyklinozależna |
+--------------------------------------+--------------------------------------+
| cDNA | komplementarny DNA |
+--------------------------------------+--------------------------------------+
| CFTR | błonowy regulator przewodnictwa |
+--------------------------------------+--------------------------------------+
| cM | centymorgan |
+--------------------------------------+--------------------------------------+
| OUN | ośrodkowy układ nerwowy |
+--------------------------------------+--------------------------------------+
| CODIS | Combined DNA Index System |
+--------------------------------------+--------------------------------------+
| Col | plazmid kolicynowy |
+--------------------------------------+--------------------------------------+
| CYP | cytochrom P450 |
+--------------------------------------+--------------------------------------+
| DALI | Distance Matrix ALIgnment |
+--------------------------------------+--------------------------------------+
| dATP | 5’-trifosforan 2’-deoksyadenozyny |
+--------------------------------------+--------------------------------------+
| dCTP | 5’-trifosforan 2’-deoksycytozyny |
+--------------------------------------+--------------------------------------+
| dd | dideoksy (nukleotyd) |
+--------------------------------------+--------------------------------------+
| ddNTP | trifosforan dideoksynukleotydu |
+--------------------------------------+--------------------------------------+
| dGTP | 5’-trifosforan 2’-deoksyguanozyny |
+--------------------------------------+--------------------------------------+
| DIG | (z ang. DIGoksygenin) digoksygenina |
+--------------------------------------+--------------------------------------+
| DMD | (z ang. Duchenne Muscular Dystrophy) |
| | dystrofia mięśniowa Duchenne’a |
+--------------------------------------+--------------------------------------+
| DNA | kwas deoksyrybonukleinowy |
+--------------------------------------+--------------------------------------+
| DNMT | (1,2,3) metylotransferaza DNA (z |
| | różnymi liczbami) |
+--------------------------------------+--------------------------------------+
| dNTP | trifosforan deoksynukleotydu |
+--------------------------------------+--------------------------------------+
| ds | (z ang. Double Stranded) dwuniciowy |
+--------------------------------------+--------------------------------------+
| dTTP | 5’-trifosforan 2’-deoksytymidyny |
+--------------------------------------+--------------------------------------+
| ESC | (z ang. Embryonic Stem Cell) |
| | zarodkowa komórka macierzysta |
+--------------------------------------+--------------------------------------+
| EST | (z ang. Expressed Sequence Tags) |
| | sekwencyjne znaczniki ekspresji |
+--------------------------------------+--------------------------------------+
| F | plazmid niosący czynnik płci |
+--------------------------------------+--------------------------------------+
| F’ | plazmid niosący czynnik płci |
| | zawierający DNA gospodarza |
+--------------------------------------+--------------------------------------+
| FISH | (z ang. Fluorescent In Situ |
| | Hybridisation) hybrydyzacja |
| | fluorescencyjna in situ |
+--------------------------------------+--------------------------------------+
| FMR | gen związany z zespołem łamliwego |
| | chromosomu X |
+--------------------------------------+--------------------------------------+
| FSHD | (z ang. FacioScapuloHumeral |
| | Dystrophy) dystrofia mięśniowa |
| | twarzowo-łopatkowo-ramieniowa |
+--------------------------------------+--------------------------------------+
| GDP | difosforan guanozyny |
+--------------------------------------+--------------------------------------+
| GMO | (z ang. Genetically Modified |
| | Organism) organizm modyfikowany |
| | genetycznie |
+--------------------------------------+--------------------------------------+
| GTP | trifosforan guanozyny |
+--------------------------------------+--------------------------------------+
| GWAS | (z ang. Genome Wide Association |
| | Studies) całogenomowe badanie |
| | asocjacyjne |
+--------------------------------------+--------------------------------------+
| HD | (z ang. Huntington Disease) choroba |
| | Huntingtona |
+--------------------------------------+--------------------------------------+
| HFr | szczep wykazujący wysoką częstość |
| | rekombinacji |
+--------------------------------------+--------------------------------------+
| HIV | (z ang. Human Immunodeficiency |
| | Virus) ludzki wirus niedoboru |
| | odporności |
+--------------------------------------+--------------------------------------+
| HLH | (z ang. Helix-Loop-Helix) |
| | helisa-pętla-helisa |
+--------------------------------------+--------------------------------------+
| hnRNA | heterogenny jądrowy RNA |
+--------------------------------------+--------------------------------------+
| Hox | (z ang. HOmeoboX) gen homeotyczny |
+--------------------------------------+--------------------------------------+
| HSA | (z ang. Human Serum Albumin) ludzkie |
| | białko surowicze |
+--------------------------------------+--------------------------------------+
| HUGO | Human Genome Organization |
+--------------------------------------+--------------------------------------+
| ICM | (z ang. Inner Cell Mass) wewnętrzna |
| | masa komórkowa |
+--------------------------------------+--------------------------------------+
| IGF2 | insulinopodobny czynnik wzrostu typu |
| | 2 |
+--------------------------------------+--------------------------------------+
| IGFR | receptor insulinopodobnego czynnika |
| | wzrostu |
+--------------------------------------+--------------------------------------+
| IL2RG | receptor gamma interleukiny 2 |
+--------------------------------------+--------------------------------------+
| iPS | (z ang. induced Pluripotent Stem |
| | cells) indukowane komórki |
| | pluripotentne |
+--------------------------------------+--------------------------------------+
| kb | tysiąc zasad (tysiąc par zasad) |
+--------------------------------------+--------------------------------------+
| kDa | kilodalton |
+--------------------------------------+--------------------------------------+
| LCR | (z ang. Locus Control Region) obszar |
| | kontrolny locus genomowego |
+--------------------------------------+--------------------------------------+
| LINE | (z ang. Long Interspersed Nuclear |
| | Elements) długie rozproszone |
| | elementy jądrowe |
+--------------------------------------+--------------------------------------+
| LTR | (z ang. Long Terminal Repeat) długie |
| | powtórzenia końcowe |
+--------------------------------------+--------------------------------------+
| MCS | (z ang. Multiple Cloning Site) |
| | miejsce wielokrotnego klonowania |
| | (polilinker) |
+--------------------------------------+--------------------------------------+
| mtDNA | DNA mitochondrialny |
+--------------------------------------+--------------------------------------+
| MECP | białko wiążące metylowane CpG |
+--------------------------------------+--------------------------------------+
| miRNA | mikro RNA |
+--------------------------------------+--------------------------------------+
| mRNA | RNA matrycowy (z ang. messenger RNA) |
+--------------------------------------+--------------------------------------+
| MSL | białka letalne specyficznie dla |
| | mężczyzn (z ang. Male-Specific |
| | Lethal) |
+--------------------------------------+--------------------------------------+
| NOR | (z ang. Nucleolus Organizer) |
| | organizator jąderka |
+--------------------------------------+--------------------------------------+
| OMIM | Online Mendelian Inheritance in Man |
+--------------------------------------+--------------------------------------+
| ORF | (z ang. Open Reading Frame) otwarta |
| | ramka odczytu |
+--------------------------------------+--------------------------------------+
| PAC | (z ang. P1 Artficial Chromosome) |
| | sztuczny chromosome P1 |
+--------------------------------------+--------------------------------------+
| PCR | (z ang. Polymerase Chain Reaction) |
| | reakcja łańcuchowa polimerazy |
+--------------------------------------+--------------------------------------+
| PKU | (z ang. Phenylketonuria) |
| | fenyloketonuria |
+--------------------------------------+--------------------------------------+
| pms | (z ang. postmeiotic segregation) |
| | segregacja postmejotyczna |
+--------------------------------------+--------------------------------------+
| pp | pirofosforan |
+--------------------------------------+--------------------------------------+
| PSI-BLAST | Position Sensitive Iterated BLAST |
+--------------------------------------+--------------------------------------+
| QTL | (z ang. Quantitative Trait Locus) |
| | locus cechy ilościowej |
+--------------------------------------+--------------------------------------+
| R | (z ang. Resistance) oporność |
+--------------------------------------+--------------------------------------+
| RF | (z ang. Replicative Form) forma |
| | replikacyjna |
+--------------------------------------+--------------------------------------+
| RFLP | (z ang. Restriction Fragment Length |
| | Polymorphism) polimorfizm długości |
| | fragmentów restrykcyjnych |
+--------------------------------------+--------------------------------------+
| RISC | (z ang. RNA-Induced Silencing |
| | Complex) kompleks wyciszający |
| | indukowany przez RNA |
+--------------------------------------+--------------------------------------+
| RNA | kwas rybonukleinowy |
+--------------------------------------+--------------------------------------+
| RNAi | interferencja RNA |
+--------------------------------------+--------------------------------------+
| ROS | (z ang. Reactive Oxygen Species) |
| | reaktywne formy tlenu |
+--------------------------------------+--------------------------------------+
| RPE65 | białko nabłonka barwnikowego |
| | siatkówki, 65 kilodaltonów |
+--------------------------------------+--------------------------------------+
| rRNA | RNA rybosomalny |
+--------------------------------------+--------------------------------------+
| RT-PCR | (z ang. Reverse Transcription PCR) |
| | reakcja łańcuchowa polimerazy |
| | z odwrotną transkrypcją |
+--------------------------------------+--------------------------------------+
| SAR | (z ang. Scaffold Attachment Regions) |
| | rejony łącznikowe z rusztowaniem |
+--------------------------------------+--------------------------------------+
| SCE | (z ang. Sister Chromatid Exchange) |
| | wymiana chromatyd siostrzanych |
+--------------------------------------+--------------------------------------+
| SCID | (z ang. Severe Combined |
| | ImmunoDeficiency) ciężki złożony |
| | niedobór odporności |
+--------------------------------------+--------------------------------------+
| SINE | krótkie rozproszone elementy jądrowe |
+--------------------------------------+--------------------------------------+
| siRNA | krótki interferujący RNA |
+--------------------------------------+--------------------------------------+
| SNP | (z ang. Single Nucleotide |
| | Polymorphism) polimorfizm |
| | pojedynczego nukleotydu |
+--------------------------------------+--------------------------------------+
| SnRNP | małe jądrowe nukleoproteiny |
+--------------------------------------+--------------------------------------+
| ss | (z ang. single stranded) |
| | jednoniciowy |
+--------------------------------------+--------------------------------------+
| SSR | (z ang. Simple Sequence Repeat) |
| | proste powtórzenie sekwencji |
+--------------------------------------+--------------------------------------+
| STR | (z ang. Short Tandem Repeats) |
| | mikrosatelita |
+--------------------------------------+--------------------------------------+
| STS | miejsca znakowane sekwencją |
+--------------------------------------+--------------------------------------+
| TF | (z ang. Transcription Factor) |
| | czynnik transkrypcyjny |
+--------------------------------------+--------------------------------------+
| TIC | (z ang. Transcription Iniciation |
| | Complex) transkrypcyjny kompleks |
| | inicjacyjny |
+--------------------------------------+--------------------------------------+
| Tm | temperatura topnienia (DNA itp.) |
+--------------------------------------+--------------------------------------+
| TPMT | S-metylotransferaza tiopuryny |
+--------------------------------------+--------------------------------------+
| tRNA | RNA transportujący |
+--------------------------------------+--------------------------------------+
| URL | (z ang. Uniform Resource Location) |
| | ujednolicony format adresowania |
| | zasobów internetowych |
+--------------------------------------+--------------------------------------+
| UV | promieniowanie ultrafioletowe |
+--------------------------------------+--------------------------------------+
| VNTR | (z ang. Variable Number of Tandem |
| | Repeats) minisatelita |
+--------------------------------------+--------------------------------------+
| X-gal | 5-bromo-4-chloro-3-indolylo-β-D-gala |
| | ktopiranozyd |
+--------------------------------------+--------------------------------------+
| YAC | (z ang. Yeast Artificial Chromosome) |
| | sztuczny chromosom drożdżowy |
+--------------------------------------+--------------------------------------+A1 Struktura DNA
Zagadnienia kluczowe
Nukleotydy
DNA jest polimerem zbudowanym z łańcuchów monomerów nukleotydowych. Każdy nukleotyd zawiera cukier, zasadę i grupę fosforanową. Cukrem jest 2’-deoksyryboza zawierająca pięć atomów węgla oznaczanych 1’ (jeden-prim), 2’ itd. Istnieją cztery typy zasad: adenina i guanina mają po dwa pierścienie węglowo-azotowe i są purynami; tymina i cytozyna mają pierścienie i są pirymidynami. Zasady są powiązane z węglem 1’ deoksyrybozy. Cukier plus zasada tworzą nukleozyd. Nukleotyd ma jedną, dwie lub trzy grupy fosforanowe powiązane z węglem 5’ cukru. Nukleotydy występują jako indywidualne cząsteczki lub w formie spolimeryzowanej w strukturach DNA i RNA.
Polinukleotydy DNA
Połączone nukleotydy trifosforanowe z czterema zasadami tworzą łańcuchy polinukleotydowe DNA. Podczas polimeryzacji dwie grupy fosforanowe odpadają i nukleotydy wiążą się za pomocą pozostałych takich grup. Wiązanie fosfodiestrowe powstaje między grupą fosforanową 5’ jednego nukleotydu i grupą hydroksylową 3’ nukleotydu następnego. Polinukleotyd ma wolną grupę fosforanową 5’ na jednym końcu (zwanym końcem 5’) oraz wolną grupę OH na drugim (zwanym końcem 3’). Kolejność (sekwencja) zasad koduje informację genetyczną odczytywaną w kierunku: 5’ → 3’. Polinukleotydy są bardzo długie. Mogą mieć 4n sekwencji.
Podwójna helisa
Cząsteczki DNA składają się z dwóch nici polinukleotydowych splecionych ze sobą w formie podwójnej helisy (in. spirali). Trzon cząsteczki tworzą połączenia cukru z grupami fosforanowymi. Zasady zwrócone są do wewnątrz i ułożone w stos jedna nad drugą. Łańcuchy (nici) polinukleotydowe mają przeciwne zwroty (są przeciwbieżne). Podwójna helisa jest prawoskrętna z pełnym skrętem o 360° co 10 zasad. W helisie znajduje się bruzda większa wchodząca w interakcje z białkami oraz bruzda mniejsza. Zidentyfikowano też warianty struktur DNA zawierających Z DNA z helisą lewoskrętną.
Komplementarne parowanie zasad
Podwójną helisę stabilizują wiązania wodorowe między zasadami dwóch nici. Dostępna przestrzeń między niciami ogranicza interakcje zasad w taki sposób, że puryny zawsze tworzą pary z pirymidynami. Zatem: A wchodzi w interakcje tylko z T, a G tylko z C. Nazywa się to komplementarnym parowaniem zasad. Ograniczenie parowania zasad oznacza, że sekwencje zasad należących do dwóch nici są wzajemnie uzależnione oraz że sekwencja jednej determinuje i przewiduje sekwencję drugiej. Umożliwia to zachowanie informacji genetycznej podczas replikacji DNA i ekspresji genów. Naruszenie wiązań wodorowych między zasadami przez wysoką temperaturę, czynniki chemiczne lub działanie enzymów powoduje rozdzielenie nici podwójnej helisy.
Struktura RNA
W RNA tyminę zastępuje uracyl, a 2-deoksyrybozę ryboza. Normalną formą RNA jest pojedyncza nić polinukleotydowa; jednakże, krótkie odcinki sparowanych zasad mogą występować między sekwencjami komplementarnymi.
Replikacja DNA
W tym procesie komórka kopiuje swój DNA przed podziałem. DNA jest kopiowany w kierunku 5’ → 3’ przez polimerazy DNA używające pojedynczych łańcuchów DNA jako wzorców. Replikacja jest półzachowawcza (semikonserwatywna). Helikaza rozdziela nici podwójnej helisy. DNA jest syntetyzowany w sposób ciągły na nici wiodącej oraz w sposób nieciągły w segmentach (fragmenty Ozakiego) na nici opóźnionej. Syntezę DNA przez polimerazę DNA inicjuje krótka wstępna synteza RNA z udziałem polimerazy RNA, zwanej prymazą. Sekwencja inicjująca zastępowana jest później przez DNA. Ligaza DNA łączy fragmenty Okazakiego wiązaniem fosfodiestrowym.
Tematy powiązane
(A5) Mutacje DNA
(A4) Od DNA do białek
Nukleotydy
Zdolność DNA do przechowywania informacji genetycznej, warunkująca reprodukowalność komórek, wiąże się ze strukturą cząsteczek DNA. DNA jest polimerem, którego cząsteczki mają formę długich łańcuchów monomerów, zwanych nukleotydami. Dlatego cząsteczki DNA nazywane są polinukleotydami. Każdy nukleotyd składa się z trzech części: cukru, pierścieniowej struktury zawierającej azot, zwanej zasadą, oraz grupy fosforanowej. Cukier zawarty w DNA jest pięciowęglową pentozą zwaną 2’-deoksyrybozą, w której grupę –OH przy węglu 2’ rybozy zastępuje atom wodoru (Rys. 1). Atomy węgla w cukrze są ponumerowane od 1’ do 5’. Przy liczbach tych stawia się apostrofy (’) odczytywane jako prim dla odróżnienia od liczb odnoszących się do atomów zasad. Numeracja ta jest ważna, wskazuje bowiem miejsca, w których inne komponenty nukleotydu powiązane są z cukrem.
Każdy nukleotyd zawiera jedną z czterech zasad: adeninę, guaninę, tyminę lub cytozynę (Rys. 2). Są to złożone cząsteczki zawierające pierścieniowe struktury z węglem i azotem. W adeninie i guaninie znajdują się dwa pierścienie węglowo–azotowe; zasady te nazywamy purynami. Cytozyna i tymina mają pierścienie pojedyncze i nazywane są pirymidynami. Zasady połączone są z cukrem wiązaniem między węglem 1’ cukru i atomem azotu w pozycji 9 w purynach lub w pozycji 1 w pirymidynach. Połączenie cukru z zasadą nazywane jest nukleozydem (Rys. 3a).
Rysunek 1. Struktura 2’-deoksyrybozy
Rysunek 2. Zasady w DNA
Rysunek 3. Struktury (a) nukleozydów, (b) nukleotydów
Nukleotydy zawierają grupy fosforanowe (PO₄) związane z węglem 5’ cukru (Rys. 3b). Nukleozyd nazywany jest nukleotydem, gdy dołączona jest do niego grupa fosforanowa. Możliwe jest dowiązanie jednej, dwóch lub trzech takich grup połączonych ze sobą. Grupy fosforanowe oznaczane są jako α, β i γ, gdzie α wiąże się bezpośrednio z cukrem. Nukleotydy występują w komórkach jako cząsteczki indywidualne (ich trifosforany pełnią ważne funkcje w komórkach jako nośniki energii wykorzystywane w reakcjach enzymatycznych) lub spolimeryzowane, jak w przypadkach kwasów nukleinowych (DNA lub RNA).
Polinukleotydy DNA
Nukleotydy trifosforanowe łączą się w polinukleotydy. Cztery z nich używane są w syntezie polinukleotydów DNA: 2’-deoksyadenozyno 5’-trifosforan (dATP lub A), 2’-deoksytymidyno 5’-trifosforan (dTTP lub T), 2’-deoksycytozyno 5’-trifosforan (dCTP lub C) oraz 2’-deoksyguanozyno 5’-trifosforan (dGTP lub G). Fosforany β i γ odpadają podczas polimeryzacji i jednostki nukleotydowe wiążą się za pośrednictwem pozostałych reszt fosforanowych. Fosforan 5’ jednego nukleotydu tworzy wiązanie z węglem 3’ następnego nukleotydu, eliminując podczas reakcji grupę –OH przy węglu 3’. Wiązanie takie nazywane jest wiązaniem 3’-5’ fosfodiestrowym (C–O–P) (Rys. 4). Łańcuch polinukleotydowy ma wolną grupę 5’ trifosforanową na jednym końcu jako koniec 5’ oraz wolną grupę 3’ hydroksylową na drugim końcu, zwaną końcem 3’. Rozróżnienie to daje polinukleotydowi DNA biegunowość, w związku z czym cząsteczkę DNA można opisać jako 5’ →3’ lub 3’→5’.
Czynnikiem kodującym informację genetyczną w polinukleotydach DNA jest kolejność zasad. Jest ona zawsze zapisywana w kierunku 5’→3’ (enzymy polimerazy kopiują cząsteczki DNA w tym właśnie kierunku). Polinukleotydy mogą być bardzo długie, bez wyraźnej górnej granicy liczby nukleotydów i bez ograniczeń ich kolejności. Maksymalna liczba sekwencji zasad w polinukleotydzie wynosi 4n, gdzie n jest liczbą nukleotydów. Jest to liczba ogromna. Na przykład: polinukleotyd zawierający sześć zasad może być uporządkowany jako 4⁶ = 4096 różnych sekwencji.
Rysunek 4. Wiązania fosfodiestrowe łączą nukleotydy w polinukleotyd DNA
Podwójna helisa
Cząsteczki DNA mają bardzo specyficzną i charakterystyczną strukturę trójwymiarową nazywaną podwójną helisą (in. podwójną spiralą) (Rys. 5). Strukturę DNA rozpoznali i opisali w roku 1953 pracujący w Cambridge Watson i Crick, wykorzystując rentgenowskie obrazy dyfrakcyjne uzyskane przez Franklin i Wilkinsa. Cząsteczka DNA ma formę dwóch splecionych łańcuchów polinukleotydowych tworzących podwójną helisę. Rdzeń zewnętrzny cząsteczki tworzy jej część cukrowo–fosforanowa. Zasady, będące molekułami płaskimi, zwrócone są do wewnątrz ku sobie, lekko odśrodkowo i ułożone w stos podobny do stosu talerzy.
Rysunek 5. Podwójna helisa
Obrazy podwójnej helisy uzyskane metodą dyfrakcji rentgenowskiej ukazują powtarzające się wzorce wiązań odzwierciedlające regularność struktury DNA. Pełen skręt podwójnej helisy o 360° obejmuje 10 zasad. Jego długość wynosi 34 Å, a odstęp między sąsiednimi zasadami – 3,4 Å. Średnica helisy wynosi 20 Å. Podwójna helisa nazywana jest strukturą przeciwrównoległą. Jedna z jej nici ma kierunek 5’→3’, a druga 3’→5’. Tylko przeciwrównoległe polinukleotydy tworzą stabilne helisy. Podwójna helisa nie jest absolutnie regularna i w jej oglądzie zewnętrznym można dostrzec bruzdę większą i bruzdę mniejszą. Pełnią one ważne funkcje w interakcjach z białkami, w procesach replikacji DNA oraz w ekspresji informacji genetycznej. Podwójna helisa jest prawoskrętna. W porównaniu ze spiralnymi schodami oznacza to, że przy ‘wchodzeniu’ trzon cukrowo–fosforanowy mielibyśmy po prawej stronie.
Gdy kryształy cząsteczek DNA powstają w różnych warunkach, wówczas tworzą się liczne wariantowe ich formy. Forma obecna w komórkach nazywana jest formą B. Inna forma, zwana formą A, ma nieco bardziej zwięzłą strukturę. Istnieją też formy C, D, E i Z, których osobliwością jest lewoskrętność helis. Zidentyfikowano obszary chromosomów zawierające niestandardowe struktury, takie jak Z-DNA.
Komplementarne parowanie zasad
Zasady dwóch łańcuchów polinukleotydowych wchodzą ze sobą w interakcje. Przestrzenie między polinukleotydami decydują o tym, że dwupierścieniowe puryny reagują z jednopierścieniowymi pirymidynami. Tak więc, tymina zawsze reaguje z adeniną, a guanina z cytozyną. Interakcje te stabilizują wiązania wodorowe powstające między zasadami. Między A i T tworzą się dwa wiązania, a między G i C – trzy. Zatem, wiązania G–C są silniejsze od wiązań A–T. Sposób łączenia się zasad w pary między dwiema niciami DNA nosi nazwę komplementarnego parowania zasad i ma fundamenalne znaczenie (Rys. 6). Kombinacje inne niż G–C i A–T nie działają, ponieważ są zbyt duże lub zbyt małe, by mogły pasować do wnętrza helisy, bądź też nie układają się prawidłowo z punktu widzenia tworzenia wiązań wodorowych. Skoro G musi się zawsze wiązać z C, a A z T, zatem sekwencje dwóch nici pozostają we wzajemnej relacji i mówi się o nich, że są komplementarne, co znaczy, że sekwencja jednej nici przewiduje i determinuje sekwencję drugiej. Oznacza to, że jedna nić może być wykorzystana do replikacji drugiej. Opisany mechanizm komplementarnego parowania zasad ma podstawowe znaczenie dla zachowania informacji genetycznej oraz przekazywania jej innym komórkom w procesach ich podziału. Komplementarne parowanie zasad ma także zasadnicze znaczenie w ekspresji informacji genetycznej oraz transkrypcji sekwencji DNA do RNA matrycowego (mRNA) i translacji białek.
Rysunek 6. Komplementarne parowanie zasad. Wiązania wodorowe pokazano liniami przerywanymi
Podwójną helisę stabilizują wiązania wodorowe między parami zasad. Wiązania te mogą być uszkodzone przez wysoką temperaturę i niektóre substancje chemiczne. Skutkuje to rozpadem podwójnej helisy na dwie nici. Cząsteczkę taką nazywamy zdenaturowaną. W komórkach enzymy mogą rozłączać nici podwójnej helisy w celu kopiowania DNA oraz ekspresji informacji genetycznej.
Struktura RNA
Struktura RNA jest podobna do DNA, istnieje jednak szereg ważnych różnic. W RNA rybozę zastępuje 2’-deoksyryboza, a zasadę tyminową inna zasada, mianowicie uracyl mogący się również parować z adeniną (Rys. 7). Ponadto, cząsteczki RNA mają normalnie formę pojedynczych nici polinukleotydowych nietworzących podwójnej helisy. Możliwe jest jednak parowanie zasad między kompementarnymi częściami tej samej nici RNA, czego efektem są krótkie odcinki dwuniciowe.
Replikacja DNA
DNA jest kopiowany przez enzymy zwane polimerazami DNA. Reagując z DNA jednoniciowym, syntetyzują one nową nić komplementarną z pierwotną. Synteza DNA przebiega zawsze w kierunku 5’→3’. Replikacja taka nazywana jest semikonserwatywną (Rys. 8). Oznacza ona, że każda skopiowana cząsteczka DNA zawiera jedną nić pochodzącą z cząsteczki rodzicielskiej oraz nową nić pochodną, będącą wynikiem syntezy podczas replikacji.
Mechanizm replikacji DNA jest bardzo podobny u większości organizmów. Proces ten musi być bardzo dokładny, ponieważ najmniejszy nawet odsetek błędów skutkuje utratą ważnej informacji genetycznej. Jego dokładność zapewnia zdolność polimeraz DNA do sprawdzania poprawności osadzania zasad w syntetyzowanej nici. Proces ten nazywany jest korektą replikacyjną. Ocenia się, że jedna na 5 miliardów zasad osadzana jest nieprawidłowo.
Rysunek 7. Struktury rybozy i uracylu
Rysunek 8. Replikacja semikonserwatywna
Podczas replikacji DNA podwójne helisy całego DNA znajdującego się w komórce są stopniowo rozplatane, czego rezultatem są segmenty DNA jednoniciowego nadającego się do kopiowania przez polimerazy. Rozplatanie podwójnej helisy zaczyna się w położeniu zwanym miejscem inicjacji replikacji i stopniowo postępuje wzdłuż cząsteczki, zwykle w obu kierunkach. Miejsca inicjacji zawierają zwykle sekwencje obfitujące w pary zasad A–T.
Rysunek 9. Miejsce inicjacji replikacji i widełki replikacyjne
Obszar, w którym helisa jest rozplatana i w którym dokonuje się synteza nowego DNA, nazywamy widełkami replikacyjnymi (Rys. 9). W obszarze tym zachodzi szereg odrębnych zdarzeń:
• Rozdzielanie nici podwójnej helisy. To działanie katalizuje enzym helikaza.
• Synteza nici wiodących i opóźnionych. Synteza DNA za pomocą polimeraz DNA odbywa się tylko w kierunku 5’→3’. Dwie nici podwójnej helisy mają przeciwne ukierunkowania (5’→3’ oraz 3’→5’), dlatego replikacja każdej z nich wymaga nieco innych mechanizmów. Jedna nić, zwana wiodącą, kopiowana jest w kierunku zgodnym z kierunkiem rozplatania, może więc być syntetyzowana w sposób ciągły (Rys. 10a). Druga nić, zwana opóźnioną, syntetyzowana jest w kierunku przeciwnym, musi być więc kopiowana metodą nieciągłą. Nić opóźniona syntetyzowana jest jako ciąg segmentów zwanych fragmentami Okazakiego (Rys. 10b).
• Inicjacja. Polimerazy DNA potrzebują krótkiego obszaru podwójnej helisy do zainicjowania syntezy DNA. Zapewnia go polimeraza RNA zwana prymazą, zdolna do inicjacji syntezy na matrycy jednoniciowego DNA. Prymaza syntetyzuje krótką wstępną sekwencję RNA według matrycy DNA, tworząc krótki odcinek dwuniciowy. Następnie polimeraza DNA zapoczątkowuje syntezę DNA, zaczynając od wstępnej sekwencji RNA (inicjatora RNA). W przypadku nici opóźnionej synteza kończy się, gdy proces napotyka następną sekwencję inicjującą. W tym momencie inna polimeraza DNA usuwa inicjatora RNA, zastępując go sekwencją DNA (Rys. 11).
• Ligacja. Ostatnim krokiem niezbędnym do zakończenia syntezy nici opóźnionej jest łączenie fragmentów Okazakiego wiązaniami fosfodiestrowymi. To zadanie wykonuje enzym ligaza DNA (Rys. 11).
Rysunek 10. (a) Replikacja nici wiodącej. (b) Replikacja nici opóźnionej
Rysunek 11. Proces syntezy nici opóźnionejA2 Geny
Zagadnienia kluczowe
Struktura genów
Gen jest jednostką informacji i odnosi się do konkretnego segmentu DNA kodującego sekwencję aminokwasów lub polipeptydów. Komórki ciała ludzkiego zawierają około 21 000 genów rozmieszczonych w 23 chromosomach. Geny są rozproszone i oddzielone od siebie niekodującym międzygenowym DNA. Informacje zakodowane są na nici matrycowej kierującej syntezą cząsteczek RNA. Każda z dwóch nici DNA może pełnić rolę matrycową. Cząsteczki DNA mają ogromną zdolność przechowywania informacji genetycznej.
Rodziny genów
Niektóre geny zgrupowane są w klasterach będących operonami lub rodzinami wielogenowymi. Operony występują w bakteriach i zawierają geny współnadzorowane z powiązanymi z nimi funkcjami. Rodziny wielogenowe występują w organizmach wyższych i zawierają geny identyczne lub podobne do nadzorowanych koordynacyjnie. Proste rodziny wielogenowe zawierają geny identyczne, których produkty potrzebne są w dużych ilościach. Złożone rodziny wielogenowe zawierają geny bardzo podobne, kodujące białka z powiązanymi funkcjami.
Ekspresja genów
Informacje biologiczne zakodowane w genach udostępniane są w trybie ekspresji genów. W procesie tym dokonuje się synteza kopii RNA genów, które następnie kierują syntezą białek. Dogmat centralny głosi, że transfer informacji następuje z DNA do RNA, a następnie do białek. Funkcjonowanie komórek zależy od skoordynowanej aktywności wielu białek. Ekspresja genów zapewnia ich syntezę w odpowiednich miejscach i czasie.
Promotory genów
Ekspresja genów jest ściśle uregulowana. Nie wszystkie geny obecne w komórce są aktywne, a różne typy komórek korzystają z ekspresji różnych genów. Ekspresja genów jest regulowana przez segment DNA zwany promotorem, położony powyżej sekwencji kodującej. Wiąże on polimerazę RNA oraz skojarzone białkowe czynniki transkrypcyjne, inicjując syntezę cząsteczki RNA.
Introny i eksony
Kodująca sekwencja genu rozpada się na ciąg segmentów zwanych eksonami, oddzielonych sekwencjami niekodującymi, zwanymi intronami, stanowiącymi zwykle większą część sekwencji genowej. Liczba i rozmiary intronów są różne w różnych genach. Introny są usuwane z transkryptów RNA w procesie zwanym splicingiem, poprzedzającym syntezę białek. Introny są zwykle nieobecne w genach bakteryjnych.
Pseudogeny
Istnieją kopie niektórych genów zawierające zmiany w sekwencji nabyte w procesie ewolucyjnym i uniemożliwiające produkcję białek. Nazywane pseudogenami, reprezentują ewolucyjne relikty genów pierwotnych. Ich przykładami są pseudogeny globinowe.
Tematy powiązane
(A7) Regulacja ekspresji genów
(A8) Epigenetyka i modyfikacje chromatyny
(B2) Genomy prokariotów
(B3) Genomy eukariotów
Struktura genów
Informacja biologiczna potrzebna organizmowi do rozmnażania zawarta jest w jego DNA. Czynnikiem kodującym jest kolejność zasad w cząsteczkach DNA. Są one zorganizowane w formie dużej liczby genów, z których każdy zawiera instrukcje syntezy polipeptydów. W kategoriach fizycznych gen jest określonym segmentem DNA, którego specyficzna sekwencja zasad koduje kolejność aminokwasów w strukturze polipeptydu. Długości genów bardzo się różnią – od niecałych stu do kilku milionów par zasad. W organizmach wyższych geny występują w ciągach bardzo długich cząsteczek DNA zwanych chromosomami. W ciałach ludzkich zidentyfikowano do tej pory 20 563 geny kodujące białka, rozmieszczone w 23 chromosomach. Geny są znacznie rozproszone w cząsteczkach DNA i rozdzielone sekwencjami, które nie wydają się zawierać użytecznych informacji; ogół tych sekwencji nazywamy DNA międzygenowym (in. intergenowym). DNA międzygenowe bywają bardzo długie; np. w organizmach ludzkich sekwencje genowe zajmują mniej niż 30% całkowitego DNA. Nośnikiem informacji biologicznej jest tylko jedna z dwóch nici podwójnej helisy DNA, nazywana nicią matrycową i wykorzystywana w konstrukcji sekwencji komplementarnej cząsteczki RNA kierującej syntezą polipeptydu. Nić tę inaczej nazywa się antysensowną lub niekodującą. Drugą nić nazywamy kodującą lub sensowną. Każda z nici podwójnej helisy może być potencjalnie nicią matrycową: indywidualne geny mogą być rozmieszczone na różnych niciach.
Zdolność cząsteczek DNA do przechowywania informacji jest gigantyczna. Dla cząsteczki DNA zawierającej n zasad liczba różnych kombinacji czterech zasad wynosi 4n. Nawet dla bardzo krótkich cząsteczek liczba różnych możliwych sekwencji jest ogromna. W praktyce jednak liczba sekwencji zawierających użyteczne informacje jest ograniczona. Tym niemniej zdolność kodowania danych biologicznych pozostaje bardzo duża.
Rodziny genów
Większość genów rozmieszczona jest losowo wzdłuż chromosomów, niektóre są jednak zorganizowane w grupy lub klastery. Istnieją dwa typy klasterów: operony (Rys. 1) i rodziny wielogenowe (Rys. 2).
Operony to klastery genów występujące u bakterii. Zawierają geny uporządkowane w sposób skoordynowany i kodują białka o ściśle powiązanych funkcjach. Przykładem jest operon lac bakterii E. coli zawierający trzy geny kodujące enzymy potrzebne tej bakterii do rozkładu laktozy. Kiedy laktoza jest dostępna jako źródło energii, wówczas potrzebne są jednocześnie wszystkie enzymy zakodowane w operonie lac. Grupowanie genów w operonach umożliwia ich skoordynowane włączanie i wyłączanie w tym samym czasie, co pozwala organizmowi efektywnie wykorzystywać zasoby (Rys. 1).
W organizmach wyższych operony nie występują, a zgrupowania genów mają formę rodzin wielogenowych. W odróżnieniu od operonów, geny należące do rodziny wielogenowej są identyczne lub bardzo do siebie podobne, a ich działanie nie jest koordynowane. Taka forma grupowania genów jest przypuszczalnie efektem zapotrzebowania na wiele kopii tych samych genów, zaspokajanego przez ich duplikację utrwaloną w procesie ewolucji. Niektóre rodziny wielogenowe istnieją jako oddzielne klastery w różnych chromosomach; konfiguracje takie powstały prawdopodobnie w wyniku przegrupowań DNA w procesie ewolucji związanych z rozpadem klasterów. Rodziny wielogenowe mogą być proste lub złożone. W prostych rodzinach wielogenowych (Rys. 2a) geny są identyczne. Przykładem jest gen RNA rybosomalnego 5S. W organizmach ludzkich istnieje około 2000 kopii tego genu zgrupowanych w klasterach, co świadczy o dużym zapotrzebowaniu komórek na jego produkt. Złożone rodziny wielogenowe (Rys. 2b) zawierają geny bardzo do siebie podobne, ale nie identyczne. Przykładem jest rodzina genowa globiny kodująca serię polipeptydów (globiny α, β, γ, ε, ξ) różniące się między sobą tylko kilkoma aminokwasami. Polipeptydy globinowe łączą się w kompleksy z udziałem molekularnego kofaktora zwanego hemem, czego rezultatem są embrionalne i dojrzałe formy hemoglobiny – białka transportującego tlen w krwiobiegu.
Rysunek 1. Operon lac. Trzy geny (lacZ, Y i A) są zgrupowane i nadzorowane łącznie
Ekspresja genów
Informacje biologiczne przechowywane w cząsteczkach DNA zapisane są w formie kolejności zasad. Ekspresja genów jest procesem, w którym informacje te zostają udostępnione komórkom. Sposób wykorzystania informacji genetycznych opisuje dogmat centralny, wprowadzony po raz pierwszy przez Cricka, zgodnie z którym informacje te są transferowane z DNA do RNA, a następnie do białek (Rys. 3). W procesie ekspresji następuje kopiowanie informacji genetycznej połączone z nadzorowaniem syntezy cząsteczek RNA o komplementarnej strukturze. Ta część ekspresji nosi nazwę transkrypcji. Następnie RNA kieruje syntezą polipeptydu, w którym dobór i kolejność aminokwasów jest określana przez kolejność zasad w sekwencji RNA. Ta część procesu ekspresji genów nazywana jest translacją. Dobór i uporządkowanie aminokwasów w cząsteczce białka determinuje jej trójwymiarową strukturę, która z kolei odpowiada jego funkcji lub decyduje o niej. Dogmat centralny głosi, że transfer informacji może odbywać się tylko w jednym kierunku – od DNA do RNA, a następnie do białek – i jest procesem nieodwracalnym. Wyjątki od tej reguły znajdujemy w retrowirusach posiadających enzym nazywany odwrotną transkryptazą, kopiujący RNA do DNA. Funkcjonowanie komórek, a tym samym żywych organizmów zależy od skoordynowanej aktywności wielu różnych białek. Informacja genetyczna zawarta w genach gra rolę zbioru instrukcji syntezy białek w odpowiednich miejscach i czasie.
Rysunek 2. Rodziny wielogenowe. (a) Proste. (b) Złożone
Rysunek 3. Dogmat centralny (u góry) i odwrotna transkrypcja (u dołu)
Promotory genów
Ekspresja informacji biologicznej zapisanej w genach jest w wysokim stopniu regulowana i precyzyjnie nadzorowana. Nie wszystkie geny zawarte w DNA komórki ulegają równoczesnej ekspresji, a różne geny uaktywniają się w różnych typach komórek. Całokształt genów aktywnych w danym czasie określa cechy komórki oraz jej funkcje w organizmie. Na przykład: zupełnie inne geny są aktywne w komórkach mięśniowych, a inne w komórkach krwi. Ekspresję genów nadzoruje segment sekwencji DNA znajdujący się powyżej sekwencji kodującej i nazywany promotorem. Sekwencje DNA zabezpieczone w obrębie promotora są rozpoznawane i wiązane przez polimerazę RNA i inne skorelowane białka, zwane czynnikami transkrypcyjnymi, których zadaniem jest synteza transkryptu genu w RNA. Ekspresja genów w komórce jest więc określona przez sekwencję promotora i jego zdolność do wiązania polimerazy RNA oraz czynników transkrypcyjnych.
Introny i eksony
Jedną z najbardziej zdumiewających cech genów jest to, że w organizmach wyższych informacje kodujące są zwykle podzielone na ciągi segmentów sekwencji DNA zwanych eksonami. Eksony rozdzielone są sekwencjami niezawierającymi użytecznych informacji, nazywanymi intronami (Rys. 4). Liczba intronów jest zróżnicowana w szerokim zakresie – od 0 do 50 w niektórych genach. Różne są też długości eksonów i intronów, przy czym te ostatnie są zwykle dłuższe i wypełniają większą część sekwencji genu. Zanim informacja genetyczna zostanie wykorzystana w syntezie białka, introny muszą być usunięte z cząsteczek RNA w procesie zwanym składaniem (ang. splicing), po którym pozostają tylko eksony i ciągła informacja kodująca. Introny występują wyłącznie w organizmach wyższych i zwykle nie spotykamy ich w bakteriach.
Pseudogeny
Istnieją geny podobne do innych, w których dokładna analiza kolejności zasad ujawnia błędy dyskwalifikujące je jako źródła użytecznej informacji biologicznej. Geny te nazywane są pseudogenami (Sekcja B3) i pochodzą od genów, które w procesie ewolucji zostały obarczone błędami lub mutacjami w sekwencjach DNA, czyniącymi ich biologiczne informacje wadliwymi i nienadającymi się do sterowania syntezą białek. Pseudogeny są więc reliktami przyszłości ewolucyjnej. W procesie ich ewolucji podstawa wyjściowa ulegała zmianom, powodując utratę informacji biologicznej, co stawało się przyczyną zmian jeszcze szybszych oraz istotnego odejścia sekwencji pseudogenu od genu pierwotnego. Przykładem jest szereg pseudogenów globinowych obecnych w klasterach genowych globiny.
Rysunek 4. Introny i eksony