3. 3
I. Hệ gen (Genome)
1. Khái niệm:
Genome (hệ gen):
chứa toàn bộ vật
chất chứa TTDT
trong cơ thể sinh vật
được mã hóa trong
AND (ở một số virut
là ARN). Mỗi
genome chứa tất cả
thông tin cần thiết để
xây dựng và duy trì
cơ thể đó.
4. I. Hệ gen (Genome)
2. Genome của vi khuẩn:
Kích thước nhỏ, ở dạng vòng khép
kín.
Chỉ chứa các đoạn ADN không lặp
lại.
Các gen trong genome phân bố sát
nhau, ít bị gián đoạn bởi các đoạn
ADN không chứa mã di truyền
(intron). Các gen đều tồn tại đơn bản.
Trên DNA có chứa các gen mã hóa
cho một protein đặc thù
Một số chứa thêm dạng ADN khác –
plasmid: kích thước bé hơn, dạng
vòng, có khả năng tự nhân bản,
thường chứa một số gen có tính đặc
thù cao (gen kháng kháng sinh, gen
chỉ thị màu…).
5. I. Hệ gen (Genome)
3. Genome của eukaryote:
99% genome nằm trong nhân
TB. Phần còn lại nằm trong
một số cơ quan tử (ty thể, lạp
thể).
6. I. Hệ gen (Genome)
3. Genome của eukaryote:
Genome nhân:
Thường có kích thước lớn (12Mb đến
120.000Mb). Phân bố trên các NST
dạng thẳng. Gồm các thành phần lặp lại
và các thành phần không lặp lại.
Các loại ADN trong genome:
– Các TT lặp lại nhiều lần: chiếm 10-
15% genome. Là những TT AND
ngắn (10-200kb), ko mã hóa, tập
trung ở những vùng chuyên
biệt/NST (tâm động, đầu mút NST)
– Các TT lặp lại TB: 25-40%, là những
đoạn AND có kt lớn hơn (100-
1000kb). Không mã hóa hoặc mã
hóa cho rARN, tARN, 5SARN
– Các TT duy nhất: là các gen mã hóa
cho các Protein, có TT đặc trưng cho
từng gen
7. I. Hệ gen (Genome)
3. Genome của eukaryote:
• Phần lớn các gen pbố trong
thành phần ADN không lặp
lại. Các gen chỉ chiếm một
tỷ lệ rất nhỏ so với toàn bộ
genome (1-2% genome).
Các gen thường phân bố xa
nhau và trong gen chứa
nhiều intron.
• Các gen có nhiều bản sao.
Các bản sao của một gen
được xếp vào một họ gen.
Mỗi gen trong họ thường
hoạt động ở một thời điểm
nhất định trong quá trình
phát triển cá thể hay trong
mô riêng biệt.
9. I. Hệ gen (Genome)
3. Genome của
eukaryote:
• Kích thước của
genome (ở trạng thái
đơn bội - C): đặc trưng
cho loài, kích thước của
genome không tỷ lệ với
mức độ tiến hóa và tính
phức tạp của cơ thể.
10. I. Hệ gen (Genome)
3. Genome của eukaryote:
Genome ty thể: dạng mạch
vòng kép, chứa các gen mã
hóa cho rARN của ty thể và
một số enzyme tgia vào chuỗi
hô hấp. Ngoài ra, ty thể còn
chứa các gen mã hóa tRNA,
Rbsvà một số Pr liên quan đến
quá trình phiên mã, dịch mã, và
vận chuyển các Pr khác vào ty
thể từ TBC.
Genome lục lạp: chứa DNA ở
dạng kép, mạch vòng, chứa
khoảng 200 gen. Các gen mã
hoá cho các rARNvà tARN và
các Pr cần cho hoạt động
quang hợp.
12. Số lượng gen trong genome
Loài Kích thước
Genome (Mb =
10^bp)
(TT mã hóa
Protein(%)
Số lượng
gen
E. Coli 4.6 90 4.288
S. cerevisiae 12 70 5.885
C. elegans 97 25 19.099
Drosophila 180 13 13.600
Human 3000 3 100.000
14. 14
1. Khái niệm gen:
• Gen là một đoạn ADN mã cho một sản
phẩm cần thiết đối với hoạt động sống của
tế bào. Gen -> protein, rARN, tARN và các
loại ARN khác tham gia kiểm soát hoạt
động của genome
2. Cấu trúc gen:
• Gồm hai vùng:
– Vùng AND điều khiển
– Vùng mang mã di truyền
II. Gen
15. 15
2. Cấu trúc của gen
Vùng DNA điều khiển: nằm trước các đoạn gen mang mã, bắt đầu từ -1,
gồm các vị trí:
Promoter: nhận biết và liên kết với enzim RNA polymerase. Promoter
thường nằm ngay trước vị trí +1 của gen (vị trí Nu đầu tiên được phiên
mã sang ARN). Ở procaryota: nằm khoảng từ -35 -> -10, ở eucaryota
từ -25 (-30) -> - 75(-90).
Vị trí hoạt hóa (A) hoặc vị trí ức chế (O): được nhận biết bởi các Pr
điều khiển, chúng có thể liên kết với AND hoặc ARN pol làm tăng
cường hoặc kìm hãm hoạt động của gen trong sao mã
16. 16
2. Cấu trúc của gen (tiếp)
Vùng DNA mang mã di truyền: Là đoạn AND được phiên mã sang
mRNA theo chiều 5’ 3’ trên sợi đang tổng hợp (bd từ +1).
Gồm:
Vùng 5’ và 3’ không dịch mã: liên quan tính bền vững của mRNA;
tham gia kiểm soát dịch mã..
+TT không dịch mã đầu 5’ (5’UTR): tính từ Nu phiên mã đầu tiên đến
bộ 3 Nu khởi đầu dịch mã (AUG hoặc GUG).
+ TT không dịch mã đầu 3’ (3’ UTR): tính từ một trong 3 codon dừng
dịch mã đến hết trình tự kết thúc phiên mã
Khung đọc mở:
• Phần DNA của gen mã hóa tạo chuỗi polypeptide
• Bắt đầu bằng một codon khởi đầu (AUG hoặc GUG) và kết thúc
bằng một trong 3 mã kết thúc là UAA/UAG/UGA.
• Mỗi bộ 3 Nu của khung đọc mở tương ứng với một codon mã hóa
cho một aa.
• Đọc từ đầu 5’ -> 3’, đọc theo phân tử mRNA, đọc từng mã một, đọc
không chồng chéo và đọc cho đến tận mã kết thúc thì dừng lại.
19. 19
So sánh Gen Prokaryote và Eukaryote
Procaryota
- Promoter có TT đặc trưng
TTGACA (-35) và TATAT (-10)
- Trong gen ko có hoặc có ít intron
- Các gen nằm gần nhau và chịu
sự điều khiển chung của một
Promoter (operon)
- Phiên mã và dịch mã xảy ra đồng
thời.
- mARN sau phiên mã là mARN
trưởng thành.
- Không có tín hiệu nhận poly A và
mRNA không có đầu 5’ mang mũ
7 methyl
Eucaryota
- Promoter có TT đăc trưng - hộp
CAAT (- 75) và TATA (-25)
- Các đoạn exon xen lẫn intron.
- Các gen nằm xa nhau, giữa các
gen có các đoạn không mã hoá.
Mỗi gen chịu sự đk của 1 Promoter
- Phiên mã và dịch mã không đồng
thời: Phiên mã trong nhân, dịch mã
ngoài tế bào chất .
- Chịu những biến đổi trước khi dịch
mã (cắt intron và nối exon, các
biến đổi tại đầu 5’ và đầu 3’)
- Các dấu hiệu gắn chuỗi poly A của
mRNA có trình tự 5’- AAUAAA-3’.
Vùng này nằm ở ngay trước đầu
3’nơi bắt đầu gắn polyA, dài từ 10
đến 30 nu, tiếp theo là vùng CA,
rồi đến vùng giầu GU
25. 25
3. Chức năng của gen
Chức năng của gen thể hiện ở 3 quá trình:
• Tái bản DNA.
• Phiên mã tạo ra mRNA, hoặc rRNA hay tRNA.
• Dịch mã hoặc sinh tổng hợp protein dựa trên
khuôn mRNA xuyên qua ribosome để lắp ráp các
amino acid nhờ các tRNA vận chuyển đến.
26. III. DNA CÓ TRÌNH TỰ LẶP LẠI TRONG
GENOME
1. DNA có trình tự lặp lại liền kề
(ADN vệ tinh)
Là các đoạn DNA có chứa
những trình tự DNA được lặp
lại liền nhau hình thành nên các
băng vệ tinh khi phân tích DNA
của genome bằng phương
pháp ly tâm chênh lệch tỷ trọng.
Đơn vị lặp lại của các DNA vệ
tinh thay đổi từ vài (<5 bp) đến
hàng trăm cặp bazơ (>200 bp).
DNA vệ tinh thường tìm thấy ở
tâm động hoặc vùng dị nhiễm
sắc trên NST. Chúng thuộc
nhóm các DNA có trình tự lặp
lại cao.
Phương pháp ly tâm
chênh lệc tỷ trọng
27. III. DNA CÓ TRÌNH TỰ LẶP LẠI TRONG GENOME
2. DNA tiểu vệ tinh (Minisatellite) và vi vệ tinh (microsatellite)
DNA tiểu vệ tinh và DNA vi vệ tinh cũng được gọi là các DNA
vệ tinh dù chúng không xuất hiện các băng vệ tinh khi phân tích
tỉ trọng DNA.
DNA tiểu vệ tinh: là các đoạn DNA có nhiều đơn vị lặp lại dưới
25 bp, có chiều dài khoảng 20 kb.
DNA vi vệ tinh (SSR): DNA có đơn vị lặp lại ngắn, thường là 4
bp hoặc ngắn hơn và có chiều dài thường nhỏ hơn 150 bp
-> Ứng dụng: dùng làm chỉ thị di truyền, phát hiện sự đa hình
trong ADN giữa 2 cá thể, xây dựng bản đồ di truyền
Ví dụ:
Motif 5’-TTAGGG-3’ được lặp lại hàng trăm lần ở đầu cuối của NST
người là một dạng DNA tiểu vệ tinh điển hình
Ở lúa, các dạng SSR là (GA)n, (GT)n, (AT)n, (GGT)n.
28.
29. 3. Trình tự lặp lại phân bố rải rác trong
genome
• Là những đoạn ADN có khả năng di động
(yếu tố chuyển vị) giữa các vị trí khác
nhau trong một hay nhiều genome.
• Phân loại: 2 nhóm
– Nhóm các yếu tố di chuyển thông qua trung
gian ARN (RNA transposons – retroelement).
– Nhóm các yếu tố di chuyển không qua trung
gian ARN (ADN transposons).
30. AND có TT lặp lại liền kề AND có TT lặp lại rải rác
31. 3.1. Nhóm các yếu tố di chuyển thông qua
trung gian RNA (RNA transposons).
Cơ chế: Retroposon -> ARN -> cADN -> bản
sao ADN -> di chuyển (vào các vị trí khác nhau
của genome - trên cùng 1 NST hoặc NST khác)
Enzyme tham gia: E phiên mã ngược (reverse
transcriptase) (được mã hoá bởi gen nằm ngay
trong đoạn retroposon).
Kết quả: có hai hoặc nhiều bản sao của
retroposon ở các vị trí khác nhau trong genome
Gồm: Retrovirus, Retrotransposon,
retroeleenzymet (LTRs), LINEs, SINEs
34. 3.1. Nhóm các yếu tố di chuyển thông qua
trung gian RNA:
Retrovirus
Virus có genome là ARN.
Khi xâm nhiễm vào TB ký chủ, ARN của virus
được sao chép thành ADN (nhờ enzyme phiên
mã ngược - được mã hoá bởi gen của virus) ->
bản sao DNA -> được tổ hợp vào genome của
TB ký chủ -> cùng tái bản với NST ký chủ.
Các retrovirus nội sinh (ERVs): genome của
retrovirus khi được tổ hợp vào NST của tế bào
ký chủ (chủ yếu là động vật có xương sống),
một số trong chúng vần còn hoạt tính -> có thể
tổng hợp nên các virus nội sinh
35. 3.1. Nhóm các yếu tố di chuyển thông qua
trung gian RNA:
Các yếu tố lặp lại tận cùng dài (LTRs)
Là những vùng chứa vài trăm bp lặp lại, nằm ở
đầu các phân tử DNA của retrovirus.
LTRs có thể có chức năng làm cơ sở để nhiều
gen của sinh vật nhân chuẩn biểu hiện, ví dụ có
chức năng kích hoạt, khởi đầu và nhập poly A
vào các mRNA.
Kích thước phân tử của các LTR từ dưới vài
trăm đến 10 kb.
36. 3.1. Nhóm các yếu tố di chuyển thông qua
trung gian RNA:
Các yếu tố khác không chứa LTRs (LINEs và SINEs):
đặc trưng ở động vật có vú.
Các yếu tố chèn, xen dài (LINEs):
Chứa gen mã hoá cho gag protein và enzyme polymerase (cn
giống enzyme phiên mã ngược) và gen mã hoá cho
endonuclease env (thúc đẩy sự tổ hợp của các yếu tố chuyển vị
‘retro” vào gen).
Sự xen đoạn của LINE được lặp đi lặp lại bởi quá trình tái bản
trực tiếp và gắn của DNA mục tiêu.
Các yếu tố chèn, xen ngắn (SINEs):
Không có gen mã hoá tạo enzyme phiên mã ngược nhưng vẫn
có khả năng chuyển vị.
SINE có độ lớn từ 100 đến 300 bp.
SINE rất phổ biến ở động vật và thực vật
37. Là những đoạn ADN có khả năng di chuyển đôc lập giữa
các vị trí khác nhau trong genome, không phải qua trung
gian là ARN
• Cơ chế di chuyển: 2 cơ chế:
– Sự di chuyển có tính tự tái bản (cơ chế sao y bản
chính): Phiên bản của các yếu tố chuyển vị được sao
chép từ vị trí ban đầu và tái tổ hợp vào vị trí mới mục
tiêu. Sau mỗi lần di chuyển thì số lượng bản sao
được tăng lên.
– Sự di chuyển có tính bảo thủ (Cơ chế cắt-dán):
các yếu tố chuyển vị có thể tách ra khỏi vị trí ban đầu
và sau đó là tái tổ hợp lại ở một vị trí mới. Trong
trường hợp này, số lượng của các transposon là
không thay đổi.
3.2. Nhóm các yếu tố di chuyển không thông
qua RNA (DNA transposons)
40. Cơ chế di chuyển của các yếu tố chuyển vị trong genome
41. 3.3. Transposon của Vi khuẩn
a. Các trình tự IS (Insertion Sequences)
Là các transposon đơn giản nhất của vi khuẩn. Được
phát hiện đầu tiên ở vi khuẩn E.coli do tác động ức
chế của nó đến hoạt động của gen
Các trình tự IS không mã hóa cho protein (không giữ
chức năng nào trong tế bào)
Cấu trúc: có kích thước nhỏ (1kb), gồm:
– Một trình tự trung tâm: đặc trưng cho từng loại IS
– Hai đầu mút: mang các trình tự lặp lại ngược chiều
ngắn (15-25bp).
43. 43
3.3. Transposon của Vi khuẩn
a. Các trình tự IS (Insertion Sequences)
+ Cơ chế chuyển vị của IS:
tái bản + bảo thủ
– Chúng chèn vào NST ở
những vị trí có tính ngẫu
nhiên, gây ra đột biến thông
qua hoạt động xáo trộn trình
tự mã di truyền của một gen
hay làm xáo trộn vùng điều
hoà hoạt động của gen.
– Khi đoạn IS được ghép vào
vị trí bất kỳ trên genome,
đoạn DNA tại đây được
nhân đôi ->tạo thành các
trình tự lặp lại cùng chiều
(9bp)
-> Dựa vào đoạn lặp lại
cùng chiều và ngược
chiều biết vị trí mà
transposon đến hoặc đi.
44. 44
3.3. Transposon của Vi khuẩn
* Transposon “hỗn hợp”- Tn
Đoạn DNA có kích thước dài hơn IS.
Phân bố trên plasmid.
Có khả năng chèn vào bất kỳ vị trí nào trong genome
Mang TTDT mã hóa cho Pr kháng kháng sinh.
Cấu trúc Tn ở hai đầu thường được giới hạn bởi loại IS nào đó.
Ví dụ: transposon Tn – 9:
2 gen: gen kháng cloramphenicol + gen mã cho Pr cần thiết cho sự di chuyển.
Hai đầu của Tn – 9 được giới hạn bởi IS1 (TT nu sx theo cùng một chiều.
45.
46. 46
3.4. Transposon ở sinh vật Eukaryote
(Cấu trúc Ac và Ds ở ngô)
• Ac:
– Là yếu tố di động.
– Độ dài 4563 bp, được giới
hạn hai đầu bởi hai IR có
chiều dài 11 bp, trình tự
ngược chiều nhau.
– Mã hoá cho một mRNA có
độ dài 3.5 kb, có một đầu 5’
UTR 650 bazơ, và một
khung đọc mở dịch mã tạo
một protein có 807 amino
acid, enzyme transposase,
là enzyme xúc tác cho quá
trình gắn xen của các
transposon.
– Đoạn Ac có chứa 4 intron
(a,b,c,d) và chia trình tự đó
thành 5 exon.
47. 47
3.4. Transposon ở sinh vật Eukaryote
(Cấu trúc Ac và Ds ở ngô)
• Ds:
– Là yếu tố nhảy có nguồn
gốc từ Ac bị đột biến mất
đoạn, có trình tự hai đầu
là IR giống hệt Ac.
– Ds thường tương đồng
với Ac nhưng ngắn hơn,
do đột biến mất đoạn.
– Ds không có đoạn ORF
đầy đủ -> không tạo
enzyme transposase ->
không tự di chuyển, nhờ
Ac cùng có mặt trong
genome
49. * Vai trò của Transposon
• Khi di chuyển, các transposon gây ra việc sắp xếp, tổ chức lại
genome của từng cá thể như tạo các đoạn ADN mới hoặc thay
đổi chức năng hoạt động của các đoạn ADN ở vị trí chúng ghép
vào hoặc tách ra. Khi tách ra chúng có thể mang theo các đoạn
ADN phụ cận, gây sự mất đoạn tại vị trí cũ. Ngược lại khi ghép
vào vị trí mới, chúng lại gây ra hiện tượng thêm đoạn hoặc
chuyển đoạn ở vị trí mới.
• Sự trao đổi chéo giữa các transposon tương đồng ở hai vị trí
khác nhau trên một hoặc hai nhiễm sắc thể cũng tạo ra những
biến đổi tương tự.
• Đặc biệt sự thay đổi vị trí của các transposon còn có thể gây
ảnh hưởng đến hoạt động của các gen phân bố xung quanh
ngay khi chúng không làm thay đổi trật tự các nucleotit ở
những gen này
50. 4. TỔ CHỨC HỆ GENOME CỦA NGƯỜI
• Kích thước: dài khoảng 3200Mb, 1/3 DNA trong đó có liên quan
đến gen.
• Trong gen gồm vùng mã hóa và không mã hóa.
• Vùng không mã hóa gồm: Pseudogene, các đoạn trong gen,
các intron và vùng leader.
• Pseudogene (gen giả): giống với một gen đã biết ở locus khác
nhưng không có chức năng do đột biến thêm hoặc mất một cấu
trúc làm mất khả năng phiên hoặc dịch mã gen.
• Phần lớn các DNA còn lại (chiếm 2/3) là trình tự DNA giữa các
gen gồm trình tự lặp lại (420 Mb): liền kề và phân bố rải rác.
Trong trình tự lặp lại liền kề lại bao gồm trình tự DNA satellite,
microsatellite và minisatellite. Còn trình tự phân bố rải rác bao
gồm các LTRs, SINE, LINE và DNA transposon.
51. 4. TỔ CHỨC HỆ GENOME CỦA NGƯỜI
• Trình tự linh tinh khác (miscellaneous) chiếm 25% gồm: SD
(Shine-Dalgano Sequence) là một phần hoặc tất cả trình tự
vùng leader nằm trước codon khởi đầu AUG, trình tự này bổ
sung với đầu 3 của 16S rRNA vì thế là vị trí bọc của ribosome.
Vùng 16S rRNA này theo Shine và Dalgano (1974) có thể đóng
vai trò ghép cặp bazơ trong việc kết thúc và khởi đầu quá trình
tổng hợp protein của mRNA.
• SSR (Simple sequence repeats) trình tự lặp lại đơn giản nằm
rải rắc trong genome.
• Số còn lại 17% DNA genome đến nay vẫn chưa rõ thuộc loại
cấu trúc nào. Mô hình sau đây minh họa tỷ lệ % DNA giữa các
thành phần trong hệ genome nhân của người đã được phát
hiện.