③存在大量重複序列,即在整個DNA中有許多重複出現的核苷酸順序,重複序列長度可長可短,短的僅含兩個核苷酸,長的多達數百、乃至上千。重複頻率也不盡相同;高度重複序列重複頻率可達106次,包括衛星DNA、反向重複序列和較複雜的重複單位組成的重複序列;中度重複序列可達103~104次,如為數眾多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些編碼區序列如rRNA基因、tRNA基因、組蛋白基因等;單拷貝或低度重複序列,指在整個基因組中只出現一次或很少幾次的核苷酸序列,主要是編碼蛋白質的結構基因,在人基因組中佔約60~65%,因此所含信息量最大。
④基因組中不編碼的區域多於編碼區域。
⑤基因是不連續的,在真核生物結構基因的內部存在許多不編碼蛋白質的間隔序列(interveningsequences),稱為內含子(intron),編碼區則稱為外顯子(exon)。內含子與外顯子相間排列,轉錄時一起被轉錄下來,然後RNA中的內含子被切掉,外顯子連接在一起成為成熟的mRNA,作為指導蛋白質合成的模板。
⑥基因組遠大於原核生物的基因組,具有許多複製起點,而每個複製子的長度較小。
2.原核生物基因組結構特點
①基因組較小,沒有核膜包裹,且形式多樣,如病毒基因組可能是DNA,也可能是RNA,可能是單鏈的,也可能是雙鏈的,可能是閉環分子,也可能是線性分子;細菌染色體基因組則常為環狀雙鏈DNA分子,並與其中央的RNA和支架蛋白構成一緻密的區域,稱為類核(nucleoid)。
②功能相關的結構基因常常串連在一起,並轉錄在同一個mRNA分子中,稱為多順反子mRNA(polycistronic mRNA),然後再加工成各種蛋白質的模板mRNA。
③DNA分子絕大部分用於編碼蛋白質,不編碼部分(又稱間隔區)通常包含控制基因表達的順序。例如,噬菌體ψx 174中只有5%是非編碼區。
④基因重疊是病毒基因組的結構特點,即同一段DNA片段能夠編碼兩種甚至三種蛋白質分子。
⑤除真核細胞病毒外,基因是連續的,即不含內含子序列。