當前位置:
首頁 > 科技 > 一顆精子=750MB的信息!且行且珍惜!

一顆精子=750MB的信息!且行且珍惜!

此內容來源於外媒,覺得有意思,翻譯為中文,分享給雲頭條的讀者朋友們

有一天我與一位計算機科學出身的朋友聊了會天。後來聊到了我的研究,冒出了下面這個問題:人類基因組中存儲了多少數字信息?我開始絞盡腦汁,不過意識到根本就答不出來。於是我決定好好算一下,估計我們的基因組中存儲了多少信息。

算算基因組的信息存儲容量

人類基因組中含有生物體的全部基因信息,作為DNA序列存儲在23對染色體中(22對常染色體和1對X或Y性染色體),染色體是由DNA和蛋白質組成的結構。一個DNA分子由組成標誌性的雙螺旋(twisted ladder)的兩條單鏈組成,而雙螺旋的基幹(由糖和磷酸鹽分子組成)由含氮鹼基連接起來。DNA由4種不同的鹼基組成:腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鳥嘌呤(G)。這些鹼基總是以腺嘌呤連接胸腺嘧啶、胞嘧啶連接鳥嘌呤的方式相配對。這些配對生成4種可能的不同鹼基對:A-T、T-A、G-C和C-G。單倍體人類基因組(只含有每個染色體的1個副本)由大約30億個分成23對染色體的這些鹼基對組成。一個人經遺傳得到兩組基因組(從父母那裡得到),因此得到兩組染色體,共46對染色體,代表二倍體基因組,含有6×109個鹼基對。

將基因組與計算機數據存儲進行比較

為了在計算機上表示DNA序列,我們需要能夠以二進位格式(0和1)表示所有4種可能的鹼基對。0和1這些比特通常組合成一個較大的單位,最小的單位是「位元組」,表示8個比特。我們可以使用最少2個比特來表示每個鹼基對,因而有4種不同的比特組合(00、01、10和11)。每2個比特組合表示一個DNA鹼基對。一個位元組(或8比特)可以表示4個DNA鹼基對。為了用位元組表示整個二倍體人類基因組,我們可以執行下列計算:

6×109個鹼基對/二倍體基因組×1個位元組/4個鹼基對= 1.5×109位元組或1.5吉位元組,相當於2張CD的存儲量!或小得足以將3組不同的基因組裝在一張標準的DVD上!

整個有機體的數據存儲

某個有趣的問題可能隨之而來。比如說,人體內存儲了多少兆位元組的基因數據?為了簡單起見,不妨忽略微生物組(生活在我們身體中的所有非人類細胞),只關注組成我們身體的細胞。估計人體中細胞的數量在10萬億到100萬億之間。姑且將這100萬億個細胞作為普遍接受的估計值。因此,鑒於每個二倍體細胞含有1.5GB的數據(這個值非常近似,因為我只算了二倍體細胞,忽略了我們體內的單倍體精子和卵子細胞),所以人體中存儲的大致數據量是:

1.5吉位元組×100萬億細胞=150萬億吉位元組或150×1012×109位元組=150澤位元組(1021)!

性信息交換

同樣,人類繁殖過程中交換了多少基因數據呢?男人中的每個精子細胞都是異形配子的、單倍體的,這意味著它只含有兩條性染色體中的一條(X或Y),而且只有一組22對常染色體。因此,每個精子含有約30億鹼基的基因信息,表示750兆位元組的數字信息。人一次射出的精液平均含有約1.8億個精子細胞。所以,那就是180×106單倍體細胞×750兆位元組/單倍體細胞=135×109兆位元組=135000兆兆位元組!在此基礎上更進一步,13500兆兆位元組傳輸時,只有一個精子細胞會與一個卵子結合,只使用了750兆位元組的數據,與來自卵子的另一750兆位元組的數據相結合。因此,在有性繁殖的過程中傳送的數據中實際上99.9999…%被丟失了......剩餘那一點可憐的信息會不會帶來任何成果就看是不是好好培養了。

算出上述數字後,有人可能會問一大堆其他好奇的問題。你有沒有想過我們生物有機體的數據容量?細胞分裂過程中的數據傳輸速率是多少?配子結合過程中的數據傳輸速率是多少?人類淋巴細胞在血液中循環時的數據傳輸速率是多少?每天因細胞凋亡而受到破壞的數據有多少?每天生成多少數據?這與通過光纖傳輸數據的速率相比如何?

來自微博@左耳朵耗子的評論:

雲頭條編譯、未經授權謝絕轉載


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲頭條 的精彩文章:

程序員工作到了 35 歲之後就是盡頭了嗎
買家注意了:第四季度 DRAM 價格將上漲 10%
微軟和GitHub聯合,共同將Git虛擬文件系統引入到macOS和Linux
虛擬機比容器來得更輕盈,還更安全!
從一張圖見美國十大公司的百年變遷

TAG:雲頭條 |