前言:
DNA存儲了恐龍的生物信息,科技讓它重新表達。DNA存儲或許也可以像我們如今用的移動硬盤一樣進行現場即時存儲。
DNA存儲技術將有望成為下一代信息存儲技術。
DNA數據保存面臨“大”問題
在大自然里,DNA負責存儲遺傳信息。
單個人體細胞的平均直徑是5到200微米,這其中的DNA可以包含一個人全部的遺傳信息:30億對堿基。
大規模的基因組測序正在進行,隨之產生的數據規模快速增長。
存儲、壓縮這些數據是個麻煩事,現有的技術方案看起來不太行。
據估計:人類基因組需要高達2-40EB的存儲容量。
這可能超過一個世界級科技公司的云存儲量,全世界蘋果用戶存儲在谷歌云上的數據總量大約是8EB。
這8EB數據,每月存儲費需要2.18億美元。
DNA存儲原理其實很難理解
DNA由腺嘌呤(A)、鳥嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)4個堿基構成雙螺旋結構,可以保存生物體的遺傳信息。
DNA存儲遺傳信息的原理并不復雜,它由四種核苷酸A、T、G、C組成,彼此兩兩對應,組成雙螺旋結構。
在數字世界,所有的信息本質上是0和1組成的數據串。
想要DNA存儲數字信息,簡單理解,原就是將0和1的編碼序列轉換成核苷酸的序列。
DNA存儲的優勢在于密度大,大約在你眼前逗號這么大小,1立方毫米的DNA,就可以容納9TB(1TB=1024GB)的信息。
在自然界存在的DNA中,A和T,C與G兩兩配對,在一條DNA中,CG與AT的存在比例基本均勻,為50%左右。
也就是說,雖然DNA的存儲能力很強,但它們不得不以很多條短鏈的方式存在。
難以突破的結構性障礙
雖然DNA存儲具有較為明顯突出的優勢,政策、資本等也在全方位的支持,應用的前景廣闊,但商業化的進展仍然十分緩慢。
其最大屏障來自于其存儲技術本身。
DNA存儲數據的過程主要分為五個步驟:
①編碼——將數字信息編碼為DNA序列;
②合成——將序列融入實際的DNA分子;
③存儲——將合成的DNA片段保存在載體或細胞中;
④訪問——檢索和選擇性讀取序列信息;
⑤解碼——將測定的序列信息轉換回數字信息。
在整個存儲的過程中,編碼與合成是DNA存儲中較為關鍵和困難的環節。
總的來說,DNA存儲的各個環節都有較多的難關需要克服,DNA存儲真正意義上的走入商業市場。

DNA存儲試圖走向商業化道路
2020年微軟、西部數據和基因測序巨頭Illumina、DNA合成初創公司TwistBioscience等聯合成立了DNA數據存儲聯盟。
這是世界上第一個該領域的學術和產業鏈聯盟,這個聯盟希望制定技術和格式標準,最終建立一個可以通用的商業系統。
微軟研究院在2015年就成立了DNA存儲的項目,2021年微軟開發出首個納米級DNA存儲器,能夠在每個平方厘米的區域上,同時合成25X106(2650)條堿基序列。
這個新的技術把原來同時合成堿基序列的數字從個位提升到了千位。這個吞吐量,讓DNA合成速度變成了每秒兆字節(MB)。
進一步發展成為主流的存儲設備,還需要長時間的沉淀,才能讓DNA存儲技術有實質的進階。
DNA存儲在AI技術的加持下,其編碼的環節效率也獲得了極大地提升。
未來隨著納米技術與AI技術的加持,DNA存儲的技術也會一步步解除智識的限制禁錮,逐步升級,為存儲領域帶來質的飛躍。
DNA存儲的四大優勢
相比于目前我們常用的存儲介質,如U盤、光盤、硬盤等,DNA存儲具有一系列優勢。
①存儲密度高。每立方厘米的DNA分子可以存儲大約1EB的信息,這一密度是當前存儲密度最高的介質(閃存)的1000倍,是硬盤數據存儲密度的百萬倍。
②保存壽命長。從理論上來說,DNA數據在沒有特別人工干預的情況下至少能保存千年之久。
③維護成本低。存儲在DNA的數據,理論上來說通過低溫冷凍或者固態封存的手段,可以長時間存儲且幾乎不需要維護。
④DNA存儲所需要的占地也遠小于傳統存儲介質,并且還具備數據易復制、易攜帶、能在生物體內存儲等特點。
現階段至少需要解決的三大問題
①讀寫速度太慢:以目前的技術在合成DNA時,每添加一個堿基大約需要0.1秒鐘時間。保存一首高音質的MP3歌曲都需要差不多1個月時間。
②成本太高:目前合成2MB的DNA數據需要7000美元,讀取數據需要2000美元,如果以DNA形式存儲1GB大小的電影,編碼大約需要花費358萬美元。
③合成DNA的穩定性:合成DNA過程中產生的錯誤率對于要求確保100%真實性和完整性的數據存儲指標而言是致命的問題。

結尾:
但這項技術目前遠未成熟,或許離真正商用還需要20年,甚至更長。
或許有可能過程中碰到一個難以突破的技術瓶頸導致中途夭折;或許過程中出現另外一項更具革命性的存儲技術,比如量子存儲,形成降維打擊。
部分資料參考:極客公園:《你身體里的DNA,能存下整個宇宙的數據》,腦極體:《存儲新圖譜:DNA存儲的邊界與天地》
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。