行業(yè)資訊
News
發(fā)布時間:2022-2-9 瀏覽次數(shù):1095
Nature對今年可能撼動科學(xué)領(lǐng)域的工具進行了年度總結(jié)。
從基因編輯到蛋白質(zhì)結(jié)構(gòu)確定,再到量子計算,這七種技術(shù)可能在未來一年內(nèi)對科學(xué)產(chǎn)生重大影響。
▉ 1:完整測序的人類基因組
當(dāng)加利福尼亞大學(xué)圣克魯斯分校(University of California, Santa Cruz)的基因組學(xué)研究人員Karen Miga和馬里蘭州貝塞斯達國家人類基因組研究所(National Human Genome Research Institute)的Adam Phillippy在2019年創(chuàng)立端粒到端粒聯(lián)盟(Telomere-to-Telomere, T2T)時,大約十分之一的人類基因組仍未被破譯。現(xiàn)在,這個數(shù)字已降至零——人類基因組已被全部破譯。在2021年5月發(fā)表的預(yù)印本中,該聯(lián)盟報告了人類基因組的首個端到端完整序列,為廣泛使用的人類共有基因組序列GRCh38 添加了近2億個新堿基對,并撰寫了人類基因組計劃的最后一章。
GRCh38于2013年首次發(fā)布后,一直是非常有用的工具,是各類測序結(jié)果的參考基因組。但這一序列充滿了漏洞,原因在于加利福尼亞州圣地亞哥的Illumina開發(fā)的、廣泛使用的測序技術(shù)產(chǎn)生的讀數(shù)雖然準(zhǔn)確,但只能實現(xiàn)短序列的檢測。該技術(shù)不足以明確地繪制出高度重復(fù)的基因組序列,包括覆蓋染色體末端的端粒和在細胞分裂過程中協(xié)調(diào)新復(fù)制的DNA分配的著絲粒。
讀長較長的測序技術(shù)被證明是游戲規(guī)則的改變者 這些技術(shù)由加利福尼亞州門洛帕克的 Pacific Biosciences和英國牛津的Oxford Nanopore Technologies (ONT)開發(fā),可以在一次讀取中對數(shù)萬,甚至數(shù)十萬個堿基進行測序,初代長讀長測序技術(shù)存在準(zhǔn)確性方面的問題。然而,當(dāng)T2T團隊在2020年重測他們的第一條個體染色體(X染色體和8號染色體)時,Pacific Biosciences的測序已經(jīng)發(fā)展到長段重復(fù)序列中的微小變化的程度,準(zhǔn)確程度不亞于T2T使用的短讀方法。這些微妙的“指紋”使長的重復(fù)染色體片段易于識別和追蹤,很快能實現(xiàn)對剩余基因的測序。ONT平臺還捕獲了許多調(diào)節(jié)基因表達的DNA修飾,T2T也能夠在全基因組范圍內(nèi)繪制這些“表觀遺傳標(biāo)簽”。
T2T檢測的基因組來自包含兩組相同染色體的細胞系。正常的二倍體人類基因組中每個染色體含有兩個拷貝(一個來自父親,一個來自母親),研究人員現(xiàn)在正在研究“定相”策略,可以可靠地將每個序列分配給對應(yīng)的染色體拷貝。Miga指出,他們已經(jīng)獲得了一些非常驚人的分階段裝配。
這項二倍體組裝工作是與T2T的合作伙伴——人類泛基因組參考聯(lián)盟(Human Pangenome Reference Consortium)合作進行的,該組織渴望根據(jù)來自世界各地的數(shù)百名捐贈者制作更具代表性的基因組圖譜。該聯(lián)盟的首席研究員之一、紐約市洛克菲勒大學(xué)(Rockefeller University)的遺傳學(xué)家Erich Jarvis表示,他們的目標(biāo)是平均捕獲97%的人類等位基因多樣性。作為脊椎動物基因組計劃(Vertebrate Genomes Project)的主席,Javis還希望利用這些完整的基因組組裝能力為地球上的每個脊椎動物物種生成完整的基因組測序。他認(rèn)為在接下來的10年內(nèi),他們將定期進行端粒到端粒的基因組研究。
結(jié)構(gòu)決定功能。但解析結(jié)構(gòu)本身就是一件難事兒。過去兩年的重大實驗和計算進步為研究人員提供了互補的工具,以前所未有的速度和分辨率確定蛋白質(zhì)結(jié)構(gòu)。
由倫敦Alphabet子公司DeepMin開發(fā)的AlphaFold2結(jié)構(gòu)預(yù)測算法,依靠“深度學(xué)習(xí)”策略從其氨基酸序列中推斷折疊蛋白質(zhì)的形狀。在2020年蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵評估競賽中,計算生物學(xué)家在該競賽中直接測試了AlphaFold2算法,并取得了決定性勝利。之后,AlphaFold2名聲大噪,采用率不斷增長。英國欣克斯頓歐洲生物信息學(xué)研究所(European Bioinformatics Institute)高級科學(xué)家兼前主任Janet Thornton提到,對于某些結(jié)構(gòu),預(yù)測幾乎出奇地好。自去年7月公開發(fā)布以來,AlphaFold2已應(yīng)用于蛋白質(zhì)組,以確定在人類和20種模式生物中表達的所有蛋白質(zhì)的結(jié)構(gòu)(參見 Nature 595, 635; 2021),以及Swiss-Prot數(shù)據(jù)庫中近440,000種蛋白質(zhì)的結(jié)構(gòu)。這一計劃將大大增加可用于高置信度建模數(shù)據(jù)的蛋白質(zhì)數(shù)量。AlphaFold 算法也證明了其處理多鏈蛋白質(zhì)復(fù)合物的能力。
與此同時,低溫電子顯微鏡 (cryogenic-electron microscopy, cryo-EM) 的改進使研究人員能夠通過實驗解決即使是最具挑戰(zhàn)性的蛋白質(zhì)和復(fù)合物。Cryo-EM使用電子束掃描快速冷凍的分子,生成多個方向的蛋白質(zhì)圖像,然后可以通過計算重新組裝成3D結(jié)構(gòu)。2020 年,cryo-EM硬件和軟件的改進使兩個團隊能夠生成分辨率低于1.5埃的結(jié)構(gòu),捕獲單個原子的位置。紐約市結(jié)構(gòu)生物學(xué)中心西蒙斯電子顯微鏡中心(New York Structural Biology Center’s Simons Electron Microscopy Center)的聯(lián)合主任Bridget Carragher表示,在此之前,他們瘋狂地談?wù)摗臃直媛省@個詞,但它只是接近原子的,冷凍電鏡確實是原子級分辨率。Carragher還指出,盡管兩個團隊都使用了一種經(jīng)過充分研究的模型蛋白(脫鐵鐵蛋白),但現(xiàn)有研究表明,近原子分辨率對于其它更困難的目標(biāo)也是可行的。
許多最初對AlphaFold2持懷疑態(tài)度的實驗者現(xiàn)在將其視為對冷凍電鏡等實驗方法的補充,其計算模型可以幫助數(shù)據(jù)分析和重建。冷凍電鏡可以生成目前無法進行計算預(yù)測的結(jié)果。例如,Carragher的團隊正在使用“時間分辨”冷凍電鏡來捕捉蛋白質(zhì)與其它分子相互作用時發(fā)生的快速構(gòu)象變化。她表示,她們可以動態(tài)捕捉事物,并查看在一百毫秒的時間內(nèi)發(fā)生了什么。
一種相關(guān)的方法也很令人興奮,即低溫電子斷層掃描 (cryo-electron tomography, cryo-ET),它可以捕捉冷凍細胞薄切片中的自然蛋白質(zhì)行為。但對這些擁擠、復(fù)雜的圖像的解釋具有挑戰(zhàn)性,Carragher認(rèn)為機器學(xué)習(xí)領(lǐng)域的計算進步將是必不可少的。她想不出還有其他方式能解決這些幾乎難以解決的問題。
原子大小非常小。但在適當(dāng)?shù)臈l件下,它們可以被誘導(dǎo)成一種高度激發(fā)的、超大尺寸的狀態(tài),直徑約為一微米及以上。物理學(xué)家已經(jīng)證明,通過以受控方式在精心定位的數(shù)百個原子陣列上執(zhí)行這種激發(fā),他們可以解決將傳統(tǒng)計算機推向極限的、具有挑戰(zhàn)性的物理問題。
量子計算機以量子位的形式管理數(shù)據(jù)。使用稱為糾纏的量子物理現(xiàn)象耦合在一起,量子位可以在一定距離內(nèi)相互影響。相對于經(jīng)典計算機中同等數(shù)量的比特,這些量子位通過給定的量子比特分配,可以極大地提高計算能力。
幾個小組已經(jīng)成功地將單個離子用作量子比特,但它們的電荷使它們難以以高密度組裝。包括法國國家科學(xué)研究中心(Centre National de la Recherche Scientifique)的Antoine Browaeys和馬薩諸塞州劍橋哈佛大學(xué)(Harvard University)的Mikhail Lukin在內(nèi)的物理學(xué)家正在探索一種替代方法。團隊使用光學(xué)鑷子將不帶電的原子精確定位在緊密排列的2D和3D陣列中,然后應(yīng)用激光將這些粒子激發(fā)成大直徑的“里德堡原子”,并與它們的鄰居糾纏在一起。據(jù)韓國大田韓國科學(xué)技術(shù)高級研究所(Korea Advanced Institute of Science and Technology)的物理學(xué)家Jaewook Ahn解釋,里德堡原子系統(tǒng)是單獨可控的,它們的相互作用可以打開和關(guān)閉。這反過來又賦予了可編程性。
這種方法在短短幾年內(nèi)獲得了相當(dāng)大的發(fā)展勢頭,技術(shù)進步提高了里德堡原子陣列的穩(wěn)定性和性能,以及從幾十個量子比特快速擴展到幾百個量子比特。早期的應(yīng)用集中在確定的問題上,例如預(yù)測材料的特性,但這種方法是通用的。Broways提醒,到目前為止,理論家提出的任何理論模型,都有實現(xiàn)它的方法。
該領(lǐng)域的先驅(qū)者已經(jīng)成立了一些公司,這些公司正在開發(fā)基于里德堡原子陣列的系統(tǒng)供實驗室使用,Broways 估計這種量子模擬器可能在一兩年內(nèi)上市。但這項工作也可以為量子計算機鋪平道路,使其更廣泛地應(yīng)用于經(jīng)濟、物流和加密領(lǐng)域。研究人員仍在努力確定這項仍處于起步階段的技術(shù)在計算世界中的地位,但Ahn將其與萊特兄弟早期進軍航空業(yè)的做法相提并論。Ann認(rèn)為,雖然第一架飛機沒有任何運輸優(yōu)勢,但它最終改變了世界。
▉ 4:精準(zhǔn)基因組編輯
就其基因組編輯能力而言,CRISPR-Cas9技術(shù)更適合基因失活,而非修復(fù)。這是因為盡管將Cas9酶靶向基因組序列相對精確,但細胞對由此產(chǎn)生的雙鏈切割的修復(fù)卻不太精確。由名為非同源末端連接的過程介導(dǎo),CRISPR-Cas9修復(fù)經(jīng)常因小的插入或缺失而變得混亂。
劍橋哈佛大學(xué)的化學(xué)生物學(xué)家David Liu指出,大多數(shù)遺傳疾病需要基因校正而不是破壞。劉等人已經(jīng)開發(fā)出兩種有前途的方法來做到這一點。兩者都利用了CRISPR的精確定位,同時也限制了Cas9在該位點切割DNA的能力。第一種稱為堿基編輯,將催化受損形式的Cas9與一種酶結(jié)合,幫助一種核苷酸化學(xué)轉(zhuǎn)化為另一種核苷酸——例如,胞嘧啶轉(zhuǎn)化為胸腺嘧啶或腺嘌呤轉(zhuǎn)化為鳥嘌呤(Nature https://doi.org/hc2t; 2016)。但目前只能使用此方法訪問某些堿基的更改。Prime編輯是該團隊的新開發(fā),將Cas9與一種名為逆轉(zhuǎn)錄酶的酶聯(lián)系起來,并使用一種引導(dǎo)RNA,該RNA被修飾以包括對基因組序列的所需編輯(Nature 574, 464–465; 2019)。通過多階段生化過程,這些成分將引導(dǎo)RNA 復(fù)制到DNA中,最終取代目標(biāo)基因組序列。重要的是,堿基編輯和Prime編輯都只切割一條DNA鏈,這對細胞來說是一種更安全且破壞性更小的過程。
2016年首次報道以來,堿基編輯已經(jīng)進入臨床:由Liu創(chuàng)立并總部位于劍橋的Beam Therapeutics于11月獲得美國食品和藥物管理局FDA的批準(zhǔn),首次在人體中試驗這種方法,目的是修復(fù)導(dǎo)致鐮狀細胞病的基因。
Prime編輯還處于相對早期的階段,但該技術(shù)的改進不斷出現(xiàn),并且該方法的前景是明確的。首爾延世大學(xué)醫(yī)學(xué)院(Yonsei University College of Medicine)的基因組編輯專家 Hyongbum Henry Kim等人已經(jīng)證明,他們可以使用Prime編輯來糾正小鼠視網(wǎng)膜基因突變的效率高達16%。如果他們使用最近報道的更高級的版本,效率將會得到更大的提高。Liu的團隊發(fā)現(xiàn),主要機制可以幫助將基因大小的DNA序列插入基因組,從而為基因治療提供更安全、更嚴(yán)格控制的策略。Liu指出,這個過程效率相對較低,但有時即使是一點點修復(fù)也能起到很大的作用。在某些疾病中,眾所周知,如果你能以10%甚至1%的水平替換一個基因,你就可以挽救這種疾病。
▉ 5:靶向基因療法
基于核酸的藥物可能會在臨床上產(chǎn)生影響,但它們在可應(yīng)用的組織方面仍然受到很大限制。大多數(shù)基因療法需要對從患者身上采集細胞進行局部給藥或離體操作,然后回輸?shù)交颊唧w內(nèi)。一個突出的例外是負(fù)責(zé)過濾血液的肝臟。肝臟被證明是選擇性藥物輸送的強大目標(biāo),靜脈內(nèi)——甚至皮下——給藥可以就能實現(xiàn)肝臟的基因治療。
劍橋麻省理工學(xué)院 (Massachusetts Institute of Technology, MIT) 的化學(xué)工程師Daniel Anderson指出,對于基因治療,向任何組織輸送藥物都是很困難的。我們的身體被設(shè)計為使用我們擁有的遺傳信息,并不接受新的基因指令。但研究人員在開發(fā)策略方面取得了穩(wěn)步進展,這些策略可以幫助將這些藥物引導(dǎo)到特定的器官系統(tǒng),同時不影響其它非靶組織。
腺相關(guān)病毒是許多基因治療工作的首選載體,動物研究表明,仔細選擇合適的病毒與組織特異性基因啟動子相結(jié)合,可以實現(xiàn)有效的、器官受限的遞送。然而,病毒有時難以大規(guī)模生產(chǎn),并且會引發(fā)免疫反應(yīng),從而破壞療效或產(chǎn)生不良事件。
脂質(zhì)納米顆粒提供了一種非病毒替代品,過去幾年發(fā)表的幾項研究解釋了脂質(zhì)納米顆粒在靶向器官方面的潛力。例如,達拉斯德克薩斯大學(xué)西南醫(yī)學(xué)中心(University of Texas Southwestern Medical Center)的生物化學(xué)家 Daniel Siegwart 等人開發(fā)的選擇性器官靶向(selective organ targeting, SORT)方法能夠快速生成和篩選脂質(zhì)納米顆粒,以識別那些可以有效靶向組織(如肺或脾)中細胞的脂質(zhì)納米顆粒。荷蘭埃因霍溫科技大學(xué)(Eindhoven University of Technology)的生物醫(yī)學(xué)工程師Roy van der Meel表示,這是最早的論文之一,它表明,如果你對這些脂質(zhì)納米顆粒進行系統(tǒng)篩選并開始改變它們的組成,你可以控制顆粒在體內(nèi)的生物分布。Anderson指出,幾個小組也在探索細胞特異性抗體等蛋白質(zhì)成分如何幫助靶向過程。
Anderson對Beam Therapeutics和Intellia等公司在骨髓中靶向血液和免疫細胞前體的臨床前進展感到特別興奮,這兩家公司都使用專門設(shè)計的脂質(zhì)納米顆粒配方。他表示,成功靶向這些組織可以使患者免于當(dāng)前體外基因療法所涉及的艱苦過程,其中包括在移植前殺死現(xiàn)有骨髓的化學(xué)療法。Anderson認(rèn)為,在體內(nèi)做這些事情真的可以改變患者的治療。
單細胞組學(xué)發(fā)展的爆炸式增長意味著研究人員現(xiàn)在可以常規(guī)地從單個細胞中獲得遺傳、轉(zhuǎn)錄組、表觀遺傳和蛋白質(zhì)組學(xué)的見解——有時是同時進行的(go.nature.com/3nnhooo)。但是單細胞技術(shù)也通過將這些細胞從其原生環(huán)境中剝離出來而犧牲了關(guān)鍵信息。
2016年,由斯德哥爾摩KTH皇家理工學(xué)院(KTH Royal Institute of Technology)的Joakim Lundeberg領(lǐng)導(dǎo)的研究人員制定了一項戰(zhàn)略來克服這個問題。該團隊準(zhǔn)備了帶有條形碼的寡核苷酸(RNA或DNA的短鏈)的載玻片,可以從完整的組織切片中捕獲信使RNA,這樣每個轉(zhuǎn)錄本就可以根據(jù)其條形碼被分配到樣本中的特定位置。Lundeberg表示,沒有人真正相信他們可以從組織切片中進行轉(zhuǎn)錄組范圍的分析,但結(jié)果卻出奇的容易。
空間轉(zhuǎn)錄組學(xué)領(lǐng)域從此爆發(fā),F(xiàn)在有多種商業(yè)系統(tǒng)可供使用,包括10x Genomics的Visium空間基因表達平臺。該平臺建立在Lundeberg的技術(shù)之上。學(xué)術(shù)團體繼續(xù)開發(fā)創(chuàng)新方法,以不斷增加的深度和空間分辨率繪制基因表達圖譜。
現(xiàn)在,研究人員正在他們的空間地圖之上對 “組學(xué)見解”進行進一步分層。例如,康涅狄格州紐黑文耶魯大學(xué)(Yale University)的生物醫(yī)學(xué)工程師Rong Fan開發(fā)了一個名為 DBiT-seq的平臺。該平臺采用了一種微流體系統(tǒng),可以同時為數(shù)千個mRNA轉(zhuǎn)錄物和數(shù)百個用寡核苷酸標(biāo)記的抗體標(biāo)記的蛋白質(zhì)生成條形碼。與僅從轉(zhuǎn)錄組數(shù)據(jù)中獲得的數(shù)據(jù)相比,這可以更準(zhǔn)確地評估細胞基因表達如何影響蛋白質(zhì)的產(chǎn)生和活性,F(xiàn)an的團隊一直在使用它來研究免疫細胞激活等過程。他表示,他們看到皮膚中的免疫細胞如何對 Moderna COVID-19疫苗作出反應(yīng)的早期跡象。一些商業(yè)系統(tǒng)還可以從多種蛋白質(zhì)中獲取空間數(shù)據(jù),同時獲取轉(zhuǎn)錄組學(xué)見解,包括Visium平臺和Nanostring的GeoMx系統(tǒng)。
同時,Lundeberg的小組改進了其空間轉(zhuǎn)錄組學(xué)方法,以同時捕獲DNA序列數(shù)據(jù)。這使他的團隊能夠開始繪制腫瘤發(fā)生背后的時空事件。他們可以追蹤空間中的這些遺傳變化,了解它們?nèi)绾窝葑兂勺罱K導(dǎo)致腫瘤的其他遺傳變異。
Fan的團隊已經(jīng)展示了組織樣本中染色質(zhì)修飾的空間映射,這可以揭示影響發(fā)育、分化和細胞間通訊等過程的細胞基因調(diào)控景觀。Fan相信該方法可以與RNA,甚至蛋白質(zhì)的空間分析相結(jié)合。他們有初步數(shù)據(jù)表明這是完全可行的。
▉ 7:基于CRISPR的診斷
CRISPR-Cas系統(tǒng)精確切割特定核酸序列的能力源于其作為抵抗病毒感染的細菌“免疫系統(tǒng)”的作用。該鏈接激發(fā)了該技術(shù)的早期采用者考慮該系統(tǒng)對病毒診斷的適用性。麻省理工學(xué)院和哈佛大學(xué)布羅德研究所(Broad Institute)的遺傳學(xué)家Pardis Sabeti表示,將Cas用于天然的目的是很有意義的。自然界有數(shù)十億年的進化。”
但并非所有的Cas酶都是一樣的。Cas9是基于CRISPR的基因組操作的首選酶,但基于 CRISPR的診斷中的大部分工作都使用了稱為Cas13的RNA靶向分子家族,該家族于 2016年由布羅德研究所分子生物學(xué)家張鋒及其團隊首次發(fā)現(xiàn)。據(jù)加州大學(xué)伯克利分校(University of California, Berkeley)的 Jennifer Doudna 解釋,Cas13使用其RNA向?qū)ㄟ^堿基配對識別RNA靶標(biāo),并激活核糖核酸酶活性,可通過使用報告RNA將其用作診斷工具。Doudna與Emmanuelle Charpentier因開發(fā)CRISPR–Cas9的基因組編輯能力而獲得2020年諾貝爾化學(xué)獎,她現(xiàn)在在柏林的Max Planck病原體科學(xué)部門工作。這是因為Cas13不僅切割導(dǎo)向RNA靶向的RNA,還對附近的任何其他RNA分子進行“附帶切割”。許多基于Cas13的診斷方法使用一種報告RNA,該RNA將熒光標(biāo)簽連接到抑制熒光的猝滅劑分子上。當(dāng)Cas13在識別病毒RNA后被激活時,它會切割報告基因并從猝滅劑中釋放熒光標(biāo)簽,從而產(chǎn)生可檢測的信號。一些病毒留下了足夠強的特征,可以在不放大的情況下進行檢測,從而簡化了即時診斷。例如,去年1月,加利福尼亞州舊金山格萊斯頓病毒學(xué)研究所(Gladstone Institute of Virology)的Doudna和Melanie Ott 展示了一種基于鼻拭子的快速CRISPR-Cas13測試,用于使用手機無擴增檢測 SARS-CoV-2相機。
RNA擴增程序可以提高對微量病毒序列的敏感性,Sabeti等人開發(fā)了一種微流體系統(tǒng),該系統(tǒng)使用來自幾微升樣本的擴增遺傳物質(zhì)并行篩選多種病原體,F(xiàn)在,她們有一種檢測方法可以同時檢測21種病毒,每個樣本的成本不到10美元。Sabeti等人已經(jīng)開發(fā)出基于CRISPR的工具,可以同時檢測超過169種人類病毒。
Doudna指出,其他Cas酶可以充實診斷工具箱,包括Cas12蛋白,它們表現(xiàn)出與Cas13 相似的特性,但靶向DNA而不是RNA。總的來說,這些可以檢測更廣泛的病原體,甚至可以有效診斷其他非傳染性疾病。Doudna提醒,“如果你能相對快速地做到這一點,那將非常有用,特別是當(dāng)不同的癌癥亞型由特定類型的突變定義時,這也能很快確定癌癥的亞型。