全球時訊:科學家開發基于深度學習的預測模型,有望在基因療法等領域獲得應用
2022-04-30 05:06:41 來源:DeepTech深科技
(資料圖片)
“人工智能和基因編輯是當下兩個比較熱門的研究領域,而我們這項研究正是這兩者之間的有效結合。在我看來,生物學與人工智能的結合是一個非常有發展潛力的方向。我們的研究只是一個開始,相信今后一定會有更多優秀的成果誕生。”美國國家兒童醫院和喬治·華盛頓大學助理教授表示。 圖丨李煒(來源:) 據介紹,作為原核生物的一種保護機制,規律間隔成簇短回文重復序列和其關聯(Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR-associated,CRISPR/Cas)系統能夠有效地抵抗外來遺傳物質的入侵。基于其開發出的基因編輯技術,近年來也在基因治療、生物醫學等領域應用廣泛。 在這些基因編輯技術中,用于 DNA 編輯的 CRISPR-Cas9 較為常見,而 CRISPR-Cas13(包括 Cas13a、Cas13b、Cas13c、Cas13d 等),則屬于專門靶向單鏈 RNA 的系統。 在應用 CRISPR-Cas13d 的過程中,相關領域內的科研人員們發現了一個重要問題,即如何才能準確地預測 CRISPR-Cas13d 導向依賴的靶內(on-target)和靶外 (off-target) 效應。 為了解決該問題,課題組與中國東北大學的教授課題組合作,進行了 CRISPR-Cas13d 的高通量篩選,并設計了一個名為“DeepCas13”的深度學習模型,用于預測 CRISPR-Cas13d 的靶向活性。 簡單來說,該研究攻克了 Cas13d 這種基因編輯工具的“導航”問題,也就是如何設計特定的向導 RNA(single guide RNA,sgRNA),使其能夠幫助核酸酶找到指定靶標 RNA 的位置。 “我們針對多個靶標 RNA,先設計了大量的 sgRNA,相當于為 CRISPR-Cas13d 系統設計了許多條前往終點的道路,再通過高通量的篩選體系評價每條道路的效果,繼而通過機器學習模型,高效精準地總結出達到目標位置的合適路徑的規律,即找出 sgRNA 的合理設計原則。”表示。 圖丨費騰(來源:) 實驗結果顯示,DeepCas13 模型的性能優于現有的其他同類工具和傳統的機器學習方法,并在環狀 RNA、長鏈非編碼 RNA 等非編碼 RNA 導向的預測上表現出良好的性能。 除此之外,該團隊還對 CRISPR-Cas13d 的靶外效應進行了系統評估,發現決定靶外效應的特征,與靶內效率相關的特征非常相似。 目前,該模型已經能夠通過相關網站(//deepcas13.weililab.org/)進行免費訪問。 圖丨 DeepCas13 與最先進工具的性能比較(來源:Nature Communications) 2023 年 2 月 10 日,相關論文以《使用機器學習方法建模 CRISPR-Cas13d 靶內和靶外效應》()為題在 Nature Communications 上發表 [1]。 圖丨相關論文(來源:Nature Communications)
喬治·華盛頓大學博士后研究員程孝龍和中國東北大學李澤旭博士為該論文的共同第一作者,和教授為論文的共同通訊作者。 據介紹,這項研究是兩個課題組的深度合作。“老師實驗室負責生成很多高通量篩選的數據,我們會基于這些數據構建深度神經網絡模型,再將模型預測的結果交由他們進行實驗驗證。”說。 在研究過程中,他們遇到了包括計算和實驗在內的諸多困難,也面臨與其他研究團隊在同一時期開展相似研究的情況。“這對我們來說是一個比較緊張的信號,如果我們不能加快速度,論文有可能會被同行搶先發表。幸運的是,在兩個課題組和其他合作者的通力合作下,論文最終得以成功發表。”說。 圖丨預測靶向非編碼 sgRNA 的 sgRNA 活性(來源:Nature Communications) 在人的細胞里,RNA 系統比 DNA 系統要復雜得多,且很多疾病都與 RNA 相關。因此,DeepCas13 的出現,給基礎研究和臨床提供了一種全新的預測工具。其不僅可以用于研究一系列科學問題,還有望在未來直接通過靶向 RNA 的方式治療諸多人類疾病。 “我覺得未來 5 至 10 年應該是基因療法的黃金時期。作為一種有效的預測方法,DeepCas13 能夠幫助科學家設計基于 CRISPR-Cas13 的高效的基因療法系統。”表示。 圖丨 DeepCas13 能夠有效預測 Cas13d 靶向活性(來源:Nature Communications) 未來,該團隊希望能夠生成更多的數據,不斷地提高深度學習模型的預測效率和準確性。 由于該模型主要基于深度學習的卷積神經網絡和遞歸神經網絡構建,因此他們還想嘗試采用一些更新的架構,比如 Transformer 模型,在不斷迭代中提升 DeepCas13 的性能。同時,他們也將致力于推動該模型在動物實驗或臨床實驗上的應用。 此外,目前 DeepCas13 僅適用于 CRISPR-Cas13d 系統,接下來他們計劃將該研究拓展至整個 RNA 編輯領域,以形成更加完整全面的工具包。 “我們不僅聚焦 RNA 編輯,對其它的一些工具也非常感興趣。所以我們還想順著這個研究思路繼續前進,為基因編輯領域的工具優化提供更多潛在的解決方案。”表示。 參考資料: 1. Cheng, X., Li, Z., Shan, R. et al. Modeling CRISPR-Cas13d on-target and off-target effects using machine learning approaches. Nature Communications14, 752 (2023). //doi.org/10.1038/s41467-023-36316-3 排版:朵克斯
關鍵詞:
責任編輯:Rex_30