2013年,好萊塢巨星因擔(dān)心家族遺傳的乳腺癌風(fēng)險(xiǎn)而去進(jìn)行基因檢測(cè),結(jié)果發(fā)現(xiàn)她攜帶了BRCA1基因突變,這一基因突變導(dǎo)致她患乳腺癌的風(fēng)險(xiǎn)為87%,患卵巢癌的風(fēng)險(xiǎn)為50%。為了避免自己像母親和外婆一樣在四五十歲的年紀(jì)遭受癌癥折磨,朱莉選擇了乳腺切除手術(shù),2015年,她又通過手術(shù)切除了卵巢和輸卵管。她認(rèn)為基因檢測(cè)挽救了自己的生命。
之所以能做出這樣的選擇,得益于基因測(cè)序這項(xiàng)重要技術(shù)。在了解基因測(cè)序技術(shù)之前,我們先要了解基因是什么。
基因與基因測(cè)序
早在1909年,丹麥遺傳學(xué)家 W. Johansen 正式提出“基因”(Gene)這一概念。1953年,詹姆斯·沃森和弗朗西斯·克里克提出了DNA的雙螺旋結(jié)構(gòu)。自此,人們開始認(rèn)識(shí)到了基因的本質(zhì)——具有遺傳效應(yīng)的DNA片段。這些DNA片段就像一段段代碼,記錄和儲(chǔ)存著生命的物種、種族、血型、孕育、生長(zhǎng)、凋亡等過程的全部信息。
小如細(xì)菌,大如藍(lán)鯨,高等如人類,都是由DNA組成的基因在代代相傳,它們構(gòu)成了生命的“遺傳密碼”。對(duì)于我們?nèi)祟惗?,我們?yōu)楹纬蔀槲ㄒ坏闹腔凵⑽覀兊纳砀?、膚色、發(fā)色、智力、各種遺傳疾病、癌癥風(fēng)險(xiǎn)、壽命等等,都與基因密切相關(guān)??偠灾?,生物體的生、長(zhǎng)、衰、病、老、死等一切生命現(xiàn)象都在很大程度上由基因決定。
為了揭開基因的秘密,上世紀(jì)90年代,在全世界科學(xué)家的推動(dòng)下,與“曼哈頓計(jì)劃”和“阿波羅計(jì)劃”齊名的“人類基因組計(jì)劃”正式啟動(dòng)。這一計(jì)劃希望對(duì)人類整個(gè)基因組的30億對(duì)DNA序列進(jìn)行基因測(cè)序,從而幫助我們更好地了解人類自身。
2001年,歷時(shí)十多年,花費(fèi)近30億美元資金后,人類基因組工作草圖發(fā)布,標(biāo)志著人類基因組計(jì)劃的成功,人類首次了解并掌握了自身的遺傳密碼。這不僅是一項(xiàng)偉大的科學(xué)工程,也為我們解碼生命、了解生命起源、生長(zhǎng)發(fā)育、認(rèn)識(shí)疾病、治療疾病、對(duì)抗衰老等奠定基礎(chǔ)。
然而,人類基因組計(jì)劃的成功僅僅是一個(gè)開始。我們從人類基因組圖譜中只發(fā)現(xiàn)了20000多個(gè)編碼蛋白質(zhì)的基因,這些基因只占據(jù)人類基因組的不到3%,其余的絕大多數(shù)是不編碼蛋白質(zhì)的非編碼序列,這些序列仍然隱于黑暗,等待著科學(xué)家們的探索。
基因測(cè)序還有哪些難點(diǎn)?
基因測(cè)序,一開始成本非常之高,20多年前,人類基因組計(jì)劃耗資近30億美元,才完成了對(duì)人類大部分基因序列的測(cè)序,這種高昂的成本顯然不是常規(guī)科研所能承受的,就更別說消費(fèi)級(jí)的基因測(cè)序了。隨著測(cè)序技術(shù)的進(jìn)步,基因測(cè)序成本得到了快速下降,如今完成一個(gè)人的全部基因組測(cè)序的成本已經(jīng)降到了1000美元以下。
然而,無論是對(duì)于科研來說,還是對(duì)于消費(fèi)級(jí)基因測(cè)序而言,基因測(cè)序過程中產(chǎn)生的數(shù)據(jù)規(guī)模很大(個(gè)人基因組原始數(shù)據(jù)可達(dá)1TB ,百萬人群基因組計(jì)劃涉及EB級(jí)的數(shù)據(jù)處理),對(duì)算力要求高。測(cè)序分析流程復(fù)雜,自動(dòng)化程度低,需要耗費(fèi)大量人力、時(shí)間重復(fù)開發(fā)流程,導(dǎo)致效率較低。這些難點(diǎn)阻礙了基因測(cè)序成本的進(jìn)一步下降,也阻礙了科研和消費(fèi)級(jí)基因測(cè)序的應(yīng)用普及。
華為云AI基因平臺(tái),一站式助力基因分析工作
1、EIHealth AI基因平臺(tái)的助力
基于華為云AI和大數(shù)據(jù)優(yōu)勢(shì),華為云推出了醫(yī)療智能體(EIHealth),為基因組分析、藥物研發(fā)、臨床研究三個(gè)領(lǐng)域提供專業(yè)AI研發(fā)平臺(tái)。其中,華為云EIHealth AI基因平臺(tái)能夠提供高性能、高可靠性、高性價(jià)比的基因測(cè)序計(jì)算、存儲(chǔ)、分析及AI建模能力,幫助加快基因測(cè)序速度、提高效率、降低成本。
具體來說,在大規(guī)模生產(chǎn)場(chǎng)景中,AI基因平臺(tái)可以支持EB級(jí)別存儲(chǔ),不受硬盤限制,滿足海量數(shù)據(jù)的存儲(chǔ),并通過批量自動(dòng)化作業(yè),節(jié)約人力成本,從而幫助資源成本降低30%。
當(dāng)業(yè)務(wù)存在潮汐屬性時(shí),AI基因平臺(tái)可以實(shí)現(xiàn)資源彈性擴(kuò)縮容,業(yè)務(wù)集中在1/3時(shí)間內(nèi),能夠幫助節(jié)省超40%成本。
面對(duì)組織協(xié)作場(chǎng)景,AI基因平臺(tái)能夠?qū)崿F(xiàn)組織內(nèi)資源共享,減少重復(fù)開發(fā),將人員協(xié)作效率提升30%,將人力開發(fā)成本降低50%,資產(chǎn)復(fù)用效率提升100%。
同時(shí),AI基因平臺(tái)還具備AI能力。生物醫(yī)藥領(lǐng)域?qū)<乙话鉇I算法能力相對(duì)薄弱,采用的大多是傳統(tǒng)的統(tǒng)計(jì)學(xué)算法。華為云AI基因平臺(tái)能夠通過獨(dú)有的AutoGenome算法,對(duì)基因組數(shù)據(jù)進(jìn)行自動(dòng)AI建模、分析和解譯,幫助自動(dòng)化尋找參數(shù),并自動(dòng)化地針對(duì)模型做可解釋性研究。用戶只需配置5行代碼,就能構(gòu)建高精度的AI基因模型,覆蓋單組學(xué)、多組學(xué)和基因作用網(wǎng)絡(luò)。在性能方面,針對(duì)基因組的建模性能普遍能夠提升10%,并且能夠找到生物標(biāo)記物。這對(duì)生物醫(yī)藥客戶而言非常重要,代表著模型不僅準(zhǔn)確,還能夠知道為什么準(zhǔn)確,以及后續(xù)只要查看這個(gè)生物標(biāo)記物,就知道病人應(yīng)該吃什么藥、做什么檢查。
值得一提的是,在完成基因測(cè)序后,由于數(shù)據(jù)量大,分析結(jié)果的交付方式往往是郵寄移動(dòng)硬盤,這導(dǎo)致結(jié)果交付周期長(zhǎng)、成本高。而AI基因平臺(tái)可開通子賬號(hào)給客戶,客戶直接登陸后下載,節(jié)約了硬盤成本以及郵寄成本,縮短了交付周期。
2、案例分享
在國(guó)外,華為云支撐了“百萬人群基因組計(jì)劃”,單日分析數(shù)據(jù)超過1PB,相比于傳統(tǒng)的HPC(高性能計(jì)算)方案提速10倍以上,與此同時(shí),還實(shí)現(xiàn)了成本降低30%。
在國(guó)內(nèi),北京協(xié)和醫(yī)院臨床研究人員基于EIHealth平臺(tái)發(fā)現(xiàn)了肺癌藥效標(biāo)記物,為mEGFR肺腺癌患者的臨床反應(yīng)分類提供了新的視角,并揭示了非侵入性預(yù)處理血清代謝物在預(yù)測(cè)EGFR-TKI療效方面的潛力。該研究發(fā)表于 American Journal of Cancer Research 期刊。
3、探索非編碼序列
我們前面提到,人類基因組中只有20000多個(gè)編碼蛋白質(zhì)的基因,而到目前位置,幾乎所有的藥物都是針對(duì)這20000多種蛋白質(zhì)中的700多種與疾病相關(guān)的蛋白質(zhì)。這顯然是太少了,也導(dǎo)致了許多疾病無藥可醫(yī)。而人類基因組中超過97%的DNA序列是非編碼的,它們是藥物靶點(diǎn)發(fā)現(xiàn)的藍(lán)海,對(duì)這些非編碼序列進(jìn)行基因測(cè)序和分析,有助于我們重繪了人類基因組格局,并極大地?cái)U(kuò)展?jié)撛谥委煱悬c(diǎn)數(shù)量。
AI在醫(yī)療領(lǐng)域還能做什么
2016年,谷歌發(fā)布了首個(gè)AI醫(yī)療算法,能夠通過AI從視網(wǎng)膜眼底照片中檢測(cè)糖尿病性視網(wǎng)膜病變,特異性和靈敏度堪比專業(yè)眼科醫(yī)生。拉開了AI+醫(yī)療的序幕。此后,基于人工智能(AI)的病理診斷、輔助治療產(chǎn)品整體呈現(xiàn)出蓬勃發(fā)展的態(tài)勢(shì)。此外,AI制藥、AI蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等領(lǐng)域同樣突飛猛進(jìn),AI正在以前所未有的速度和效率改變整個(gè)生物醫(yī)藥領(lǐng)域。
華為云助力超級(jí)抗菌藥的發(fā)現(xiàn)
2022年2月,西安交通大學(xué)第一附屬醫(yī)院劉冰教授團(tuán)隊(duì)學(xué)習(xí)噬菌體與細(xì)菌結(jié)合的機(jī)制,采用基于華為云盤古藥物分子大模型打造的AI輔助藥物設(shè)計(jì)服務(wù),突破性地研發(fā)出超級(jí)抗菌藥 Drug X,打破醫(yī)藥界的“雙十定律”。Drug X有望成為全球近40年來首個(gè)新靶點(diǎn)、新類別的抗生素。劉冰教授表示,華為云盤古藥物分子大模型讓先導(dǎo)化合物的研發(fā)周期從數(shù)年縮短至一個(gè)月,而且研發(fā)成本降低了70%。
呼吸慢病+AI,提升質(zhì)控精度和判別精度
呼吸慢病是中國(guó)范圍內(nèi)僅次于高血壓、糖尿病的第三大常見慢性病。患者基數(shù)大,各級(jí)醫(yī)院對(duì)肺功能檢查應(yīng)用及質(zhì)量保證的能力參差不齊,基層醫(yī)院尤甚。為提升基層呼吸慢病篩查管理能力,華為云EI創(chuàng)新孵化Lab與廣醫(yī)一院國(guó)家呼吸中心、易優(yōu)聯(lián)、賽客等伙伴聯(lián)合開發(fā)了肺功能大數(shù)據(jù)和AI輔助系統(tǒng)。根據(jù)大規(guī)模測(cè)試結(jié)果,華為云AI助力呼吸慢病檢測(cè)的質(zhì)控精度和判別精度穩(wěn)步提升,最高由50%提升至90%,高于90家醫(yī)院被調(diào)研醫(yī)生的平均水平。
心腦血管疾病AI輔診,各領(lǐng)域持續(xù)突破
腦動(dòng)脈瘤位居腦血管疾病病因中的Top3,堪稱“沉默又致命的殺手”。針對(duì)動(dòng)脈瘤輔診難題,華為云EI創(chuàng)新孵化Lab聯(lián)合華中科技大學(xué)電信學(xué)院、華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬協(xié)和醫(yī)院放射科,運(yùn)用華為云AI開發(fā)生產(chǎn)線ModelArts開發(fā)平臺(tái)開發(fā)了一套基于CTA影像的全自動(dòng)化、高度敏感的腦動(dòng)脈瘤檢測(cè)算法,靈敏度高達(dá)97.5%,幫助醫(yī)生臨床診斷靈敏度提升約10個(gè)百分點(diǎn),漏診率降低5個(gè)百分點(diǎn),同時(shí)有效縮短醫(yī)生診斷時(shí)間。
AI輔助宮頸癌篩查模型,促進(jìn)早篩早治
在宮頸癌篩查領(lǐng)域,華為云AI團(tuán)隊(duì)與金域醫(yī)學(xué)病理專家團(tuán)隊(duì)合作,基于病理形態(tài)學(xué),通過深度學(xué)習(xí)技術(shù),訓(xùn)練出精準(zhǔn)、高效的AI輔助宮頸癌篩查模型。該模型在排陰率高于60%的基礎(chǔ)上,陰性片判讀的正確率高于99%,陽(yáng)性病變的檢出率超過99.9%。同時(shí),每例病理判讀僅需36秒,判讀速度是人工判讀的10倍。
AI輔助宮頸癌篩查的方法在醫(yī)療資源匱乏的地區(qū)具有特殊價(jià)值,將可以大幅提升宮頸癌篩查服務(wù)覆蓋的人群范圍與服務(wù)頻率,促進(jìn)宮頸癌早篩早治。
AI+生命科學(xué)的無限可能
近年來,DeepMind開發(fā)的人工智能程序AlphaFold實(shí)現(xiàn)了對(duì)蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確預(yù)測(cè),讓全世界看到了人工智能在生命科學(xué)中的強(qiáng)大潛力。如今,AlphaFold2、Meta AI預(yù)測(cè)了地球上幾乎所有的、數(shù)以億計(jì)的蛋白質(zhì)結(jié)構(gòu);而華盛頓大學(xué)David Baker團(tuán)隊(duì)開發(fā)的RoseTTAFold能夠通過AI來構(gòu)想和設(shè)計(jì)蛋白質(zhì)。
基于AI和大數(shù)據(jù)打造的華為云AI基因平臺(tái),能夠提供高性能、高可靠性、高性價(jià)比的基因測(cè)序計(jì)算、存儲(chǔ)、分析和AI能力支持,讓科研過程標(biāo)準(zhǔn)化、可執(zhí)行,從而幫助加快基因測(cè)序速度、提高效率、降低成本;此外,華為云平臺(tái)還能夠幫助藥企更快速高效地完成藥物研發(fā),節(jié)約研發(fā)成本;還能幫助臨床研究,提供醫(yī)療臨床數(shù)據(jù)AI分析模型、病人分群標(biāo)記物發(fā)現(xiàn)服務(wù)、藥物療效預(yù)測(cè)服務(wù)、醫(yī)療影像大數(shù)據(jù)智能標(biāo)注和AI輔助診斷。
AI正在推動(dòng)生命科學(xué)以前所未有的速度快速發(fā)展,AI病理影像、AI疾病篩查、AI制藥、AI基因分析、AI醫(yī)療機(jī)器人、AI蛋白結(jié)構(gòu)預(yù)測(cè)與設(shè)計(jì),都是前進(jìn)路上的一個(gè)個(gè)里程碑,AI和生命科學(xué)的結(jié)合,還有更多的驚喜等待著我們。
華為云將通過AI for Healthcare,持續(xù)為人類疾病防御、診斷治療、藥物研發(fā)等貢獻(xiàn)力量。