隨著高通量生物技術(shù)的不斷發(fā)展,多種類型的生物組學(xué)數(shù)據(jù)大量產(chǎn)生,為徹底理解生命分子機理提供了前所未有的新契機。然而,如何有效集成分析這些組學(xué)數(shù)據(jù)破解生命秘密成為擺在生物學(xué)家、醫(yī)學(xué)家以及信息科學(xué)家面前的一道難題。
最近,中國科學(xué)院合肥物質(zhì)科學(xué)研究院智能機械研究所機器智能與計算生物學(xué)實驗室王紅強課題組開發(fā)出一種高通量數(shù)據(jù)meta分析方法。該方法巧妙地將聯(lián)合矩陣分解技術(shù)與基因調(diào)控模型相結(jié)合,有效揭示了生命分子活動在不同遺傳分子水平上的系統(tǒng)一致性,為深入探索生命活動規(guī)律提供了新的手段和途徑。大量的模擬實驗證實,該技術(shù)對腫瘤標(biāo)記物的識別性能遠(yuǎn)遠(yuǎn)優(yōu)于現(xiàn)有方法。研究結(jié)果也證實影響高通量meta分析的主要因素為數(shù)據(jù)依賴性和異質(zhì)性。這兩種因素將現(xiàn)有分析方法分為了三組,其性能從高到低具有顯著的區(qū)別(如圖)。結(jié)合非小細(xì)胞肺癌(NSCLC)的多組學(xué)數(shù)據(jù),所提出的方法識別出了多種已知的甲基化驅(qū)動致癌基因,也發(fā)現(xiàn)了許多新的NSCLC標(biāo)記物。這些新的標(biāo)記物可用于開發(fā)新的NSCLC甲基化藥物。
該成果發(fā)表在英國牛津大學(xué)出版集團的Bioinformatics 雜志最新一期上。在文章的評審過程中,兩位審稿人都給了該工作以較高的評價:“方法的有用性和穩(wěn)定性令人印象深刻”,“我認(rèn)為這是一項非常有用的工作成果”。
該技術(shù)具有較強的通用性,在醫(yī)學(xué)、農(nóng)業(yè)以及細(xì)胞輻射機理研究都有廣闊的應(yīng)用前景。智能所機器智能與計算生物學(xué)實驗室主要從事機器學(xué)習(xí)與智能算法及其在生物信息學(xué)方面的研究。近年來在生物信息學(xué)領(lǐng)域取得多項成果,主要發(fā)表在PLOS one、Bioinformatics 等國際雜志上。
合肥研究院開發(fā)出基于高通量組學(xué)數(shù)據(jù)的腫瘤分子標(biāo)記物識別方法
