亚洲国产一区二区三区在线播放|国产豆花视频在线观看|亚洲精品一区二区三区香|中文字幕97,av电影天堂在线观看,韩AV无码中文无码不卡电影,欧美久久a

中科院天津工業(yè)生物所通過信息整合獲得更可靠的基因組注釋

    不同來源的數(shù)據(jù)信息的比較整合是提高數(shù)據(jù)質(zhì)量,獲得對(duì)特定生物更準(zhǔn)確認(rèn)識(shí)進(jìn)而進(jìn)行設(shè)計(jì)改造的常用方法。目前已有多種基于web的基因組注釋服務(wù)(如RAST, JCVI, IMG, IGS等),通過這些服務(wù)提交序列信息即可得到基因注釋結(jié)果,但不同服務(wù)得到的結(jié)果往往有較大不同,因此對(duì)不同來源的基因注釋信息進(jìn)行數(shù)據(jù)比對(duì)整合對(duì)得到可靠的注釋結(jié)果非常重要。但由于很多注釋信息并不標(biāo)準(zhǔn)化,這個(gè)比較整合的過程常常需要費(fèi)時(shí)的人工檢驗(yàn)核對(duì)。

  近日,中科院天津工業(yè)生物技術(shù)研究所研究員馬紅武和英國(guó)愛丁堡大學(xué)合作提出了一種通過對(duì)不同來源的基因組注釋數(shù)據(jù)整合得到更準(zhǔn)確可靠的注釋結(jié)果的半自動(dòng)化方法。研究組對(duì)由四種基因組注釋服務(wù)(RAST, JCVI, IMG, IGS)得到的注釋結(jié)果進(jìn)行了比較分析。首先,通過程序?qū)τ酶鞣NID(如EC號(hào),COG ID,Pfam ID等)表示的功能進(jìn)行比較,然后重點(diǎn)通過借鑒計(jì)算機(jī)科學(xué)領(lǐng)域中自然語(yǔ)言處理的方法解決了對(duì)基因功能描述的文本直接進(jìn)行比較的問題。這使得87%的基因功能注釋都可以通過程序自動(dòng)比較,僅僅13%需要費(fèi)時(shí)的手動(dòng)比較。在此基礎(chǔ)上,研究組又引入了一個(gè)多數(shù)規(guī)則來確定正確的基因功能注釋,從而得到整合多種來源數(shù)據(jù)的更可靠的一致化的注釋結(jié)果。將該方法應(yīng)用于6種不同生物的基因組注釋的結(jié)果充分證明了該方法的有效性。

    相關(guān)研究成果發(fā)表于BMC Bioinformatics 期刊上。