中國科學院計算機網(wǎng)絡信息中心科學數(shù)據(jù)中心通過需求牽引在云計算及大數(shù)據(jù)分析的關鍵技術研發(fā)及服務創(chuàng)新上取得系列成果。
在云服務平臺方面,網(wǎng)絡中心科學數(shù)據(jù)中心云計算團隊以滿足用戶的需求和云平臺的穩(wěn)定性、可靠性為目標進行關鍵技術的研發(fā),共申請國家發(fā)明專利3項;其中“一種集群系統(tǒng)應用軟件快速部署方法”的專利在2014年9月17日獲得授權(已應用于云計算平臺ECCP,實現(xiàn)操作系統(tǒng)和相關應用20分鐘內在120個結點的快速部署),其他2項發(fā)明專利正在實質審查階段。
在大數(shù)據(jù)分析方面,科學數(shù)據(jù)中心大數(shù)據(jù)分析與處理團隊連續(xù)在國際數(shù)據(jù)挖掘著名會議發(fā)表多篇論文,相關成果也支持學科領域的科研人員在學術期刊Nature Communications 和Lancet 發(fā)表論文,服務于科研創(chuàng)新。
蘭金松、黎建輝等基于出租車產生的海量軌跡時空數(shù)據(jù),對城市交通異常事件的檢測算法進行了深入的研究。把熱量傳播模型(Heat Diffusion Model)引入到交通異常擴散的研究領域,以模型來描述異常擴散的現(xiàn)象,提出異常源發(fā)現(xiàn)算法;并在真實的數(shù)據(jù)上進行實驗,驗證了算法的準確性和高效性;相關成果發(fā)表在國際數(shù)據(jù)挖掘一流會議SDM 2014上。
隨著開源項目的興起,如何定位軟件工件(software artifact)是軟件工程領域的重要研究方向之一。傳統(tǒng)軟件工件的檢索是基于文本查詢的方式,鄔亮、熊輝、周園春等在對大量開源代碼分析的基礎上,抽取出代碼在程序之間的結構特點等相關屬性,并提出屬性之間的距離的度量算法,最后在大量的開源代碼進行測試,驗證了算法的有效性,相關成果已被國際數(shù)據(jù)挖掘著名會議ICDM 2014接收為regular paper(錄用率為9.7%)。
H7N9最近兩年在中國的爆發(fā),是近年來中國較大影響的公共衛(wèi)生事件。患者的時空分布,活禽市場與病例爆發(fā)的之間的關聯(lián)。是關系到流行病急需要回答的問題。郭旦懷等支持中國CDC和國際流行病學專家為此做出定量的回答,為H7N9的迅速控制與政府決策提供了依據(jù),相關成果發(fā)表于醫(yī)學期刊Lancet(http://www.sciencedirect.com/science/article/pii/S0140673613619042)和Nature communication(http://www.nature.com/ncomms/2014/140617/ncomms5116/full/ncomms5116.html)等刊物。
狂犬病是一種人犬共患的高度致死性流行病,中國是世界第二大狂犬病受害國,郭旦懷、周園春、黎建輝等人運用數(shù)據(jù)挖掘的方法重新定義了狂犬病的時空聚集,提出了為更高效地進行狂犬病防控修改原來的防控標準的建議,相關成果發(fā)表在Plos One等期刊(http://www.plosone.org/article/info:doi/10.1371/journal.pone.0072352)上。
在大數(shù)據(jù)時代,空間數(shù)據(jù)的傳輸效率是許多應用的制約瓶頸,空間數(shù)據(jù)的壓縮引起了極大的關注,郭旦懷等積極組織參加ACM GIS CUP 2014中的空間數(shù)據(jù)的壓縮競賽,與來自十多個國家的同行同臺競技,最終脫穎而出,初次參賽取得了第二名的好成績。
