2019-10-28
從IT到DT,中科曙光支撐生命
北京2019年12月2日 /美通社/ -- 生命科學是通過分子遺傳學為主,研究生命活動規律,從而達到治療診斷遺傳病、提高農作物產量、保護環境等目的。生命科學的數據來源和形式多樣,包括基因測序、分子通道、不同的人群等。技術的提升引領了IT到DT(數據時代)的變革,基于基因組數據量越來越多的情況下,生命科學大數據的發展前景將更加廣闊。利用信息技術將數據轉換成更好理解的基礎生命科學機制,其分析結果將給人類帶來更多福音。
計算和存儲是大數據研究中不可或缺的重要技術和支撐,生命科學大數據的研究也不例外。中國科學院上海生命科學研究院(以下簡稱:生科院),是國家級生命科學研究平臺,整體實力和技術水平處于國內領先。它的領先除了生物技術之外,信息技術也扮演者重要的角色。在本次項目中,由曙光為生科院建設生物醫學大數據信息系統基礎平臺(以下簡稱:生物醫學大數據平臺)。平臺建成后將面向生命科學研究、生物醫藥研發、臨床醫學研究與應用,推動生物醫藥技術企業創新發展,支撐數據密集型科學研究和生物信息共享。
安全穩定存儲系統,滿足生物醫學用戶需求:
生物醫學數據的主要類型為文本文件、圖像文件、二進制文件等非結構化數據,對存儲的要求主要在存儲容量的大小和大文件讀寫通量的高低,此外少量的關鍵數據庫、索引等結構化數據,則對存儲的IOPS和穩定讀寫能力要求較高。
未來,生物醫學大數據平臺將成為面向生物醫學大數據開放研究平臺,面向世界的國際數據交流接口和合作研究基地,海量生物醫學大數據資源的匯聚、管理和共享,數據的安全性至關重要。
兩地三中心架構,打造高可用生物醫學大數據平臺:
生物醫學大數據平臺基礎設施由三個中心組成,分別為張江中心、岳陽路中心和貴州中心,每個中心都需要承載相關的業務系統。三個中心通過科技網鏈路相互連通,通過同城雙活、異地容災的兩地三中心架構,滿足生物醫學大數據平臺業務高可用和高穩定性。