生物技術公司Codex Genetics 透過人工智能(AI)分析基因圖譜及臨床數據,協助醫生、診所和大學診斷神經系統疾病和癌症,為病人找出罕見病的病因。面對海量數據的傳輸及分析難題,Codex Genetics 將數據庫從本地機房遷移到與雲端混合使用,並透過各種AWS 數據服務來降低成本,同時提高系統的穩定性。
4 小時內完成診斷 每名病人數據超過100GB
Codex Genetics公司首席技術官Allen Yu表示,公司透過自家研發的生物訊息分析系統,整合不同研究結果及數據來分析病人的情況。「除了分析病人的基因圖譜,還需要整合臨床及病歷等數據,才能為病人找出最合適治療方案。」
他表示,由於所需收集的資料非常廣泛,每名病人儲存的數據動輒高達100GB ,以致系統的負荷量非常高。此外,疫情期間病人未必能按時提供測試樣本,令數據流量變得非常不穩定,對系統的需求有機會突然激增(Burst computing),故需要合適的基建來配合。
為解決數據傳輸、分析等問題,現時Codex Genetics已將數據庫從本地機房遷移到與雲端混合使用,將散落的數據統一在Amazon S3 的數據湖上儲存及進行備份,並透過其他數據服務包括 AWS Glue 和 Amazon Athena 來進行大數據分析,可以輕鬆整合數百TB的資料之餘,同時達到「幾秒鐘內」完成數據查詢的目標。
雲端按量收費降成本
此外,AWS雲端按量收費並可以彈性擴容,讓公司預算更靈活,同時降低成本。混合模式下,公司可以減低對本地機房的使用需求,尤其當數據流量變得非常不穩定時,便無需如以往般透過預計流量來「買機」。
Allen續說,目前本地公眾對於個人數據的私隱度關注愈來愈高,通過使用AWS的雲端服務,公司能夠儲存和傳輸受保護的健康信息和數據,同時符合合規和數據安全的要求。