3月25日,《江蘇科技報》A5要聞版《云創(chuàng)大數(shù)據(jù):人工智能助力疫情預(yù)測研究》,對云創(chuàng)大數(shù)據(jù)參與鐘南山技術(shù)團隊,與多家醫(yī)科院校、醫(yī)療企業(yè)開展合作,對新冠肺炎疫情走勢進行科學(xué)預(yù)測進行了報道,并對預(yù)測方法、合作細節(jié),以及研究成果等進行了介紹。
自新冠肺炎爆發(fā)以來,為實現(xiàn)科學(xué)防治,打贏新冠肺炎疫情防控阻擊戰(zhàn)。在廣州醫(yī)科大學(xué)附屬第一醫(yī)院廣州呼吸健康研究院鐘南山院士、何建行院長、楊子峰教授領(lǐng)導(dǎo)下,橫琴鯨準智慧醫(yī)療科技有限公司、南京云創(chuàng)大數(shù)據(jù)科技股份有限公司、星環(huán)信息科技(上海)有限公司、澳門科技大學(xué)、昆明理工大學(xué)、香港大學(xué)公共衛(wèi)生學(xué)院,對新冠肺炎疫情進行了全面預(yù)測研究。
鐘南山院士技術(shù)團隊先后借助改進的SEIR模型和人工智能技術(shù)建立了新冠肺炎疫情預(yù)測模型,通過長期的觀察發(fā)現(xiàn),疫情實際走勢與其做出的預(yù)測十分吻合,為此受到社會各界的廣泛認可。
迅速建立疫情預(yù)測模型
2月6日,鐘南山院士技術(shù)團隊便開始迅速收集數(shù)據(jù)進行初步研究分析,并對新型冠狀病毒進行預(yù)測研究。大家對研究投入了全部的精力,功夫不負有心人,經(jīng)過連夜奮戰(zhàn),短短幾天就取得了初步成果。
由于新冠肺炎疫情具有未知性、突發(fā)性、高風(fēng)險和快蔓延等特點,同時疊加春運高峰期間學(xué)生放假、企業(yè)員工回家過年等人員跨地域頻繁流動等因素,給疫情防控提出了嚴重挑戰(zhàn)??紤]到以上因素,為科學(xué)預(yù)測疫情發(fā)展走勢,鐘南山院士技術(shù)團隊先后對疫情的流行趨勢做出了兩版預(yù)測。
第一版預(yù)測:以1月11日到2月12日的數(shù)據(jù)作為輸入數(shù)據(jù),根據(jù)改進的SEIR模型進行預(yù)測
鐘南山院士技術(shù)團隊第一版預(yù)測以1月11日到2月12日的數(shù)據(jù)作為輸入數(shù)據(jù)進行研究,并根據(jù)改進的SEIR模型進行預(yù)測。結(jié)論顯示,新冠病毒疫情全國在2月下旬達到高峰,4月底趨于平緩。如管控措施推遲5天實施,中國大陸的疫情規(guī)模預(yù)估將擴大至3倍;如降低武漢管控力度,湖北可能在3月中旬出現(xiàn)第二次疫情高峰并延續(xù)至4月下旬。
圖1 改進的SEIR模型預(yù)測曲線
(A)湖北省有嚴格管控,(B)湖北省減少管控力度,(C)廣東省,(D)浙江省和(E)中國在1月23日(藍色),5天后(灰色)和5天前(紅色)采取干預(yù)措施時的流行曲線,把每天現(xiàn)存確診病例的實際數(shù)據(jù)被擬合到曲線(圓圈)上
3月初,闡述以上預(yù)測內(nèi)容的論文《基于SEIR優(yōu)化模型和AI對公共衛(wèi)生干預(yù)下的中國COVID-19暴發(fā)趨勢預(yù)測》在《Journal of Thoracic Disease》(《胸部疾病雜志》)上正式發(fā)表。該文章提出了基于大數(shù)據(jù)的改進SEIR預(yù)測模型,并提出了數(shù)據(jù)受限條件下的人工智能LSTM預(yù)測方法。
2月下旬,鐘南山院士接受央視4套《今日亞洲》欄目采訪透露,“根據(jù)我們團隊在傳統(tǒng)模型基礎(chǔ)上加上兩個影響因素,國家強力干預(yù)和春節(jié)后回程高峰消除后,預(yù)測高峰應(yīng)該在2月中接近2月底。到了2月15日,數(shù)字果然下來了。我們有信心,四月底基本控制?!?/span>
圖2 央視播放鐘南山院士接受采訪
2月27日,廣州市人民政府新聞辦公室舉辦了新冠肺炎疫情防控專場新聞通氣會,鐘南山院士引用了以上結(jié)論。當時,鐘南山院士還表示,“疫情開始時,國外就有流行病學(xué)家用權(quán)威的試驗?zāi)P?,預(yù)測2月初,中國感染新冠肺炎人數(shù)將達16萬人。這是沒有考慮到中國政府的強力干預(yù),也沒有考慮到春節(jié)后的延遲復(fù)工。然而我們做的預(yù)測模型顯示,2月中旬或下旬將達到疫情高峰,確診病例約六、七萬人。研究論文投到國外權(quán)威期刊,他們感覺和國外的預(yù)測水平差太多,被退了回來。但事實上,我們的預(yù)測更接近權(quán)威。”
第二版預(yù)測:以1月11日到2月17日的數(shù)據(jù)作為輸入數(shù)據(jù),通過機器學(xué)習(xí)構(gòu)建人工智能模型
為了更精準地判斷疫情發(fā)展的各個關(guān)鍵節(jié)點,鐘南山院士技術(shù)團隊迅速著手實施了第二版預(yù)測。該版預(yù)測通過機器學(xué)習(xí)構(gòu)建了人工智能模型,同時改變了此前的鑒別方法,以1月11日到2月17日的數(shù)據(jù)作為輸入數(shù)據(jù)進行研究。2月9日前,使用“新增確診人數(shù)”作為訓(xùn)練數(shù)據(jù)進行預(yù)測;2月13日后,采用“累計確診+新增疑似-死亡人數(shù)-治愈人數(shù)”作為訓(xùn)練數(shù)據(jù)進行預(yù)測。結(jié)論顯示,全國將會在2月20日左右達到拐點,最終全國確診病例8萬例左右。
圖3-1 湖北感染人數(shù)預(yù)測趨勢與實際趨勢對比
圖3-2 全國感染人數(shù)預(yù)測趨勢與實際趨勢對比
縱觀疫情實際走勢,2月20日左右,湖北省以及全國范圍內(nèi),確診病例、疑似病例顯著減少,疫情出現(xiàn)明顯拐點。截至3月26日10時,全國累計報告確診病例81960例。以上均與鐘南山院士技術(shù)團隊做出的預(yù)測十分接近,這也說明了其疫情預(yù)測十分準確。
雖然兩版預(yù)測采用的監(jiān)測方式不同,但是采用的預(yù)測方法是相同的,都是在原始的SEIR模型上引入遷入和遷出人數(shù)。
值得一提的是,建模過程和預(yù)測結(jié)論的得出,離不開廣州呼吸健康研究院、云創(chuàng)大數(shù)據(jù)技術(shù)團隊、澳門科技大學(xué)人工智能學(xué)院等單位的通力合作。
事實證明,鐘南山院士技術(shù)團隊做出的與疫情實際走勢十分吻合的兩版預(yù)測,為疫情防控策略提供了參考,為政府作出科學(xué)、全局決策提供了科學(xué)依據(jù)。