從政策推進到研討產出——淺析病院到九宮格主導人工智能研討的技巧性挑釁_中國網

作者:

分類:

requestId:695e960d107132.30787887.

中國網/中國發展門交流戶網訊   近年來,人工智能(AI)正在加快融進醫療安康相關研討中。醫院是我國醫療安康領域主要的人工智能研討基地與產出基地。今朝,對醫院主導人工智能研討現狀調查尚不充足。部門關于醫院人工智能的研討僅強調了內部資源局限和一些常見的倫理問題。一些定量研討雖關注了醫療安康人工智能研討狀況,并通過論文數量得出發展傑出的結論,但其剖析層面較為宏觀,未能指出發展中不平衡、不充足的部門。本文對醫院主導人工智能研討的現況進行研討,剖析醫院主導人工智能研討需求面對和跨越的技術性難題,并針對性地提出治理建議。

政策推動醫院開展人工智能研討

我國高度重視人工智能在醫學中的研發與應用,將其作為新一輪科技反動和醫療安康產業變革的焦點驅動力,并力圖在新一輪科技競爭中搶占主導權。2017年,國務院印發《新一代人工智能發展規劃》(國發〔2017〕35號)提出,要發展便捷高效的智能醫療服務,推廣應用人工智能治療新形式老手段,樹立疾速精準的智能醫療體系,摸索聰明醫院建設。2021年,《國務院辦公廳關于推動公立醫院高質量發展的家教意見》(國辦發〔2021〕18號)明確,要推動手術機器人等智能醫會議室出租療設備和智能輔助診療系統的研發與應用。2022年,科學技術部等六部門印發《關于加速場景創新以人工智能高程度應用促進經濟高質量發展的指導意見》(國科發規〔2022〕199號),進一個步驟指出要積極摸索醫療記憶智能輔助診斷、臨床診療輔助決策支撐、醫用機1對1教學器人、互聯網醫院、智能醫療設備治理、聰明醫院、智能公共衛生服務等場景。同年,國家衛生安康委員會與各省份簽訂的《共建高質量發展試點醫院一起配合協議》中明確,要聚焦數字賦能,加強年夜數據、人工智能等跨行業新技術應用,建設醫療、服務、治理“三位一體”的聰明醫院。“十四五”期末,試點醫院構成中國聰明醫院樣板;“十五五”期末,面向世界供給聰明醫院建設中國解決計劃。

醫院采用人工智能技術開展研討,有機會產出引領性、顛覆性的科技進步。傳統上,醫院主導的研討重要應用經典的數理統計來區別有用信息(信號)與無效信息(噪聲),其技術焦點是包含線性回歸、Logistic回歸、決策樹等在內的一系列統計剖析方式,納進的數據年夜多為結構化的定量數據。采集和收拾相關數據需求耗費大批的人力物力和時間。與這些統計方式比擬,深度神經網絡、機器學習的人工智能研討范式可明顯擴展納進研討的數據模態,增添數據量,并加快信息采集過程。與此同時,醫院是醫療安康數據的主要生產基地;醫院研討者加倍貼近患者,更不難提煉出具有嚴重科學意義的醫學問題及技術需求。這為醫院主導人工智能研討供給了主要優勢。當前,我國醫院已在人工智能研討標的目的發力,在數據發掘、圖像識別、天然語言剖析及機器人輔助等 4 項通用任務框架中,解決疾病診斷、治療、安康治理和醫院治理等方面的挑戰。人工智能技術和醫院的數據生產將配合賦能醫院研討者,不斷完美臨床診療技術、構建智能醫護形式、優化安康治理體系,產出傳統研討方式尚無法解決的科學問題,從而孵化出滿足國家戰略需乞降國民安康需求的嚴重科技進步。

人工智能臨床應用研討已成為國際醫學研討的重點標的目的和競爭熱點。當前,american、中國、英國是在醫療安康人工智能研討中貢獻論文最多的國家 。2020年,american國立衛生研討院(NIH)啟動了一項總金額高達 1.3 億美元的“通往人工智能之橋”(Bridge2AI)的資助計劃,旨在資助生物醫藥等瑜伽教室相關領域開展人工智能研討。國際一流醫院也在盡力布局人工智能的研發與應用。2022年,american《新聞周刊》(Newsweek)和德國 Statista 調查公司發布了“世界智能化水平最高的 300家醫院”榜單。該榜單中的智能化水平以“人工智能”“數字化記住的人了。女兒心中的人。一個人只能說五味雜。憶”“機器人”等維度進行評估;排名前 10位的醫院中,有5家醫院被特別地標注了以“人工智能”為代表性領域。

醫院人工智能研討數量及質量剖家教

樣本醫院

2021年,國家衛生安康委員會面向全國,選定了北京協和醫院、北京年夜學第三醫院、四川年夜學華西醫院、噴鼻港年夜學深圳醫院等 14家公立醫院,作為國家公立醫院高質量發展試點醫院。這 14家醫院感觸感染到的政策推動更強,因此具有典範性。同時,部門樣本醫院具備較強的科學技術研討才能,而部門醫院在科研方面才能較弱;通過對它們主導的人工智能研討發展現狀進行調查,有助于清楚我國醫院主導人工智能研討的相關情況,具有必定水平的代表性。

研討方式

本文采用定量研討方式,對發表論文和申請專利 2個維度開展了研討。

發表論文方面,研討者對樣本醫院發表人工智能相關論文進行了統計。具體地,①從維普期刊平臺和 PubMed數據庫分別檢索了這 14家醫院以中文和英文發表在期刊上的論文,取回論文標題、作者、摘要、關鍵詞、作者單位等信息。②采用關鍵詞法在前述論文中識別人工智能相關論文。假如論文的標題、摘要、關鍵詞中說起了“人工智能(artificial intelligence)”“機器學習(machine learning,ML)”“神經網絡(neural network)”“支撐向量機(suppor舞蹈教室t vector machine,SVM)”“卷積神經網絡(convolutional瑜伽教室 neural network,CNN)”“殘差網絡(residual network)”等人工智能的標志性中文或英文關鍵詞,則將其標記為人工智能相關論文。納進研討的論文發表時間為 2018年—2022年;此中,因受新冠肺炎疫情影響較年夜,2020年暫不納進調查。③對論文的數量、發表語言、研討層次等維度進行了統計和剖析。

專利申請方面,研討者從國家知識產權局網站“專利檢索及剖析”系統檢索了雷同時間段內獲批的、包括“人工智能”關鍵詞的相關發明、實用新型專利項目,并對其數量進行統計。

發表論文剖析

論文數量。樣本醫院在 2018年—2019年、2021年—2022年共發表中文和英文論文 13.34萬篇;此中,人工智能相關研討論文 3 002篇,占比較低,僅為 2.25%。樣本醫院參與人工智能研討論文數從 2018年的222篇逐年增長至 2022私密空間年1 434篇(圖 1),但 2022年的同比增速(53.70%)遠低于 2019年的同比增速(86.04%)。結果提醒,醫院參與人工智能研討能夠碰到了一系列挑戰,發展能夠進進瓶頸期。

發表語言一股兇猛的熱氣從她的喉嚨深處湧上來。她來不及阻止,只得趕緊用手摀住嘴巴,但鮮血還是從指縫間流了出來。。以中文作為發表語言的論文數占比從 35.59%逐年降落至15.34%,且各年占比均低于所有的領域論文中中文語言占比(圖 2)。結果提醒,醫院的人工智能研討更傾向于發表在國際期刊上。

第一作者。本文以第一作者單位是樣本醫院的論文數量作為權衡醫院主導人工智能研討的指標。樣本醫院主導發表了 1 728篇人工智能研討論文,占參與人工智能研討數的 57.56%。這說明,相當多的研討并非由醫療機構主導。主導人工智能研討最多是 A醫院,2022年已達255篇,約占樣本醫院主導人工智能研討發表論文數的 1/3;同時,A醫院的研討基數也較年夜(7 286篇)。主導人工智能研討數量排第 2位的B醫院的研討基數也較年夜,情況與 A醫院類似(表1)。結果提醒,醫院主導人工智能研討的發表數量與醫院總體科研產出數量的相關度較高。

研討層次。雖然醫院參與和主導的人工智能研討數量在進步,遺憾的是,醫院主導人工智能研討質量仍可進步。約 55%的研討(67.29%的中文論文和 45.92%的英文論文)僅以“人工智能”或“深度學習”或“機器學習”作為關鍵詞,這些論文年夜多尚逗留瞻望、討論人工智能能夠應用于某領域的較淺的研討層次上。基于支撐向量機(SVM)的前一代人工智能研討范式仍占樣本醫院主導人工智能研討的相當比例(圖 3)。

人工智能相關專利

2021年以來,多家試點醫院人工智能專利授權數實現了“零”的衝破,總量也從 2018—2019年的2件進步到了2021—2022年的46件(表2)。此中,D醫院2021年實現了 11件授權的岑嶺。但是,人工智能研討轉化專利數量較少且不穩定,并未構成穩定的人工智能研討計劃及產出。

醫院主導深度人工智能應用研討的挑戰剖析

醫院研討者主導人工智能研討的優勢是加倍接近臨床需求,加倍接近來自患者的多模態醫療安康數據,因此更有盼望產出深度的、具有應意圖義的人工智能研討結果。本研討發現,醫院參與和主導的人工智能研討數量正在逐年增添,醫院研討者對人工智能研討范式的熱情越來越高漲,投進也越來越多。結合前訂婚量剖析結果,本文通過深度訪談、專家咨詢等方式,從學習應用、研討本錢和研討的組織治理 3個層面,分析醫院主導深度人工智能應用研討存在的技術性挑戰與窘境。

學習曲線峻峭

系統學習深度神經網絡范式。深度神經網絡范式由一系列彼此關聯的技術路線和細節構成,知識容量較年夜。例如,常見的人工智能模子有卷積神經網絡(CNN)、循環神經網絡(RNN)、轉換器(transformer)、天生式對抗網絡(GAN)等。在最基礎的 CNN模子中,研討者需求學習感知器、多層神經網絡、卷積核、梯度降落、損掉函數、正則化等一系列知識點。雖然醫院的研討者年夜多接收過傳統數理統計剖析技術的訓練,但很少有人接收過人工智能技術的系統訓練。醫院的研討者完成深度神經網絡范式的系統性學習,往往只能應用任務之外的業余時間自學或參加相關培訓班。

學習法式編寫。①編程環境設置裝備擺設的挑戰。人工智能的主流語言是 Python,但法式實現還需求依附專門的中層框架。中層框架有多種選擇,包含谷歌(Google)公司主導開發的 Tensorflow,臉書(Fa教學cebook)公司主導開發的 Pytorch,以及百度公司主導開源的飛槳(PaddlePaddle)等。每一種中層框架都處在疾速的更迭之中,前一代的效能能夠在后一代版本中被直接撤消。對于初學者而言,需求花費很長的時間,才能夠準確地在人工智能社區找到與當地環境相對應的解決計劃。而一些應用者較少的中層框架,輔助學習資源則更少。②編程和消除編程錯誤的挑戰。醫院的研討者應用的數理統計軟件,年夜多可以通過鼠標點選分歧模塊下的按鈕實現,且這些軟件經常配備詳盡的應用說明。人工智能研討則需求研討者從“零”撰寫法式,包含導進中層框架、加載需要基礎模塊等。研討者消除法式錯誤凡是會花費比編寫法式更多的時間。對初學者而言,碰到的絕年夜多數問題都需求向內部尋求解決計劃。當輔助學習資源較少時,會對積極性形成致命的打擊。③多模態數據挑戰。在傳統的數個人空間理統計研討中,進進統計模子的年夜多是結構化的、以數值為情勢的數據。但在人工智能研討中,數據擴展至單一圖像(如 X 線平片)、堆疊圖像(如CT、核磁)、連續圖像(如超聲錄像、內鏡錄像)、文本(如病歷、診斷報告等)等多模態數據。研討者不得不學習將這些數據導出、輸進到人工智能法式中需求的編程技巧。

計算機相關英語語言才能。當前,高質量的人工智能進門書籍都以英文書寫。雖然部門經典著作有中文譯本,但由于翻譯、出書存在周期,這些著作中徵引的學習資源甚至中層框架都發生了變化。對于初學者而言,即便是一個步驟步地照著做,能夠也達不到預期的目標。類似的,多數高質量的人工智能技術討論社區也是用英文作為重要語言。高程度醫院的研討者的英文程度較高,但仍需邁過閱讀和懂得計算機領域研討的關口。這也從側面印證了前文的發現,即越來越多的人工智能研討結果以英語發表在國際期刊上。

迭代計算產生時間和硬件本錢

醫院主導人工智能研討的迭代本錢較高,而迭代本錢主僕二人對視了半晌後,藍玉華走出屋子,來到門外的院子裡。果然,在院子左邊的一棵樹下,她看到了自己的丈夫,汗如雨重要可以分為時間本錢和硬件本錢 2 類,且這 2 類本錢在必定水平上可以彼此轉化。

人工智能技術的迭代特徵導致時間本錢較個人空間高。機器學習算法通過自動迭代計算來獲得神經網絡模子的最優參數解,應用本錢較低、普及度較高的中心處理器(CPU)計算需求耗費較長的時間。在深度學習的經典進門任務 MINIST數據集(手寫數字數據集)中,圖像鉅細為 28像素× 28像素,CPU可以在分鐘級別的時間內1對1教學完成屢次迭代,獲得最優解。但隨著模子層數、迭代次數及圖像鉅細的增添,時間本錢將敏捷進步。例如,在圖像鉅細為 224像素× 224像素鉅細的ResNet-50網絡小樹屋模子(49 層)中,假如應用一顆高級別的 CPU迭代計算 90次,則需求約 700小時才幹完成。在臨床研討的實際問題中,應用本錢較低的CPU計算人工智能的時間本錢將超過研討者可接收的極限。一方面,常規的 X 線、CT和核磁的單幅圖像橫向或縱向辨別率都在 1 000像素以上;另一方面,具有實際應意圖義的神經網絡模子也在 10至數十層之會議室出租間。

醫院主導人工智能研討需投進相當高的硬件本錢。比擬 CPU,應用價格更高的圖形處理器(GPU),可以年夜幅減少計算需求支出的時間本錢。理論上,應用專業 GPU完成前文ResNet-50的計算任務比應用服務器級別的 CPU快近40倍。由于多數醫學圖像的辨析度較高、圖層數較多,醫院主導人工智能研討幾乎難以防止地需求添置 GPU,有時還需求添置與之婚配的專門的計算平臺。例如,american麻省理工總醫院(Massachusetts General Hospital)在基于本院的記憶數據開發人工智能圖像處理法式的任務中,專門引進了一臺配備了 8部GPU(V100型號)、單價高達 12.9萬美元的英瑜伽場地偉達(NVIDIA)DGX平臺。類似的,在american梅奧診所(Mayo Clinic)主導的一項基于核磁圖像的 GAN研討中,也應用了DGX系列計算平臺。今朝,有實用價值的人工智能技術的參數量越來越年夜,對硬件的請求也越來越高。例如,當前熱度極高的 ChatGPT模子的參數量高達1 750 億,據受訪專家預算,如采用單部 V100型號的GPU,需求計算約 355年。為加快計算,需求的投進本錢也超乎想象。部門研討者坦言,人工智能實驗室的組建需求首席研討員購置本錢可觀的設備,作為基礎設施供研討組內的成員共享機器小樹屋時間開展人工智能研討。對醫院的人工智能技術潛在研討者而言,獲取共享空間與研討設想相婚配的計算硬件資源是一項難度相當年夜的挑戰。

將臨床數據轉化為高質量研討數據


留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *