0
雷鋒網注:本文譯自mobihealthnews,作者Bradley Merrill Thompson,隸屬于Epstein Becker & Green, P.C.公司,負責醫療器械、藥品等的臨床試驗審批、FDA法規咨詢等事項。雷鋒網雷鋒網

隨著一大波公司涌入AI醫療領域,一股現代的淘金風潮再度掀起。
但由于其高風險性,FDA將會監管這些軟件。在美國,雖然《21世紀治愈方案》已經撤銷對部分CDS的監管(ClinicalDecisionSupport,臨床決策支持),并表示還將撤銷對更多項目的監管,但確鑿無疑的是,FDA會繼續監管高風險的CDS。問題的關鍵在于:FDA該如何監管集成了機器學習技術的高風險CDS?
一些人稱醫療領域中的機器學習應用太新,我們并不知道FDA將會作何反應,但事實并非如此,FDA已經有數十年的機器學習監管經驗了,并且幸運的是,這能給我們一些有用的提示:當這種技術大幅擴張時,FDA將會作何反應?
1998年始,FDA放射健康部門已經開始監管計算機輔助識別系統,在大多數情況下,這些軟件利用復雜的算法找出醫學影像中的病灶區。最初,他們被認定為三級設備——這意味著最高風險級別和最大監管力度,后來,FDA又評定其為二級,即認定其風險級別適中。這些軟件被出售給臨床影像醫生使用,指導醫生看片,但醫生不能完全依靠這些軟件。在理論上,這些軟件風險為零,但是FDA懷疑影像醫生將會完全依靠系統檢查,而對其風險警告置若罔聞。
2012年,FDA發表了一系列指導文件,其中涵蓋了與這類軟件有關的所有規定。在這些文件中,FDA重申了此前法規明確說明了的內容:按軟件的臨床應用分類將有效提升監管水平。FDA區分出了CADe和CADx,前者僅標出病灶,后者還會進一步給出疾病診斷和分類,明顯,CADx的風險級別更高,因為需要監管更加嚴格,通常被認定為三級。
但是FDA對于CADx的態度也在與時俱進。就在上個月,2017年7月,FDA決定將識別可以癌癥病變的CADx降級為二級,FDA的此項舉措強調了“計算機輔助醫療影像中可疑癌癥病變識別”,這種軟件基于從醫療影像中提取的信息或特征,識別病變,并且提供病變信息。將其評定為二級軟件是一個“大跨步”,極大促進了這種軟件的發展。因為三類產品的制造商必須提交一大摞上市前批準申請,并進行大范圍的臨床試驗;而二級產品制造商僅需要闡明他們的產品基本上與市面上已有的產品相同(可能也需要臨床試驗,但無論臨床設計或實驗范圍上,都更加適中。)
而對于集成了機器學習算法的影像分析軟件,FDA已經有了一套相對成熟的臨床試驗監管辦法。研究人員可以創建一套醫學影像數據集,其中包含了已確診的正常人和患者影像,申請者可以設計臨床試驗對比有無軟件輔助的情況下每組最終的診斷效果。當然,還有其他可能的臨床設計,這取決于申請者需要證明的假設是什么。
除此之外,FDA有了一套相對明確的審查指標來審查集成了機器學習算法軟件。在2012年的指導性文件中,FDA列出了這些指標,比如算法設計、特征、模型、用于訓練和測試算法的數據集以及使用的測試數據“衛生程度”。后者是非常重要的,因為有些申請者沒有基于測試集選擇分類 ,顯然這是不允許的。FDA想要知道公司是如何獲取數據的,以保證數據能反應真實情況。
FDA判斷公司試驗所用的統計方案和研究假設是否合適方面已經有了豐富的經驗,以他們的經驗來看,許多申請者的研究中包含了多個假設,這可能影響后續的數據分析、統計方案等,總而言之,FDA最重要的目標之一是確保產品設計和臨床驗證中能反映其預期用途。
FDA已經收到了一些申請,其中明確聲明了他們的系統中有機器學習算法——這被FDA稱作“適應性系統”,隨著之后進入市場,使用過程中搜集更多新證據,這樣的系統會不斷進化。事實上,開發一套適應性系統是大多數開發者的終極目標,但這給FDA造成一定的挑戰,因為現有的法規是:醫療設備一旦有改動,必須重新取得批準。如果這個設備自行進化,到哪個時間點需要重新批準呢?同樣,FDA必須決定什么程度的改變需要重新驗證。至少在某些情況下,簡單的確定軟件參數以控制軟件是遠遠不夠的。
除此之外,還有許多其他懸而未決的問題,比如軟件開發商是否能重新使用其測試數據集;訓練或測試的數據量如何確定。FDA很可能要求開發上在數據集匯總加入噪聲以確保其驗證軟件的變化。
這些大都是醫療影像軟件領域的事情,FDA也開始插手其他機器學習技術在其他醫療軟件領域應用,他們已經收到大量這些領域的批準申請,比如分析實驗結果;關鍵生命體征的遠程監控以及腦電圖等信號領域。FDA設備中心的其他部門也在面臨機器學習相關問題,很有可能咨詢放射健康部門的同事。
公司不得不長期布局,并且著重考慮系統的預期臨床用途。除為醫生解釋具體疾病提供要點參考和特定的低風險特征外,任何其他的事情都可能提升面臨的監管力度。
分類將會是個大問題。FDA可能會考慮到機器學習的特定用途,將其視作一項全新的技術,因此規定全新的分類規則。如果是這樣,將此類產品帶入市場的第一家公司或者以三類設備的標準申請批準,或通過將產品風險重新分類以尋求產品分類標準的降級。但這并非意味著前途黯淡和厄運連連,我們知道,FDA在將會靈活應對。在許多例子中,FDA允許在現有的產品中集成機器學習技術,并以二類設備的標準批準。
如果產品不能構建一個令人信服的驗證標準,那么研究設計可能會很復雜。在放射科,大多數案例中,通過活檢和其他診斷過程,我們能建立一個客觀性的標準。其他領域的智能化需要更加有創造性的臨床試驗設計。
應用機器學習技術到放射科過程中,FDA已經意識到的所有技術性問題將轉化成其他形式的機器學習問題。FDA官員很可能求助于放射健康部門的官員咨詢機器學習問題,這尤其適用于與自適應系統有關的其他更具挑戰的監管問題。
好消息是,FDA似乎很關注機器學習的價值以及這項技術將如何變革醫療行業,所以,在大多數情況下,他們可能對該技術的缺陷抱有理解態度,并不想不合時宜地一貫阻止。此外,近期,FDA發布了軟件監管的一系列改善性措施,這可能對正在開發的機器學習產品有益。例如,FDA似乎有益讓產品上市前批準更加容易一些,與此同時, 對上市后制造商搜集大范圍應用的證據要求高。無論如何,FDA對于臨床和嚴謹性的擔心必須要用恰當的證據來應用。
FDA一直在研究機器學習技術,對其的了解越來越多。但是,從實踐操作層面來講,FDA很難招募并且留下機器學習專家,因為他們在公司中掙得更多。
FDA的醫學影像、診斷等部門已經在研究計算機輔助診斷技術了,有一天,可能會公布一些列模擬、分析工具和有價值的數據,這將加速醫療軟件的發展。同時,通過研究機器學習先驅者20多年的路途,后來者或許能找到推廣新技術的最佳方法。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。