6
| 本文作者: 奕欣 | 2016-08-11 11:39 |
如果用上帝視角觀察醫生的一天,你會發現醫生實際上要進行不少重復性勞動。
重復性勞動可以體現在三個方面:交互、發現和決策,而這些都可以為機器所勝任:
交互層面:醫生在問診時和患者的詢問性交互,針對患者的用藥指導、患者追蹤等;
發現層面:保險審核人員在醫保單據審核中的機械重復性勞動,醫生對治療方案的校對審核等;
決策層面:醫生根據患者的癥狀表現、輔助檢查,給出診斷結果,根據診斷結果給出治療建議等。
整體說來,醫學是一門知識驅動類學科,只要從多維度收集足夠多、足夠可靠的知識,就能在輔助決策層面發揮巨大的價值,把醫療人員從繁雜的重復性勞動中解放出來,進而去做更多有創造性的事。
如果能利用人工智能幫助醫生在浩如煙海的醫學知識里對應癥狀和疾病,甚至輔助醫生決策并對癥下藥,無疑能夠提升醫療資源的優化效率。康夫子CEO張超做的正是這樣一個“醫療大腦”——利用人工智能技術,從醫學文獻中自動學習知識、構建知識圖譜、實現知識推理,再將普通公眾對癥狀的描述及疾病的理解準確地映射在嚴肅醫療平面。


北京康夫子科技有限公司CEO 張超
張超在百度工作五年,擔任自然語言處理部資深研發工程師、文本知識挖掘方向負責人。和網民的搜索行為打交道,已經成為他工作的常態。
一次偶然的機會,張超發現網民對一些醫療健康類問題往往在百度上會翻看很多頁結果,但呈現的內容實際上良莠不齊。由此,張超產生了利用人工智能代替網民整理頁面的有效信息,以提升用戶體驗的想法。
當時張超瞄準了對營養最為看重的一個群體——孕婦人群來構建知識圖譜,推出了一個“飲食記錄分析”的功能。通過孕婦的日常飲食記錄,用戶可以判斷營養攝入是否均衡,進而獲取更科學的膳食指導。
想法很美好,然而在實際操作中收效甚微。張超告訴雷鋒網,在產品上線后,只有不到20%的孕婦會去嘗試去記錄自己的飲食,不到8%的孕婦能連續記錄1周。
張超由這次創業中得到了教訓:雖然孕婦人群對營養的要求關注甚高,但在現階段,網民對營養還處于“葉公好龍”的階段。“營養不是剛需,在一定程度上還帶著“反人性”的特征。”
而一些B端公司了解到康夫子在做的知識圖譜,希望能以付費形式來使用他們的服務。而考慮到相對于“營養”,“醫療”的痛點更加突出,也讓張超開始想做剛需,想做“我們最擅長的事”。
而這一切,就從優化醫療行為中的重復性勞動開始。
在今年3月份,康夫子開始為B端提供知識和技術服務,而它們也從原來的“飲食建議服務商”轉向成為“醫療人工智能技術、知識、數據提供商”。
知識圖譜在數據表現層面由兩部分組成:首先是實體節點,其次是實體之間的關系。舉個例子:疾病名、癥狀名、藥品名、化驗指標這些數據是實體節點,每個節點和節點之間都有一一對應的關系,比如疾病和癥狀的對應關系、某種疾病需要使用什么藥品、疾病需要做哪些化驗等。而在實際的診斷中,還會涉及更多的對應關系。
康大夫在做的知識圖譜,主要就是教會計算機在閱讀海量文本后,自動給出描述某種知識的書寫規律,并進行大規模的知識自動抽取(Information Extraction)。
數據抽取主要分為四步:
1. 數據預處理,比如,數據清洗、分詞、專名識別、指代消岐等任務;
2. 模式學習,基于上億條文本,自動去發現這些文本的書寫規律;
3. 知識抽取,針對上億條文本,以繼續學習到的模式進行二次抽取;
4. 增強學習+Bootstrapping,基于一些標注數據、判斷準則,不斷重復第2、3點,并給出準確率超過99%的結果數據。
有了完善的知識圖譜,還遠遠不夠,系統要具備推理能力才能實現智能診斷。在康夫子系統上,這體現在兩個方面,一是知識向量化表示,這一步也是構建口語化醫學和文獻專業術語的橋梁的關鍵步驟。也就是,將患者描述的通俗語句“翻譯”為專業術語(如“抽筋”和“痙攣”的對應關系);二是判斷多種癥狀綜合下和疾病之間的權重,配合診斷模型,提升診斷的命中率。
而比起其它知識圖譜的構建有所不同的是,醫學知識的分散性及無結構化這兩大特性,導致醫學圖譜的構建更加困難。比如在娛樂領域,從娛樂站點、百科知識就能快速挖掘明星的作品、配偶等知識關系,但在醫學領域,需要閱讀大量權威文獻后進行抽取,才能達到預期效果。
再有一點就是邏輯應用,醫生囿于知識壁壘及醫學本身的復雜性,在診斷領域無法面面俱到的情況下,康大夫能夠給予交互,根據患者的回答情況進一步判斷病癥。
康夫子的主要業務內容主要包括API服務和臨床輔助決策兩部分。根據張超的說法,康夫子已經完成了對藥物知識圖譜的構建,目前覆蓋近30萬種藥物,針對100種常見病的典型癥狀準確率已超過90%,針對4000種熱門疾病的典型癥狀的命中率也超過80%。
雖然在診斷效果上已經超過絕大部分全科醫生,但康夫子系統仍不能獨立完成診斷。除了倫理因素外,實際場景的診斷復雜度也使人工智能技術目前只能針對特定任務進行處理。這也讓張超堅定了服務于B端的想法,“我們不直接服務與患者,但是患者可以通過我們的B端合作伙伴獲取服務。”
在張超的理解中,作為一門60年的學科,針對特定任務的人工智能應用在未來3-5年會融入到每個人的生活當中。而以自動駕駛、圍棋為代表的邏輯驅動,和以醫療為代表的知識驅動就是人工智能的兩個“引擎”。當然,除了在智能診斷領域繼續完善知識圖譜外,張超同樣希望以知識為動力的醫療智能化能在邏輯層面更好地服務人類,比如虛擬助手、藥物挖掘、智能診斷方案等,讓醫生真正從繁雜的勞動中解放出來。
雷穿戴是雷鋒網旗下公眾號,關注運動健康方面的產品和技術。如果你想聊聊自己的創業故事,可加小編微信417423625,或發郵件至 guoyixin@leiphone.com。

雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。