機器學習改善當下,防患於未然
在過去的十年間,醫界逐步採用電子醫療系統,讓臨床醫師和患者的資訊流通更順
暢,為醫界跨出重要的一步。現在,醫療保健業者也展開對機器學習應用的探索。 Google 研究人員於過去一年發表了機器學習如何幫助臨床醫生檢測淋巴結中的乳腺癌轉移,以及篩選糖尿病視網膜病變。
隨著機器學習技術成熟,它將更進一步準確預測醫療事件。如:病人是否需要住院、
需留院多久以及他們的健康狀況是否惡化,像是:尿道感染、肺炎或心力衰竭。機器學習的進步讓我們能從去識別(意即不含任何可辨識身分的個資)的醫療記錄上分析
並找到模式,更準確的預測醫療事件、了解患者需求。
因此,我們與來自加州大學舊金山分校醫學院、史丹佛大學醫學院、芝加哥大學醫學
院等世界一流的醫療研究人員合作,研究如何結合機器學習技術與臨床專業知識,來
改善與預測病人的預後成效、拯救生命,並防止可能造成大規模損害的事件發生。
這類的醫療問題在世界各地都需要被解決:美國醫院每年的意外住院就額外花費高達 170 億美元(約合台幣 5100 億元),醫療相關感染導致99,000 人死亡,醫療與藥物問題造成 77 萬多人受傷和死亡。全世界每年有 4300 萬人受醫療疏失影響,且大多數發生在中低收入國家。
深度學習在醫學成像的應用
以下介紹的兩個案例都是由 Google 20%專案衍生出來的研究,他們立基於 Google 開源機器學習系統 TensorFlow 而衍生出的演算法。TensorFlow 也廣泛被應用到許多外部的研究。史丹佛研究團隊正採用 TensorFlow 架構以及深度學習來診斷皮膚癌。
- 協助診斷糖尿病視網膜病變(Diabetic Retinopathy, DR):糖尿病視網膜病變是全球失明人數攀升的主因。據了解,全球有高達4.15 億的糖尿病患者。為預防失明,糖尿病患者每年都應進行一次篩檢。檢測糖尿病眼疾的常見作法就是檢查眼底圖像,並對疾病的嚴重程度進行評估。嚴重程度取決於視網膜病變的型態(如:微型動脈瘤、出血、硬性滲出物等),這些都是檢驗眼球出血和滲液的指標。
印度因缺近 12.7 萬名眼科醫生,導致近 45% 的患者在接受診斷前飽受失明之苦。這其實並不應該發生,因為糖尿病視網膜病變是可全面預防的。為了改善這樣的情形,Google 研究團隊與美國 EyePACS,以及印度的 3 家眼科醫院 Aravind Eye Hospital、Sankara Nethralaya、Narayana Nethralaya 緊密合作,創建了一個 128,000 張圖像的開發數據集,並聘請了 54 名專業眼科醫師,每組圖像由 3-7 名眼科醫生進行評估。這個數據及目前被用來訓練深度神經網路以協助醫師診斷出糖尿病視網膜病變。
我們分別在兩個臨床實驗中運用神經網路演算法辨識了約12,000 張成像,再將診斷結果與由 8 名經過美國眼科醫師認證的醫師判斷結果相互對照,以驗證診斷的靈敏度。
最終實驗結果顯示我們的演算法表現與 54 名專業眼科醫生的辨別結果達高度一致性。舉例來說,在下圖的數據集中,演算法的 F-Score 值(結合靈敏度和特異性的度量,最大值為 1)為 0.95 分,稍微高於眼科醫生的 F-Score 中位數 0.91 分。
目前,Google 仍積極與視網膜研究領域的專科醫生合作,以建立更完整的量化評量標準。Google 已與印度 Aravind 醫院完成了第一次的臨床試驗。試驗結果顯示該演算法判斷結果與現行醫師的診斷結果是一致的,而第二、第三次的臨床實驗也正在進行中。
此外,Google 於此發表的研究中,2D 眼底圖像的判讀只是眾多糖尿病視網膜病變診斷步驟中的其中一步。在某些情況下,醫師也會利用 3D 成像技術、光學相干斷層掃描(Optical Coherence Tomography, OCT)來就視網膜的各個層面進行詳細檢查。此研究目前由 DeepMind 的同事來執行。未來,Google 也將結合這兩種判斷方式,以協助醫師更有效率地判斷各類眼疾。
幫助檢測淋巴結中的乳腺癌轉移瘤:
病人疾病的診斷相當仰賴病理師的分析。而病理切片的判斷是一個複雜且需要長時間訓練以累積經驗的過程。即使受過密集的訓練,不同病理師對同一病人的診斷也會各異,進而發生誤診的情況。每 12 人的乳腺癌切片中,就有 1 人可能被誤診(比例依各地人口數不同而有差異),在其他癌症診斷中也有類似情形 (例:前列腺癌 7 人中有 1 人可能被誤診)。
針對乳腺癌的診斷,準確率有時候僅有 48%,和前列腺癌診斷準確率一樣低。這主要是因為準確的判斷需要非常龐大的資訊加以分析與檢測。
在一般情況下,病理醫生負責審查病理切片上可見的所有生物組織,但是每個患者有很多病理切片,在進行 40 倍放大時每個切片都有 10 億的像素(10 gigapixels),這不僅是數據量的問題,時間有限也往往是個挑戰。
為了解決時間限制和診斷差異性高的問題,Google 正研究導入深度學習來打造一個能協助病理學家有效提升工作流程的自動檢測演算法。我們採用了過去用於 2016 ISBI Camelyon Challenge 的圖像(由 Radboud 大學醫學中心提供)來訓練並優化這個演算法,以針對已經擴散(轉移)到與乳腺相鄰的淋巴結的乳腺癌的定位作判斷。
雖然腫瘤發生概率預測熱圖 (heat maps)有點眾聲喧嘩,但是 Google現成的深度學習方法如 Inception (又名 GoogLeNet )於提高時間效率與診斷一致性的結果相當好。透過額外的訂製設計,包含訓練網絡以不同的放大倍率來檢查圖像 (就像病理學家所做的那樣),我們發現訓練一個相當或超過病理學家表現的模型是有可能的。尤其這個模型不受時間限制,可長時間檢測病理切片。
實際上,該演算法產生的病理預測熱圖有了很大的改善,且演算法的定位分數 (FROC) 達到 89%,大幅超越了在沒有時間限制下,病理學家對腫瘤定位的正確率(73%)。而其他使用相同數據集的團體也獲得高達81%的分數。此外,我們的模型泛化能力非常好,即使是使用從不同醫院、不同掃描儀獲取的圖像,成效也不錯。更多詳細資訊,可參閱 Google 的文章「Detecting Cancer Metastases on Gigapixel」。
淋巴結活體組織切片特寫。切片包含乳腺癌轉移以及與腫瘤相似但為良性正常組織的巨噬細胞。
機器學習在醫療項目的未來發展
儘管在這些應用人工智慧的醫療案例中,演算法都能讓機器在各項任務中維持良好表
現,但仍因缺少了醫師對疾病的廣泛了解與實際經驗,讓這些應用無法完成任務外的
異常檢測病症。如:發炎過程、自身免疫疾病或其他類型的癌症。
為了確保病患能夠得到最佳的臨床診斷結果,未來這些應用將與醫師的工作流程相互整合,讓醫療判斷結果更精準。例如,病理學家透過查看最可能的預測腫瘤區域(可以允許多達八個假陽性區域),以減少假陰性比率 (未檢出腫瘤的比率)。這些演算法可以協助病理學家更容易且準確地測量腫瘤大小,這個和預測相關的因素。
隨著機器學習技術在醫療上達成的顯著成果,一些臨床醫師也和我們接觸,希望能夠
更瞭解、更有效使用醫療資訊,進而產出更好的診斷結果。由於醫療數據非常複雜,過去一年中我們對數據進行了驗證,以確保結果準確無誤。
接下來的幾個月,我們將把這些數據提供給來自每個醫療系統和外部人員以進行臨床
審查。我們也同時協助統整各醫療組織數據格式。由於每個診所都有各自的數據記錄方式,不僅讓觀察變得困難,缺乏數據相互操作性和標準化也讓這個建置過程耗費許多必須手動調整資料的時間。
現在,基於醫療開放數據標準 FHIR (Fast Healthcare Interoperability Resources),我們能利用深度學習技術將此過程自動化,讓臨床醫師和研究人員更容易使用這些數據。
我們的醫療合作夥伴將確保患者數據在分享出去前都被適當地去識別化。接著,我們
使用 Google 雲端的基礎設施,嚴格遵守 HIPAA 隱私規範並以最高級別保護。這些記錄與消費數據將分開儲存。臨床上的突破只有在醫學界和深度學習專家緊密合作時才能達成。雖然在 Google 的大多數員工並不是醫生,但我們持續以獨特的專長期許為醫療照護做出貢獻。我們將與更多醫療單位組織建立合作夥伴關係,共同努力改
善全球數百萬人的健康。
機器學習在台灣醫療領域的可能發展
Google 台灣總經理簡立峰認為:Google 在糖尿病的視網膜病變上面只花了 13 萬個病患數據,而台灣自己的糖尿病病患就有將近兩百萬,因此台灣絕對是有能力做出跟 Google相同的服務,而且更貼近本土市場所需。
台灣不論在醫療領域還是資通訊領域都有穩健基礎。因此若能利用台灣在地圖像資料
與既有技術,就有機會發展此領域,甚至在未來將成功案例發展到國際。若礙於法規,需要進一步將 AI 技術應用到醫療領域,可考慮在醫院內部先行。這是在其他國家很難得的,因為台灣擁有非常完整健保系統可多加利用。
面臨台灣少子化、高齡化而衍伸出的長期照護問題,或可透過機器學習技術加以解
決。如:自駕車技術可衍生開發出自動輪椅。
而簡立峰更表示:張忠謀認為 AI 最重要的重點在如何應用,這對台灣也是。未來各國趨勢都走向建立自有的資料庫和自有的研發團隊,台灣也必須建立屬於自己的本土 AI 團隊,醫療的 AI 台灣有一定的發展優勢,這些優勢連美國都不一定有,這個方向會是台灣很好的破口。
延伸閱讀
千呼萬喚始出來!Google 成立台灣官方部落格,第一手資訊不漏接
Google 看台灣中小企業生態:做好數位行銷,台灣會多 2270 億出口銷售額!
【Google CEO 皮查伊的傳奇故事】還沒沒無聞就一手打造 Google Chrome 霸業,登上 CEO 就讓 Android 起死回生?
(本文部分訊息由 Google 提供,內文與標題經 TechOrange 修訂後刊登。新聞稿 / 產品訊息提供,可寄至:[email protected],經編輯檯審核並評估合宜性後再行刊登。本文提供合作夥伴轉載。)