醫療影像大賽連勝兩場 港AI癌症診斷技壓全球
原文刊於信報財經新聞專欄「StartupBeat創科鬥室」

郭俊豪(左)本來任職於銀行IT部門,三年多前開始接觸Python,跟身邊的馮振華(右)成為朋友。(何澤攝)
國際級醫療影像分析大賽「ICIAR 2018 Grand Challenge on Breast Cancer Histology images」(BACH),出現了港人身影。IT人郭俊豪以高階程式語言Python,用作訓練機器深度學習(Deep Learning),從全球超過50隊參賽隊伍脫穎而出,於比賽兩部分均成功奪得第一名。
BACH是2018年夏天於葡萄牙舉行的「International Conference on Image Analysis and Recognition」的前奏,比賽歷時數個月。參加者須在第一部分比賽編寫程式,利用400張分屬正常細胞、良性腫瘤、原位癌,或已發展成入侵性癌的顯微鏡影像作Training Data,進行深度學習,其後再辨識100張額外的顯微鏡影像(亦即是Testing Data),看看程式的準確度。
IT人受親友病逝啟發
郭俊豪在這第一部分,先以87%準確度(Accuracy),跟另一個印度參賽隊伍成為雙冠軍。至於第二部分比賽,參加者須進一步分析全切片影像(Whole Slide Imaging, WSI),把有問題的部分分類(Classify)出來。經複雜算式計算分數後,郭俊豪在第二部分比賽亦以0.69分高踞榜首。
據悉比賽的參加者大部分都跟他一樣,專長於電腦科學,沒太多醫療背景。郭俊豪形容,「看着那些顯微鏡影像,都不知為何這一張是(癌細胞),那一張不是。要看很多背景資料,了解一下病理學家如何分辨。不過,自己基本上都是從影像分析角度出發來做這研究。」
郭俊豪表示,此前已參加過好幾個醫療科技比賽,當中涉及肺癌電腦斷層掃描(CT)分析、子宮頸癌分析、乳癌擴散等等,例如要從數百個病人的肺部CT影像找出結節(Nodule),並估算結節一年後變成癌症的機會。他透露,自從有親人因癌症離世後,便經常思考一個問題:作為IT人,假如想在癌症相關研究參與其中,到底可以貢獻什麼。
用Python編程潛力巨大
不過,投身IT行業十多年的他,無論是打工抑或創業,均未嘗涉足醫療科技,反而大部分時間在銀行的IT部門打滾,主力負責編寫外滙交易系統,其中JAVA是他最常接觸的程式語言。直至3年多前,他開始接觸另一種熱門程式語言Python,「當時公司有分享會,同事講述自己在台灣參加PyCon(Python Conference)的經歷。」

郭俊豪坦言AI是要輔助醫生找出病人潛在風險,最終確診病人有病與否、決定治療方案等仍是醫生。(何澤攝)
與此同時,開源香港(Open Source Hong Kong)會長馮振華在2015年,把專門探討和推廣Python程式語言的PyCon引入香港,兩人便在PyCon HK結緣。
在2018年11月於數碼港舉行的PyCon HK 2018,郭俊豪更擔任講者之一。他透露,現時很多開發者,均以Python訓練模型。馮振華補充指出,Python的語言字眼,跟英文有點相似,相對容易上手,加上Python的軟件庫有不少套件(Package)可供取用,「很方便開發者編程來做他們想做的事」。
商業化需時 先開源供取用
發掘到深感興趣的科技範疇,加上已在銀行IT部門工作十多年,郭俊豪開始思考新發展方向。2018年夏天,他跟3名拍檔一同開設科技公司世閣(SEBit),主打立體視覺技術,包括虛擬實境(VR)、擴增實境(AR)、建築資訊模型(BIM)以及人工智能(AI)。客戶有建築公司及政府部門,參與項目如試行以AI分析街燈毛病。
對郭俊豪而言,朝向AI癌症診斷發展本是他的更大心願,惟暫未遇到合適拍檔,例如醫生。他解釋,香港醫學界一般是憑肉眼,直接透過顯微鏡觀察切片影像,「好處是快,畢竟要將切片影像數碼化需一定時間;而且(用傳統顯微鏡和肉眼)可以從細胞厚度等,找出一些額外的資訊。」故他認為,以AI診斷癌症病理的技術,在香港暫時仍有待商業化。未來會好好整理自己的研究,在GitHub等平台開源,讓其他有興趣人士取用。
輔助醫生 減輕人手負擔
綜合幾次參加國際性AI醫療科技大賽的經驗,郭俊豪認為,AI有時會出現Overfit(過度訓練)的情況,即是Hypothesis(假設)過度貼近Training Data。當要辨識之前未接觸過的Testing Data時,準確度即會打折扣,未必可預測到真實結果。
如此一來,AI要正式在醫學上廣泛應用、用作診斷病人,豈非遙遙無期?郭俊豪直言「咁講只啱一半」,坦言AI是要輔助醫生找出病人潛在風險,最終確診病人有病與否、決定治療方案等仍是醫生,「很多位可以幫輕人手,但不是取代。」
採訪、撰文:陳子健
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
AI時代|IBM z17主機運算量增五成
不少商業機構為求保密,都傾向把大量業務資料保留在自家伺服器,而並非託管在雲端網絡上。國際商業機器(IBM)昨天發布新一代大型主機z17,內置IBM Telum II處理器,專為250多種人工智能(AI)用例而設計,包括AI代理及生成式AI。
- Posted April 9, 2025
- 0
-
細談數字經濟七大試驗區(車品覺)
國家數據局近日正式指示天津、河北(雄安新區)、上海、江蘇、浙江、廣東、四川等7個地區,建設國家數字經濟創新發展試驗區,這一重大政策標誌着中國數字經濟發展,進入深水區改革階段。從另一個角度看,也是問題必須得到解決的時候。
- Posted April 9, 2025
- 0
-
侏羅紀公園|絕種恐狼藉基因編輯復生
美國生物科技公司Colossal Biosciences宣布,成功復活絕種約1.25萬年的恐狼(Aenocyon dirus),成為全球首個借助基因編輯與複製技術復生的滅絕物種,震撼全球科學與保育界。
- Posted April 9, 2025
- 0
-
搶人才|Google一年有薪假阻AI專才跳槽
外媒Business Insider爆料,谷歌旗下AI團隊DeepMind的英國部分員工,受制同行競業禁止條款,於離職後最多12個月內,不得為其他AI公司工作,期內他們仍支取薪酬,但不再參與工作,並安排放「花園假」,實際等同受薪待業。
- Posted April 9, 2025
- 0
-
AI製片|新Nova Reel可生成2分鐘影片
美國科企巨頭亞馬遜(Amazon)全新升級人工智能(AI)影片生成模型Nova Reel 1.1,能以文字描述、選用圖像,生成長達2分鐘的多鏡頭影片,大幅提升創作彈性與效率。
- Posted April 9, 2025
- 0
-
開放權重
這是指AI模型的一種發布形式,指模型的參數權重(Weight)公開分享,開放下載、使用或修改。跟完全開源(Open Source)不同,開放權重的模型,不一定包含完整的訓練代碼或數據集,惟核心的模型結構及參數是公開的。
- Posted April 9, 2025
- 0
-
AI私人投資破萬億 基建與研究最吸金
人工智能(AI)融入日常生活,以驚人速度發展,從法律、教育到醫療保健,滲透社會各個層面。美國史丹福大學「人本人工智能研究中心」(HAI)發表長達455頁的《人工智能指數報告2025》(AI Index Report 2025),總結最新的AI產業狀態數據及趨勢。
- Posted April 9, 2025
- 0