大數據-魔「數」穿腦

 

作者:澄清醫院 耳鼻喉科 王冠欽 醫師

 

王冠欽醫師與團隊合照


日前參加新思惟國際團隊舉辦的青年研究論壇,對於利用健保資料庫作研究最有興趣,開始找相關論文及書籍,正準備好好地鑽研一番……

 

某次月底提款時,覺得閒錢多出許多,轉念一想:「啊!因為這個月沒繳保護費 學費給蔡依橙校長啦!」才一打開電腦,就看到夢寐以求的「健保資料庫工作坊」開放報名,適才的閒錢幾乎馬上歸零!結果不到五小時便完銷,讓我直呼幸運,伴隨些許虛榮。

 

在上課之前,先買科普書「大數據」來看,發現 Big data 巨量資料是一門方興未艾的新學問。裡面提到,我們以往使用統計學,都是用樣本代替母體,所以才導出像「中央極限定理」等等來估計。

 

在巨量資料的領域,「樣本=母體」!這根本進入絕對領域,是以前無法作到的事!而且它著重的是相關性而非因果關係,某個程度來說,顛覆科學思維,也容忍「怪異資料」、容許小錯誤。

 

王冠欽醫師杯子與講義

 

直到上課後,經由陳育群醫師再剖析,更探其奧秘。健保資料庫是巨量資料的寶庫,它是強大的工具,但不是萬能工具。讓我想到反感的 實證醫學,充其量不過是個頗有用的工具,但無法解決所有臨床問題。

 

吳昭慶醫師剖析其「健保資料庫」處女作,正是讓我深刻地體會到兩位講師所謂的「想像力」!利用現有的資料,間接取代檢查及診斷,達到說服自己、說服審稿者、說服讀者的境界,雙雙打入人心。之後的論文寫作技巧,毫不藏私地分享,並以同篇範本論文為例,闡述「健保資料庫」的長處與限制,更加深印象。

 

即使蔡依橙校長宣稱,這門課由注音符號教起,但對於電腦白痴(遑論寫程式)、連研究新手都稱不上的我,實作時間確實較摸不著頭緒。幸好蔡瑋琳醫師深入淺出講解,讓我稍稍理解程式語言的奧妙與複雜。對我來說,這是此次課程最需要咀嚼與加強之處。

 

雖然這是門新學問,三位講師將大數據的觀念與方法,重重地灌進我們的腦袋中,非但是直入人心,更是穿腦入髓!許多大老無法接受 老師前輩被傳統觀念束縛而多所批評,但就像實證醫學中的 The Cochrane Library 一樣,在短短十年內 impact factor 極速竄升,成為顯學。

 

我相信,「得天獨厚」的台灣健保資料庫研究,亦有成為顯學的潛力。隨著越來越多研究者的努力與發揚光大,必能讓人敞開心胸接受,進而解決臨床問題,造福人群,世界大同

 

「直須看盡洛城花,始共東風容易別。」白話一點,就是王菲那首《紅豆》:「等到風景都看透,也許你會陪我看細水長流。」對於年輕研究者,缺乏資源的狀況下,遍尋各種研究方法,「健保資料庫」真是最值得陪伴終生的好伴侶伙伴!

 

 

找到終生好伙伴!最新課程由此去

 

 

本篇發表於 2014 / 03 / 30 (日), 未分類 並標籤為 , , , , , , , 。將永久鏈結加入書籤。