站在浪潮之巔,回顧健保資料庫的前世今生。

 

作者:台南新樓醫院 神經內科 謝鎮陽 醫師

相關文章:[快訊] 謝鎮陽醫師團隊回顧台灣健保資料庫研究發展,獲 Clinical Epidemiology 刊登!

 

 

 

 

大約十年前,我進入成大臨藥科技所攻讀博班,在高雅慧老師的指導下,開始接觸健保資料庫的相關研究,與我同時期進入這領域的人,還有同所的賴嘉鎮老師,以及嘉義基督教醫院的宋昇峯醫師。這幾年下來,我們有了一些研究成果,也同時經歷了許多跟健保資料庫有關的風風雨雨

 

在一個因緣際會下,我們起心動念,寫了這一篇有關健保資料庫的文獻回顧文章,不只是總結我們走過的路,更希望它在全部移轉到「衛生福利資料科學中心」(俗稱加值中心)之後,健保資料庫的研究者,在撰寫研究方法時,若提到資料庫與加值中心,能夠有一篇又新又好的工具性文章,可以參考引用。

 

 

健保資料庫的前世今生

 

本文的第一個部分,是向讀者說明台灣健保資料庫的「前世」,包括何時問世、資料庫結構概論、當時的使用方式等等,還有它的「今生」,在公民團體的訴訟壓力下,國衛院資料停止攜出,全部轉移到加值中心之後,除了原本的健保申報資料之外,還增添了哪些大型、全國性的衛生福利資料庫,像是癌症登錄、國民健康訪查。我們也提到,在加值中心內如何連結各種資料庫,提供研究者產出更高水準的成果。

 

 

 

 

面對兩個常見批評,提供正向觀點。

 

文章的第二部分,我們提出台灣健保資料庫的兩個常見批評:fishing expedition、validation。前者還曾上過國際學術版面,對此,我們試圖提供一個中立的描述與反思;針對後者,我們則做簡單的文獻回顧,洋洋灑灑地整理出一個大表格,呈現過去包括我們在內,許多健保資料庫研究者,在確立診斷正確性上所做的努力,被驗證過的疾病,包括:中風、心肌梗塞、癌症、各種胸腔疾病和靜脈曲張。

 

除了證明資料證確性之外,也歡迎研究同好,善用此表格,為您的健保資料庫研究在方法上加分。

 

 

 

 

如何處理那些「干擾因子」?

 

健保資料庫研究另一個常見的問題,就是存在著「未被測量的干擾因子」 (unmeasured confounders),例如我們的資料庫當中,缺乏疾病嚴重度這個重要變項,可能會干擾研究結果,產生偏誤(bias)。

 

對此,我們向讀者展示了過去發展或使用過的一些方法,例如「中風嚴重度指標」,還有「傾向分數校正法」。前者,算是我們團隊原創的;而後者,是我們參考過去別人的做法,再加以改良精進的

 

 

資料庫連結,成為強大的研究引擎。

 

展望未來,我們提供了一個藍圖:在加值中心,以健保資料庫為核心,連結其他各種大型的衛生福利資料庫。

 

個人認為,資料庫連結這部分,台灣算是在全世界走得相當前面的,這算是我們的強項,真不該妄自菲薄。

 

 

 

 

而藉著人工智慧與自然語言處理等技術創新,希望有朝一日,我們還能進一步探索一些「非結構性資料」,例如電子病歷系統的文字探勘(text mining)。

 

總之,未來健康大數據研究,還有無限的可能,需要我輩持續開拓與耕耘,就讓我們一起繼續努力吧!

 

 

最新活動

 

 

本篇發表於 2015 / 11 / 15 (日), 傑出榮耀 並標籤為 , , , , , , 。將永久鏈結加入書籤。