衛福部 vs 國衛院
問:如果已經申請了衛福部的健保資料庫(200 萬人抽樣檔),在資料處理上,和國衛院的健保資料庫檔案會有什麼不同嗎?需要注意哪些事呢?
答:衛福部的 200 萬人抽樣檔,人數不同,抽到的人也不同。以健保資料庫檔案欄位而言,國家衛生研究院提供欄位較多,但是衛福部的 200 萬人抽樣檔,另外提供出生通報檔、死因統計檔、癌症登記檔等等,相當難得,各有好壞。
不同次購買的資料是否可以串聯
問:聽說每次購買都是用不同的方式鎖碼,所以就算是同樣一百萬人的資料,若分次購買則無法 link 起來?那這樣子如何把每年的新資料和舊資料串起來呢?
答:依照申請人別申請可以串舊資料。
非資訊背景,如何瞭解資料庫
問:只懂醫療,但是對於程式語言、統計並不是非常專門。要如何去了解資料庫的內容?
答:找有經驗者,從作中學是最快的。
健保資料庫與其他資料庫結合
問:請問如何和其他資料庫結合? ex. 死亡檔、自殺資料庫、或是老人健檢資料?
答:請找「衛生福利部加值中心」。
用藥效果差異查詢?
問:如何調查「用藥效果差異」類的資料?
答:確定研究問題,了解資料,擬定研究設計,小心選擇統計方法。
請參考我們過去的研究:
Huang CC, Chen YC, Leu HB, Chen TJ, Lin SJ, Chan WL, Chen JW. Risk of adverse outcomes in Taiwan associated with concomitant use of clopidogrel and proton pump inhibitors in patients who received percutaneous coronary intervention. (經皮冠狀動脈介入治療後同時使用clopidogrel與氫離子阻斷劑之副作用研究) American Journal of Cardiology 2010;105:1705-9. [SCI] [PMID:20538118]
如何找到最正確的診斷碼資料?
問:從 MySQL 擷取資料的過程,有沒有新手容易發生的邏輯錯誤?如何避免?(不是單指SQL 語法,而是健保資料庫專屬的陷阱。) 健保資料庫上的診斷碼不一定符合我們需求,如何找到最正確的診斷碼資料?
答:
最重要的,要請教有經驗者。
了解資料:資料內容,多與醫行室健保申報人員 double check,如果跨領域,建議與各領域專家確認一下。健保給付常常更動,健保碼也常常更換,必須花時間長期注意,資料有部分的 coding error,在處理過程中就應該小心檢視。
以下這篇文章,我們突破了「腎臟科研究一定要有病理報告的迷思」,利用健保資料庫探討不同腎臟病的腎衰竭發生情形。CJASN,impact factor = 5.1,台灣一年約被刊登 4 篇。
Tsai TC, Chen YC, Lo CW, Wang WS, Lo SS, Tang GJ, Thien PF. Incidence and renal survival of ESRD in the young Taiwanese population. (台灣年輕族群末期腎臟病之發生率與腎臟存活期研究) Clinical Journal of the American Society of Nephrology 2014;9: 302-309. [SCI]
Reviewer 一開始看到是資料庫文章,嗤之以鼻,我們把資料處理寫在 appendix 裡,詳盡仔細。
最新活動