作者:大千醫院 核醫科 蘇宣銘 主任
你哪位?
說實在,我只是個路人,前年起不小心在 Facebook 上看到蔡校長的文章,驚為天人深受吸引後偷偷 Follow (羞),去年 11 月校長開始討論 NHIRD,我也開始一頭鑽進這個神奇的世界,也很幸運的(?)在今年初申請過了衛福部的NHIRD,又很幸運的(無誤) 上了 NHIRD 的課程。課程的豐富實用自不在話下,不過它主要是針對國衛院的情境,我一開始以為差不多,沒想到我進入衛福部的時候遇到很多挫折,正巧又很幸運的(無誤) 上了物超所值的大林慈濟之簡報課,課後我跟校長反應(抱怨?) 其中的種種挫折和克服的過程,校長邀我寫一些分享心得,遂有此文。
阿講五四三的那麼多,衛福部和國衛院是差在哪?
以下是主要差別:
資料申請
– 衛福部:對每個檔案的每個欄位都要填寫申請的理由 (簡單理由即可,但是要跟所申請的研究主題有關),衛福部有權不提供申請者所申請之欄位。
– 國衛院:包裹式,欄位選擇較多。
資料內容
– 衛福部:
- 如果申請者符合條件 (IRB 和受試者同意書) 可以提供「受試者身分證串接 NHIRD」的服務。
- 和國衛院相比,有很多獨門的檔案,例如癌症登記檔、多重死因檔、延遲申報死因檔、罕見疾病通報資料庫、人工生殖資料庫、原住民檔 (數種)、問卷檔 (數種)等等。
- 提供 200 萬人抽樣檔 (有兩類:2000 年和 2005 年),人口結構和台灣戶政資料一樣,且資料經過 data cleaning,類似國衛院的抽樣歸人檔,但是人數多一倍且不用分段購買,一次買就是 200 萬人,價錢也便宜 (不到五千元)。
– 國衛院:
- 不提供「受試者身分證串接 NHIRD」。
- 部分檔案取得,相對衛福部容易,且成本低些,例如中醫藥檔、牙醫、糖尿病、精神疾病住院病患歸人檔、復健治療、職業病與職業傷害等等。
- 抽樣歸人檔有三類:2000、2005 和 2010 年,每類 100 萬人且分段購買,每段 4 萬或 5 萬人一張光碟片,一張光碟片要新台幣 500 元。
資料使用
– 衛福部:
- 申請通過之後,衛福部會根據你提出的申請和他們通過的欄位,製作專屬於你的檔案,放進專屬於你的硬碟裡面,然後送到你申請的那間健康加值中心(以下簡稱中心),然後你才可以去使用,可想而知要花不少時間 XD
- 使用前,必須跟健康加值中心提出申請,約定一個平常日的上午或下午時段,每個時段 4 小時且索價新台幣 900 元!時間就是金錢!
- 第一次進去中心要製作掛牌,在中心的期間都要配戴,且只有申請案裡面有列出的人員可以申請掛牌。
- 中心的電腦採用 Windows 和內建 SAS,但是沒有網路!也不能帶自己的紙、筆、書本、手機、相機、電腦、隨身碟,連水壺都不可以帶進去電腦房!
- 打開中心的電腦後,全部 NHIRD 的檔案都是 SAS 的格式!(崩潰!這就是我最大的挫折來源……)
- 分析出來的結果,要用隨身碟帶出來……你想得美咧!要把程式碼和分析結果存在一個特定的資料夾,且分析結果有兩個條件,一個是個案資料不予攜出 (就是不能出現以人為資料的表格),另一個是僅可攜出超過兩單位之統計分析結果 (如果有條件設太嚴導致結果出現 1,那這個表格就再見了) (再度崩潰)
- 分析結果符合條件還不夠,還要填寫一張攜出資料申請單,經過衛福部的審查,通過之後才會寄到你指定的email,審查時間至少三天!(完全崩潰)
– 國衛院:
- 我雖然沒有申請它的經驗,但是時間應該會比衛福部快多了 XD
- 直接拿到光碟,既不用申請使用時間,在使用規範內,可以放進自己做研究專用的電腦!
- 分析的軟體和結果的處理都隨你高興!
聽你唬爛啦!衛福部管那麼嚴格,你要怎麼把 Navicat 裝進去的?
是的,鴨蛋密密也有縫……(才怪啦!)
我是光明正大裝進去的!
事情是這樣的,必須事先把 Navicat 交給中心的管理員,經過審查後,管理員會幫你安裝到專屬於你的硬碟裡面,前提是,軟體必須能 Offline 安裝 (中心的電腦不能連上網路!)
如果你有任何檔案 (word、excel、txt、程式碼、其他軟體等等) 想放進去專屬於你的硬碟裡面,也是一樣的方法。
你騙我不懂!衛福部的檔案是 SAS 格式,Navicat 是使用 MySQL 的關聯式表格,兩個根本不一樣,哪能用 Navicat 分析 SAS 檔案呢?
所以,就要學警察先生闖 649 啊!(誤)
是的,這就是我最大的挫折來源……明明學的是 Navicat,但是眼睛看到的卻是 SAS。(杯具)
所幸經過 Google 的指點,我找到了一條路,SAS 檔案先轉成 csv 檔,再把 csv 檔匯入 MySQL,之後 Navicat 就可以見客了!
說的比唱的好聽,嘴巴講講我也會,是要怎麼操作啊?
今年初,我學了 SAS 的入門課,那三天的學習超級痛苦的,畢竟我不是資訊科系出身,我知道新思惟之友臥虎藏龍,一定有很多高人,但我也相信其他多數人應該都跟我一樣,對於程式碼有一種不親切感。
所以,我直接公布程式碼。(如果有高人看到,請不要電我電太兇……)
< SAS 轉成 csv >
libname nhird ‘D:\H103xxx\H103xxxdata’; /*做一個連結,叫它nhird,連到存放SAS檔案的資料夾*/
proc export /*把H_nhi_ipdte94的SAS檔案轉成IPDte94.csv而且存在D:\H103xxx\裡面*/
data = nhird.H_nhi_ipdte94
outfile = ‘D:\H103xxx\IPDte94.csv’
dbms = csv
replace;
run;
< csv 匯入 MySQL >
第一步驟:做一個 table
DROP DATABASE IF EXISTS nhird;
CREATE DATABASE nhird DEFAULT CHARACTER
SET = ‘ascii’ COLLATE = ‘ascii_general_ci’;
USE nhird;
DROP TABLE IF EXISTS IPDte94; #針對每個欄位做設定,設定可以參考譯碼簿
create table IPDte94 (
ID char(9),
HOSP_ID char(6),
FEE_YM char(6),
APPL_TYPE char(1),
APPL_DATE char(8),
CASE_TYPE char(2),
SEQ_NO char(8),
BIRTH_YM char(6),
FUNC_TYPE char(2),
IN_DATE char(8),
OUT_DATE char(8),
E_BED_DAY char(8),
S_BED_DAY char(8),
ICD9CM_1 char(5),
ICD9CM_2 char(5),
ICD9CM_3 char(5),
ICD9CM_4 char(5),
ICD9CM_5 char(5),
ICD_OP_CODE1 char(4),
ICD_OP_CODE2 char(4),
ICD_OP_CODE3 char(4),
ICD_OP_CODE4 char(4),
ICD_OP_CODE5 char(4),
DRUG_DOT char(8),
MED_DOT char(8),
PART_DOT char(8),
APPL_DOT char(8),
PART_NO char(8),
ID_S char(1),
CITY char(4),
HOS char(2)
) ;
第二步驟:使用匯入精靈
- 打開 Navicat 和存放 csv 的資料夾。
- 把 csv 檔案 拖曳 到剛剛創好的 table。
- 這時候,Navicat 會出現 匯入精靈,記得「欄位分隔字元」設為逗號(,),「文字限定元」選「無」即可。
- 再等一下,就匯入完畢了!(恭喜)
- 全部檔案都匯入,從此就可以開心地使用Navicat做分析了!(灑花)
你不要想唬我,Navicat 試用期限 14 天,而且要連上網路才能註冊,超過 14 天你叫我用屁啊?
您真內行!所以,請在 14 天把資料分析完畢!(拖走!給我打!)
不是啦!事情還是有轉圜的!
先進入 Navicat 的客戶中心,點選 Support Ticket
然後,把您的困難提出來。
以下就是我跟Navicat交手的紀錄,提供您做參考,最後 Navicat 提供了 offline 註冊的方法。
好吧,算你有點誠意,今天就這樣好了。
謝謝啦,感恩~
最新活動