資料管理與開放共享.pdf
- 8. 資助機構/經費補助單位
美國
2023年1月開始,資料管理與共享將成為NIH(National Institutes of Health)資助研
究的一項要求,以資料共享為最大原則,例外允許有正當理由的限制,並且鼓勵使用
既有的研究資料庫來保存和共享資料,如NIH推薦的openICPSR。
https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-013.html
英國
UKRI七個提供研究經費資助的委員會,皆要求申請計畫時須提交資料管理和共享計畫,
遵循良好的研究資料管理實踐,並以資料共享最大化為原則。獲取ESRC資助的研究人
員,在資助結束後的三個月內,須將研究資料寄存於UK Data Service。
https://www.ukri.org/manage-your-award/publishing-your-research-findings/making-your-research-data-open/
- 18. 建立檔案結構
檔案名稱
- 簡短而有意義
- 使用檔名來分類檔案類型
- 避免使用空格、點和特殊字符
(&, ?, !)
- 可適時利用連接號(-) 或底線(_)
區隔
- 避免太長的檔名
- 可加入版本識別
ORGANIZE
and
DOCUMENT
- 21. 資料處理
資料品質控管
檢查資料檔的完整性(變項數、
樣本數)
執行邏輯和一致性檢核
- 檢查數值範圍(找出不合理值)
- 檢查變項間邏輯關係
自動化檢查
- 電腦輔助調查系統
(CAPI , CATI, CAWI)
- 編寫自己的檢誤程式/語法
資料修正與轉換
PROCESS
檔案格式轉換
短期資料處理檔案格式
建議選用資料分析軟體
- Excel (* .xls)
- SPSS (* .sav)
- STATA (* .dta)
長期資料保存檔案格式
對於長期保存而言,標準、開放
且廣泛使用的格式是可長久讀取
- ASCII (* .txt,* .dat)
- CSV (* .csv)
Save as
另存新檔
- 22. 資料儲存
儲存媒體
隨身碟、外接式硬碟
雲端儲存服務
- Dropbox
- Google Drive
- Microsoft OneDrive
NAS(網路儲存伺服器)
- 可組RAID機制,降低因單顆硬
碟損壞造成資料損毀的風險。
STORE
儲存與備份
檔案不要壓縮,用無版權或開放
標準的格式存放
製定備份策略,即使是短期的研
究也要有兩種不同的備份媒體,
例如隨身碟搭配雲端硬碟
定 期 回 頭 審 視 備 份 資 料 , 每 隔
2~5年將所有檔案轉移到新的儲
存媒體
將紙本資料全部改製為PDF/A格
式,適合長期保存
最佳選擇 — 將資料寄存至SRDA
- 23. 資料保護
研究倫理與資料保護
資料蒐集前
- IRB(Institutional Review Boards)人類研究倫理審查委員會
- 確保研究參與者知情同意
- 知情同意是為了要告知參與者研究的目的、風險、可能的利益及研究外的其他選擇。這些資
訊的提供不僅止於招募參與者之前,也應在整個研究過程中甚至研究結束後繼續進行
整個過程中
- 研究倫理:遵循所有與研究相關的行為規範。例如:尊重研究參與者、保護其個資隱私、論
文不抄襲造假等
資料蒐集後
- 應對所蒐集的資料內容進行評估,並進行相對處理,以確保不會影響研究參與者之權利。
PROTECT
- 24. 個資、隱私資料評估 PROTECT
• 姓名、身分證號碼、護照號碼/機構名稱和統一編號
• 個人聯絡資訊:電話號碼、地址、EMAIL、電腦IP位址
直接識別資料
• 連續變項:身高、體重或收入等
• 文字變項開放題:學校系所或行職業等過於詳盡的文字描述
間接識別資料
• 地理資訊層級小於(含)村里、文字敘述提及特定位置或機構
詳細地理資訊
• 樣本母體是特定身份,像是職棒球員、原住民族或受刑人等
樣本特性明確
• 經由其他變項(如學校規模、學生數或學校位置等)與外部資料
(如教育部統計資料)的串連,可能會有識別特定學校之風險
外部資料串連
- 32. s r d a . s i n i c a . e d u . t w
S R D A