最終產出
- 數據資產清單
- 包含所有數據資產的詳細目錄,列出數據集名稱、描述、所有者、格式、存儲位置和元數據。
- 用途:幫助政府部門清晰了解數據資產分布和狀態。
- 數據質量報告
- 數據質量評估結果,記錄準確性、完整性、一致性等問題及改進建議,基于政府認可的數據質量框架(如英國數據質量框架)。
- 用途:為AI應用提供高質量數據基礎,提升分析和決策效率。
- 元數據集合
- 標準化的元數據記錄,涵蓋數據來源、結構、更新頻率和使用權限,發布至政府指定平臺(如英國API目錄)。
- 用途:提高數據可發現性和可訪問性,支持跨部門共享。
- 數據共享與訪問方案
- 安全數據共享機制(如Delta Sharing或數據清潔室)的實施計劃,包含API接口或平臺訪問方式,符合政府標準(如英國GDS API標準)。
- 用途:確保數據在隱私保護下可安全共享和訪問。
- 數據治理框架
- 數據所有權、角色責任和生命周期管理規范,明確從創建到銷毀的管理流程,符合政府政策(如英國數據所有權模型)。
- 用途:確保數據合規性、可持續性和長期治理。
- 技術實施文檔
- 使用的技術工具(如數據湖、治理平臺)和配置說明,包含操作指南和維護計劃。
- 用途:支持政府部門持續使用和優化數據資產。
- 價值展示報告
- 案例分析或試點項目報告,展示數據梳理如何提升公共服務效率、政策制定或AI應用效果(如USCIS使用Delta Sharing的案例)。
- 用途:證明服務價值,增強政府信任和合作意愿。
- 培訓與支持材料
- 針對政府部門的數據使用培訓手冊、操作指南或工作坊計劃。
- 用途:幫助部門克服文化障礙,有效利用梳理后的數據資產。
數據類別
可能涉及的數據類別及分類方法
方法A
數據類別
-
按敏感性/影響程度分類: 這是政府數據最常見的分類方式,直接關系到數據的保護級別。
- 絕密 (Top Secret): 未經授權披露可能對國家安全造成極其嚴重損害的數據 1。例如,高度敏感的國家安全信息、政府情報信息 3。
- 機密 (Secret): 未經授權披露可能對國家安全造成嚴重損害的數據 1。
- 秘密 (Confidential): 未經授權披露可能對國家安全造成損害的數據 1。這包括受法律、法規或合同保護的數據,如高度敏感的個人身份信息 (PII)、受保護健康信息 (PHI)、支付卡行業數據 (PCI DSS) 和聯邦稅務信息 (FTI) 3。
- 受限 (Restricted): 未經授權披露可能導致重大損害或傷害的數據,或嚴重影響機構履行法定職能的能力 3。這通常需要保密協議 (NDA) 保護 4。
- 內部 (Internal): 僅限組織內部使用,需有限控制保護的數據,如員工手冊、公司政策和內部備忘錄 4。
- 公開 (Public): 可供公眾隨時訪問的數據,無需額外控制 3。例如,政府開放數據網站上的信息、營銷或宣傳材料 3。
-
按數據類型分類:
- 個人數據 (Personal Data): 任何與已識別或可識別的自然人相關的信息 3。
- 特殊類別個人數據 (Special Categories of Personal Data): 涉及種族或民族血統、健康數據、性生活或性取向、遺傳數據、生物識別數據等高度敏感的個人數據 3。
- 非個人數據 (Non-Personal Data): 不包含個人身份信息的數據 3。
-
按結構化程度分類:
- 結構化數據 (Structured Data): 具有預定義格式和組織的數據,如關系型數據庫中的數據。
- 半結構化數據 (Semi-structured Data): 具有一定結構但不如結構化數據嚴格的數據,如XML或JSON文件。
- 非結構化數據 (Unstructured Data): 沒有預定義結構的數據,如文本文檔、圖像、音頻和視頻。
分類方法
數據分類通常結合自動化和人工方法。自動化方法可以通過規則(如正則表達式)來識別信用卡號等敏感信息 4。然而,技術難以理解數據的上下文,因此數據所有者(負責數據的業務負責人或部門)的人工標記至關重要 4。數據所有者負責根據預期用途分配適當的分類級別,并將其職責移交給數據保管員,由保管員負責應用相應的安全控制措施 。
方法B
數據類別
-
行政管理數據
- 描述:與政府日常運營相關的數據,如財務記錄、人事檔案、采購合同、項目管理數據。
- 示例:預算分配、員工考勤、供應商信息。
-
公共服務數據
- 描述:支持公共服務的核心數據,如醫療、教育、社保、交通等領域的服務記錄。
- 示例:患者健康記錄、學校學生信息、公共交通流量數據。
-
政策與決策支持數據
- 描述:用于政策制定、規劃和評估的數據,如統計數據、調查結果、經濟指標。
- 示例:人口普查數據、失業率統計、環境監測數據。
-
地理與空間數據
- 描述:與地理位置相關的數據,如地圖、土地使用、城市規劃數據。
- 示例:GIS地圖、基礎設施位置、災害風險區域。
-
安全與執法數據
- 描述:涉及公共安全、執法和司法的數據,如犯罪記錄、監控數據、法律文件。
- 示例:犯罪案件記錄、交通違章數據、法院判決書。
-
開放與共享數據