General??
隨著車聯網的發展,汽車越來越智能化,就像是一部“裝著四個輪子的手機”。
有人說,智能手機就如同一部竊聽器,無論你開機或者關機,它都會無時不刻地監聽著用戶的一舉一動。
可想而知,智能車輛上的信息安全問題可能比智能手機更加嚴重。比如車輛的定位信息、相機所記錄下的路端畫面、車艙內的乘客錄音錄像等等,這些數據作為智能車發展的“燃料劑”,既是不可或缺的,又需要去避免敏感數據的泄露風險。
隨著各種數據安全法規的頒布,數據脫敏處理引起各大主機廠的重點關注。
何謂數據脫敏
一般來說,數據脫敏技術指的是在對敏感數據進行處理的過程中,通過數據變形的方式來降低數據的敏感程度的一種數據處理技術。
在大數據時代下,數據脫敏技術并不是什么新鮮技術,它在其它領域中已經被廣泛應用,比如政務、金融、醫療、電信等。
在自動駕駛領域,中汽協發布的《汽車傳輸視頻及圖像脫敏技術要求與方法》也定義了數據脫敏,其主要指通過一定方法在車端數據處理設備上消除原始環境數據中的敏感信息,使得信息主體無法被識別或者關聯,且處理后的信息不能被復原,同時保留目標環境業務所需的數據特征或內容的數據處理過程。
如何進行數據脫敏
那么,了解了何為數據脫敏后,智能汽車中具體是如何進行數據脫敏的?在數據脫敏的過程中,又需要注意哪些事項?
關于數據脫敏的具體步驟,某主機廠信息安全工程師介紹道:“數據脫敏主要處于數據全生命周期的處理環節,
首先,技術人員需要對數據做好分類分級,并把敏感數據識別出來,要確定哪些數據屬于敏感數據字段;
其次,需要確定具體的脫敏策略;
再者,將制定好的脫敏方案給到執行者,執行設定好的脫敏方案;
最后,在數據脫敏執行完畢后,對于整個數據的執行過程也會有一些審計工作。”
敏感數據的分類分級
從宏觀層面來看,敏感數據主要可分為3類:
結構化數據、非結構化數據及半結構化數據。
結構化數據是指可通過二維表結構來表達和實現的數據,比如銀行賬號、身份證號碼、手機號、日期等;
非結構化數據是指數據結構不規則或不完整,沒有預定義的數據模型,比如圖像、聲音、文本等;
半結構化數據是指介于完全結構化數據和完全無結構的數據之間的數據,比如HTML文檔、JSON、XML等。
智能汽車行業目前尚未形成細化的數據分類分級標準,主機廠需要根據自身的實際業務需求,從不同場景、不同功能等維度出發,去做敏感數據的分類。
同時,在分類完后,主機廠仍需要根據不同等級的敏感程度,對數據進行分級(如一般、重要、敏感),并對不同級別采取不同的脫敏策略。
選擇合適的脫敏策略
在智能汽車行業中,目前還沒有形成統一的脫敏技術規范,各家主機廠在采用相關技術或策略時,都借鑒了一些已出臺的信息安全相關標準規范,如《信息安全技術個人信息去標識化指南》。
不同類型的數據所對應的脫敏算法和脫敏策略都不同。 根據《汽車傳輸視頻及圖像脫敏技術要求與方法》中的介紹,非結構化數據(如人臉、車牌)一般采用的是統一色塊的脫敏算法,即用統一色塊對視頻中每一幀中的人臉和車牌位置信息進行替換,通過色塊替換直接擦除原圖上像素級別數據,確保擦除后的數據信息不可逆和不可復原。
而掩碼、取整等脫敏算法主要用于車主的身份信息、自車的車牌號、車控數據等結構化數據。以車主的個人姓名為例,需要應用映射技術(Hashing)將車主名“張三”變為對應的hash值“456684923”。
圖:部分結構化數據相關的脫敏算法示例
讓脫敏對自動駕駛系統的影響最小化
1. 首先,數據脫敏的最終目的是減少或消除敏感信息,從而減小數據安全帶來的風險,而不是阻礙自動駕駛的發展,敏感數據在進行脫敏后仍然需要保留目標的基礎語義信息。
車輛在采集完數據后,數據并不一定需要存儲或者傳輸到后端,自動駕駛系統只需要識別出前方目標物具體是什么,根本沒必要識別出目標物中的人的面部特征、年齡甚至性別,或者這輛車是什么品牌、車型或車身細節。
2. 其次,現階段先做感知融合、再做數據脫敏的方案是對整個自動駕駛系統的影響是最小的,也是較為可行的方案。如果數據是先融合后再脫敏,不僅不會降低融合的效果,也可以減少時延的影響。
3. 此外,融合后甚至可以直接銷毀敏感信息,減少不必要的存儲空間占用,但從感知到控制的整個過程中,由于數據未脫敏,數據傳輸過程需要加入一些數據加密的措施,這對加密算法的強度要求較高,最終會導致數據處理難度會加大。
數據在全生命周期中需要加密
通常來說,數據脫敏僅在數據處理環節出現,但實際上,數據脫敏其實在數據的整個生命周期中都是存在的。
數據的全生命周期包括采集、傳輸、存儲、使用、共享、銷毀。
法規需求
國際法規:GDPR (General Data Protection Regulation)
GDPR于 2018 年 5 月 25 日生效。GDPR 是一套管理整個歐盟 (EU) 個人數據隱私的準則和政策。GDPR 的主要目標是統一和協調組成聯盟的許多州的數據隱私保護。
GDPR 范圍包括但不限于以下內容:
基本個人信息,身份信息,聯系信息,財務信息,健康和醫療數據,遺傳和生物特征數據,網絡和電子數據,就業和職業信息,種族或民族數據,政治和宗教信仰,性取向和性別認同,犯罪記錄。
國內法規:《汽車數據通用要求》
圖像脫敏技術與應用
圖像脫敏技術是使用人工智能、像素干擾、特征提取與干擾、信息隱藏、數據加密與變換等脫敏技術,改變像素的亮度、對比度以及色彩、駕駛員的面部特征,對車牌號進行脫敏處理,使其在保持可用性的同時,不再包含個人身份或其它敏感信息。圖像脫敏技術主要應用在車內監控、全景地圖數據處理、自動駕駛、數據共享與研究等方面。
此外還可應用數據脫敏(Data Masking)、匿名化(Anonymization)、去標識化(de-identification)技術,在數據全生命周期各階段實現保護敏感數據的目的。
脫敏算法說明
通過統一色AI算法(深度卷積神經網絡算法…)進行關鍵信息的識別:

