法醫物證多人身份鑒定問題
小驢數模
?
犯罪現場法醫物證鑒定是關系到國家安全、公共安全、人民生命財產安全和社會穩定的重大問題。目前法醫物證鑒定依賴DNA分析技術不斷提升。DNA檢驗的核心是STR(Short Tandem Repeat,短串聯重復序列)分析技術,STR的核心序列重復次數存在個體差異多態性,因此STR也被稱為細胞的DNA指紋。
STR基因座是染色體上一個特定的物理位置,等位基因是同一基因座上不同表現形式的DNA序列。在STR圖譜中,每一個主峰代表一個等位基因,其size表示該STR等位基因的DNA片段長度,不同size對應不同的等位基因,height是峰高,反映該等位基因的DNA量,可用于判斷樣本是否為混合樣本。每個個體在每個基因座上擁有兩個等位基因,基因型指的是個體基因座上等位基因的組合,不同個體的基因型常不同,因此可檢查特定基因座上的基因型來進行身份鑒定。
對于多人犯罪案件中的DNA物證,其混合STR圖譜的分析是案件偵破的關鍵。混合STR圖譜中包含了多人的DNA信息,需要正確分析混合數據中各組分的貢獻者構成和比例,作為案情判斷依據之一。
請你們團隊研究解決下面問題:
問題1 混合STR圖譜分析的首要問題是判斷貢獻者人數。貢獻者人數的正確與否決定著分析結果的準確率。依據附件1中混合STR圖譜數據(如圖1所示)設計算法或模型,用于識別某一混合樣本中的貢獻者人數,并評估其準確性。
問題2 在分析出貢獻者人數后,還需要判斷各貢獻者的混合比例。當貢獻者比例接近時,等位基因可能重疊,導致誤判基因型。明確比例有助于更精準地分析混合圖譜。依據附件2中混合ST圖譜數據(如圖2所示)設計算法或模型,用于識別某一混合樣本中的貢獻者比例,并評估其準確性。
?
圖2 2人混合圖譜拆分示意圖
問題3 根據附件1與附件2的混合STR圖譜數據以及附件3中各個貢獻者的基因型,設計算法或模型,用于推斷某一混合STR圖譜中各個貢獻者對應的基因型,并評估其準確性。
問題4 依據附件4中混合STR圖譜數據(如圖3所示)設計算法或模型,用于減少混合樣本中噪聲的干擾,以提高混合樣本分析的準確性。
?
圖3 2人混合圖譜降噪示意圖
數據集及其說明見附件:
鏈接:https://pan.baidu.com/s/1aNpk0oONWA6w7JR7-PYGFg?pwd=3uu6?提取碼: 3uu6
獲取免費思路關注b站賬號 小驢數模
?