Title
題目
Hashimoto’s thyroiditis recognition from multi-modal data via globalcross-attention and distance-aware training
通過全局交叉注意力機制和距離感知訓練從多模態數據中識別橋本氏甲狀腺炎
01
文獻速遞介紹
橋本氏甲狀腺炎(HT),也被稱為慢性淋巴細胞性甲狀腺炎,是一種當免疫系統攻擊甲狀腺時發生的慢性炎癥(特雷比洛德等人,2022)。它被認為是一種典型的器官特異性自身免疫性疾病,其特征是由自身免疫介導的甲狀腺破壞(拉代蒂,2014)。橋本氏甲狀腺炎的發展進程會導致甲狀腺功能的波動,早期表現為甲狀腺功能亢進,后期則表現為甲狀腺功能減退(克盧博-格維茲金斯卡和沃托夫斯基,2022;邱等人,2021)。橋本氏甲狀腺炎不僅會影響甲狀腺功能,還會增加患腫瘤的風險(費爾特-拉斯穆森,2020;胡等人,2022)。因此,及時診斷橋本氏甲狀腺炎對于預防和治療這些病癥具有重要意義。 甲狀腺超聲圖像能夠揭示甲狀腺組織的特征,在橋本氏甲狀腺炎的識別中起著關鍵作用(佩德森等人,2000;吳等人,2016)。然而,超聲檢查的診斷性能本質上具有主觀性,因為它在很大程度上取決于操作人員的專業知識、技術熟練程度和解讀能力。此外,設備分辨率和準確性的差異會進一步引入可變性,這可能會顯著影響操作人員對超聲圖像的解讀,并降低診斷的可靠性。 在橋本氏甲狀腺炎患者的超聲圖像中,超聲檢測到的病變的某些特征與正常超聲特征相比存在細微差異,這給精確區分帶來了重大挑戰。如圖1(a)所示,橋本氏甲狀腺炎的超聲圖像通常顯示出異質背景,這對于準確診斷橋本氏甲狀腺炎至關重要。異質背景相對于周圍肌肉可能表現出回聲增強,而正常甲狀腺組織通常比相鄰肌肉組織顯示出更高的回聲性(林等人,1986)。因此,在某些超聲圖像中,健康和患病的甲狀腺組織之間的回聲性存在細微差異。鑒于操作人員的固有主觀性以及這些特征的細微性,臨床醫生僅依靠對超聲特征的肉眼評估時,很容易誤診橋本氏甲狀腺炎。因此,建立客觀的診斷方法對于提高橋本氏甲狀腺炎診斷的準確性和一致性勢在必行。 近年來,深度學習(DL)已廣泛應用于醫學圖像分析(張等人,2023),并且在從超聲圖像診斷橋本氏甲狀腺炎方面取得了重大進展。已經提出了許多卷積神經網絡(CNN)用于診斷橋本氏甲狀腺炎,并且取得了優異的性能。例如,侯等人(2021)在橋本氏甲狀腺炎超聲數據集上對密集連接網絡(DenseNet)(黃等人,2017)進行了微調并驗證了其性能,結果表明神經網絡在橋本氏甲狀腺炎診斷方面有超越臨床醫生的潛力。趙等人(2022)比較了各種卷積神經網絡架構的性能,如VGG(西蒙揚和齊斯曼,2014)和高效網絡(EfficientNet)(譚和樂,2019),以基于甲狀腺超聲圖像識別橋本氏甲狀腺炎。然而,如圖1(b)所示,某些超聲圖像顯示出異質背景且可能存在回聲性降低的情況,這兩者對于準確診斷橋本氏甲狀腺炎都至關重要。由于正常甲狀腺和患橋本氏甲狀腺炎的甲狀腺之間存在細微差異,從超聲圖像中區分可能存在回聲性降低的異質背景是很復雜的。此外,異質背景會影響對微小結節的識別(樸等人,2013),微小結節也具有可能的回聲性降低的特征。因此,簡單的基于卷積神經網絡的方法可能難以在橋本氏甲狀腺炎診斷中取得最佳性能。 此外,由于橋本氏甲狀腺炎不僅會影響甲狀腺,還會影響其他器官,相關生物指標的波動使得利用這些指標進行橋本氏甲狀腺炎診斷成為一種有前景的方法。許多研究表明,相關生物指標的波動與橋本氏甲狀腺炎密切相關(佳文等人,2021;圖塔爾等人,2022;胡等人,2021;耿等人,2023)。布拉多斯卡等人(2019)研究了橋本氏甲狀腺炎對左側頂葉白質(PWM)和后扣帶回(PCG)代謝改變的影響,并發現特定代謝物比率與游離三碘甲狀腺原氨酸(FT3)和游離甲狀腺素(FT4)水平之間存在顯著相關性。瓦利謝夫斯卡-普羅索爾等人(2021)利用事件相關電位(ERP)和磁共振波譜(MRS)研究了甲狀腺功能正常的橋本氏甲狀腺炎患者的腦功能障礙及其與生物指標的相關性,如促甲狀腺激素(TSH)、抗甲狀腺過氧化物酶自身抗體(aTPO)等。吳等人(2023)證明,橋本氏甲狀腺炎主要通過內分泌和免疫途徑影響骨質疏松癥的發生和發展,并且促甲狀腺激素可以調節和促進甲狀腺素(T4)和三碘甲狀腺原氨酸(T3)的產生和分泌。拉古薩等人(2019)認為,橋本氏甲狀腺炎的診斷可以通過循環中的自身抗體水平來確定,如抗甲狀腺過氧化物酶抗體(aTPO)和抗甲狀腺球蛋白抗體(ATG)。這些生物指標與橋本氏甲狀腺炎之間的關聯為臨床醫生診斷橋本氏甲狀腺炎提供了有意義的指導。然而,單獨來看,這些關系并非絕對。如圖1(c)和(d)所示,盡管生物指標確實與橋本氏甲狀腺炎相關,但從單個指標的角度來看,這些關系并非絕對,所以僅依靠這些異常生物標志物不足以診斷橋本氏甲狀腺炎。將超聲圖像和生物指標相結合,為橋本氏甲狀腺炎的診斷提供了一種很有前景的方法。盡管整合來自這兩種模態的信息在橋本氏甲狀腺炎診斷中取得了優異的性能(張等人,2022),但在處理這種非絕對關系方面仍然效果不佳。此外,有限的生物指標數據可能會損害模型的泛化能力,并且直接使用生物指標可能會導致性能不佳。 受超聲圖像的內在特征以及橋本氏甲狀腺炎患者相關生物指標的啟發,我們從以下幾個方面考慮來提高模型診斷橋本氏甲狀腺炎的能力:(1)卷積神經網絡通過強大的歸納偏置有效地捕捉局部信息,其中較低卷積層的特征提供詳細信息,而較高層則專注于語義內容(于等人,2018)。Transformer(瓦斯瓦尼,2017)通過自注意力機制捕捉全局上下文信息。在超聲圖像中,Transformer可以捕捉全局背景信息(楊和楊,2023)。因此,設計一種結合卷積神經網絡和Transformer優勢的方法是有益的,通過利用來自不同卷積層的詳細特征和語義特征來實現信息互補。(2)盡管從單個指標的角度來看,相關生物指標與橋本氏甲狀腺炎之間存在非絕對關系,但大多數非橋本氏甲狀腺炎患者的生物指標通常在正常范圍內,而橋本氏甲狀腺炎患者的生物指標更有可能超出正常范圍。另一個角度是更有效地從生物指標中提取有價值的信息,并處理橋本氏甲狀腺炎與相關生物指標之間的非絕對關系。此外,期望有效地擴充有限的生物指標數據,從而提高模型的性能。 為了實現上述目標,本文提出了HTR-Net,這是一種通過多模態信息嵌入,從超聲圖像和生物指標中識別橋本氏甲狀腺炎的新型網絡。鑒于可能存在回聲性降低的異質背景對橋本氏甲狀腺炎的診斷至關重要,并且相關生物指標可以部分反映疾病的發生情況,HTR-Net利用卷積神經網絡和Transformer架構的優勢來識別異質背景,并將超聲圖像與生物指標相結合,以提高橋本氏甲狀腺炎診斷的準確性。HTR-Net采用一個Transformer分支來捕捉異質背景的全局結構信息,并引入一個全局交叉注意力(GCA)模塊來融合卷積神經網絡分支中不同卷積層的特征圖,以識別回聲性降低的復雜特征。我們將超聲圖像與生物指標相結合以實現信息互補,從而提高橋本氏甲狀腺炎診斷的準確性。為了減輕有限生物指標帶來的不利影響,提出了一種距離感知不匹配增強(DMA)策略來擴充生物指標數據。此外,為了應對從單個指標角度來看橋本氏甲狀腺炎與生物指標之間非絕對關系的挑戰,提出了一種距離感知損失(DL)函數來約束生物指標的特征映射,從而提高模型識別異常生物指標的能力。我們的主要貢獻總結如下: - 我們提出了一種新型的橋本氏甲狀腺炎識別網絡,即HTR-Net,它通過多模態信息嵌入融合了超聲圖像和生物指標的信息。 - 引入了全局交叉注意力模塊,用于融合不同卷積層的特征圖,并整合來自異質背景的詳細信息和語義信息,從而增強對可能存在回聲性降低的異質背景的識別能力。 - 提出了距離感知不匹配增強策略,以有效地擴充有限的生物指標數據,同時根據其正常范圍為增強后的指標保持合理的值。此外,還引入了距離感知損失函數,通過約束指標映射函數來處理橋本氏甲狀腺炎與生物指標之間的非絕對關系。 - 我們構建了一個多中心跨模態橋本氏甲狀腺炎數據集,并進行了廣泛的實驗。實驗結果表明,與當前用于診斷橋本氏甲狀腺炎的主流方法相比,我們的HTR-Net取得了當前最優(SOTA)的性能。 本文的結構安排如下。第2節介紹相關工作,第3節介紹HTR-Net,第4節給出實驗和結果,第5節進行討論,最后第6節給出結論。
Aastract
摘要
Ultrasound images and biological indicators, which reveal Hashimoto’s thyroiditis (HT) characteristics inthyroid tissue from different perspectives, play crucial roles in HT recognition. Ultrasound images of patientswith HT typically present a heterogeneous background with potential decreases in echogenicity. Cliniciansare prone to misdiagnosing HT by visually evaluating these characteristics. In addition, patients with HT mayexhibit fluctuations in relevant biological indicators, but there are no absolute relationships between a singlebiological indicator and HT. To address these challenges, we propose HTR-Net, a novel HT recognition networkthat combines ultrasound images and biological indicators through multi-modality information embedding.Specifically, HTR-Net introduces a global cross-attention module (GCA), which enhances recognition of theheterogeneous background with potential decreases in echogenicity. A distance-aware mismatched augmentation (DMA) strategy is also designed to expand the limited biological indicator data and ensure reasonablevalues for the augmented biological indicators, thus enhancing the model performance. In order to address thenonabsolute relationship between HT and a single biological indicator, we propose a distance-aware loss (DL)function to constrain feature mapping for effective information extraction from indicators, thereby enhancingthe model’s capability to detect anomalous sets of biological indicators. To validate the proposed method, weconstruct a multi-center HT dataset and conduct extensive experiments. The experimental results demonstratethat the proposed HTR-Net achieves state-of-the-art (SOTA) performance.
超聲圖像和生物指標從不同角度揭示了甲狀腺組織中橋本氏甲狀腺炎(HT)的特征,在橋本氏甲狀腺炎的識別中起著至關重要的作用。患有橋本氏甲狀腺炎的患者的超聲圖像通常呈現出異質的背景,并且可能存在回聲性降低的情況。臨床醫生僅通過肉眼評估這些特征時,很容易誤診橋本氏甲狀腺炎。此外,橋本氏甲狀腺炎患者的相關生物指標可能會出現波動,但單一生物指標與橋本氏甲狀腺炎之間并沒有絕對的關聯。 為了應對這些挑戰,我們提出了HTR-Net,這是一種全新的橋本氏甲狀腺炎識別網絡,它通過多模態信息嵌入的方式將超聲圖像和生物指標結合起來。具體而言,HTR-Net引入了全局交叉注意力模塊(GCA),該模塊增強了對可能存在回聲性降低的異質背景的識別能力。我們還設計了一種距離感知的不匹配增強(DMA)策略,以擴充有限的生物指標數據,并確保增強后的生物指標具有合理的值,從而提升模型的性能。 為了解決橋本氏甲狀腺炎與單一生物指標之間的非絕對關系問題,我們提出了一種距離感知損失(DL)函數,用于約束特征映射,以便從生物指標中有效提取信息,進而增強模型檢測異常生物指標組的能力。 為了驗證所提出的方法,我們構建了一個多中心的橋本氏甲狀腺炎數據集,并進行了廣泛的實驗。實驗結果表明,所提出的HTR-Net取得了當前最優(SOTA)的性能。
Method
方法
Fig. 2 illustrates the overall architecture of HTR-Net, which consists of a CNN branch, a Transformer branch, and a fusion branch,followed by a multi-modality embedding module. In the transformerbranch, shown in Fig. 2(A), HTR-Net employs Swin Vision Transformer(SwinT) (Liu et al., 2021) to extract global information. In the CNNbranch, shown in Fig. 2(B), HTR-Net utilizes ResNet18 to extract localinformation. In the fusion branch, depicted in Fig. 2(C), HTR-Netintegrates detailed and semantic information about the heterogeneousbackground using the GCA module. The DMA strategy is implementedin HTR-Net, as shown in Fig. 2(D). In addition, late fusion is employedto combine features from both ultrasound images and biological indicators. The DL function is used to incorporate the normal rangesof biological indicators as an additional supervisory signal, therebyconstraining the feature mapping of biological indicators during thetraining process.
圖2展示了HTR-Net的整體架構,它由一個卷積神經網絡(CNN)分支、一個Transformer分支和一個融合分支組成,隨后是一個多模態嵌入模塊。在圖2(A)所示的Transformer分支中,HTR-Net采用了Swin視覺Transformer(SwinT)(劉等人,2021)來提取全局信息。在圖2(B)所示的CNN分支中,HTR-Net利用殘差網絡18(ResNet18)來提取局部信息。在圖2(C)所描繪的融合分支中,HTR-Net使用全局上下文注意力(GCA)模塊來整合關于異質背景的詳細信息和語義信息。如圖2(D)所示,直接內存訪問(DMA)策略在HTR-Net中得以實現。此外,采用后期融合的方式來合并來自超聲圖像和生物指標的特征。深度損失(DL)函數被用于將生物指標的正常范圍納入其中,作為一個額外的監督信號,從而在訓練過程中約束生物指標的特征映射。
Conclusion
結論
In this paper, we present HTR-Net, a novel network for HT diagnosis using ultrasound images and biological indicators via multi-modalinformation embedding. In HTR-Net, the GCA module is proposed tofuse the features generated by both CNN and transformer branchesto recognize the structural and intrinsic information of heterogeneousbackground with potential decreases in echogenicity from ultrasoundimages. In addition, the DMA strategy is designed to expand the limited biological indicator data, ensuring the diversity of the biologicaldata while maintaining reasonable values of the augmented biologicalindicators, effectively enhancing the performance of the model. To fullyutilize the biological indicator data, the DL function is introduced toconstrain the feature mapping of biological indicators, thereby addressing the nonabsolute relationships between biological indicators and HT,and enhancing the model’s ability to recognize anomalous samples.Extensive experiments conducted on our multi-center dataset demonstrate that HTR-Net outperforms mainstream methods, highlightinggreat potential for HT diagnosis in clinical practices.
在本文中,我們提出了HTR-Net,這是一種通過多模態信息嵌入,利用超聲圖像和生物指標進行甲狀腺炎(HT)診斷的新型網絡。在HTR-Net中,我們提出了全局上下文注意力(GCA)模塊,用于融合由卷積神經網絡(CNN)分支和Transformer分支生成的特征,以便從超聲圖像中識別存在潛在回聲性降低的異質背景的結構信息和內在信息。此外,我們設計了直接記憶訪問(DMA)策略來擴充有限的生物指標數據,在保持擴充后的生物指標合理數值的同時,確保生物數據的多樣性,從而有效地提升了模型的性能。為了充分利用生物指標數據,我們引入了深度損失(DL)函數來約束生物指標的特征映射,從而解決生物指標與甲狀腺炎之間并非絕對相關的問題,并增強了模型識別異常樣本的能力。在我們的多中心數據集上進行的大量實驗表明,HTR-Net的表現優于主流方法,凸顯了其在甲狀腺炎臨床診斷方面的巨大潛力。 ?
Figure
圖
Fig. 1. The first row presents ultrasound images of HT patients. Image (a) depicts aheterogeneous background, while image (b) shows a general decrease in echogenicityalong with a heterogeneous background. Identifying both characteristics is essentialfor the diagnosis of HT. The second row illustrates the normalized distributionsof biological indicators. Panels (c) and (d) represent the distributions of biologicalindicators for patients without HT and with HT, respectively. Green data pointsindicate the biological indicators are within normal ranges, whereas orange pointsrepresent those exceeding normal ranges. Notably, some biological indicators of HTpatients fall within normal ranges, while certain indicators from non-HT patients displayabnormal values. This observation highlights that the relationships between HT andits associated biological indicators are not absolute for the diagnosis of HT whenconsidered individually
圖1:第一行展示了橋本氏甲狀腺炎(HT)患者的超聲圖像。圖像(a)顯示了一個異質背景,而圖像(b)則呈現出整體回聲性降低且伴有異質背景的情況。識別出這兩種特征對于診斷橋本氏甲狀腺炎至關重要。第二行展示了生物指標的歸一化分布情況。圖(c)和(d)分別代表了非橋本氏甲狀腺炎患者和橋本氏甲狀腺炎患者的生物指標分布。綠色的數據點表示生物指標處于正常范圍內,而橙色的數據點代表那些超出正常范圍的指標。值得注意的是,一些橋本氏甲狀腺炎患者的生物指標處于正常范圍內,而某些非橋本氏甲狀腺炎患者的指標卻顯示出異常值。這一觀察結果表明,在單獨考慮時,橋本氏甲狀腺炎與其相關生物指標之間的關系對于診斷橋本氏甲狀腺炎而言并非絕對。
Fig. 2. The architecture of HTR-Net. HTR-Net is structured as a dual-branch approach, integrating both CNN branch and Transformer branch. (A) represents the architecture ofSwin Transformer tiny version, (B) represents the local information extracted by ResNet18. (C) represents the fusion branch and GCA modules serve as bridges between CNN andTransformer branches, and (D) represents biological indicator process with DMA strategy, alongside DL function.
圖2:HTR-Net的架構。HTR-Net采用雙分支結構,融合了卷積神經網絡(CNN)分支和Transformer分支。(A)表示小版本的Swin Transformer架構,(B)表示由ResNet18提取的局部信息。(C)表示融合分支,全局交叉注意力(GCA)模塊充當了CNN分支和Transformer分支之間的橋梁,(D)表示運用距離感知不匹配增強(DMA)策略以及距離感知損失(DL)函數的生物指標處理過程。
Fig. 3. Architecture of GCA module. Initially, the local feature map is input into the module for dimension reduction and feature map division, followed by processing throughlinear projection of flattened patches. Subsequently, the flattened patches are input into cross-attention module in conjunction with the global feature vector to output the globalcross feature.
圖3:全局交叉注意力(GCA)模塊的架構。首先,將局部特征圖輸入到該模塊中進行降維和特征圖劃分,隨后通過對展平后的圖塊進行線性投影處理。接著,將展平后的圖塊與全局特征向量一起輸入到交叉注意力模塊中,以輸出全局交叉特征。
Fig. 4. DMA strategy for biological indicator data. 𝑆 + represents the HT biologicalindicator subset, 𝐼𝑚𝑎𝑡𝑐? represents the matched set of biological indicators correspondingwith ultrasound image 𝑈𝑐 , 𝐼**𝑚𝑖𝑠𝑚𝑐? represents a set of biological indicators with eachelement randomly selected from different patients in 𝑆 +, and 𝐼𝐷𝑀𝐴 represents thereweighting value of 𝐼𝑚𝑎𝑡𝑐? and 𝐼𝑚𝑖𝑠𝑚𝑐?
圖4:用于生物指標數據的距離感知不匹配增強(DMA)策略。(S^+)表示橋本氏甲狀腺炎(HT)生物指標子集,(I{match})表示與超聲圖像(U_c)相對應的匹配生物指標集,(I{mismatch})表示一個生物指標集,其每個元素都是從(S^+)中的不同患者中隨機選取的,而(I{DMA})表示(I{match})和(I_{mismatch})的重新加權值。
Fig. 5. Comparison of ROC and PR curves for different single-modality models
圖5:不同單模態模型的受試者工作特征曲線(ROC)和精確率-召回率曲線(PR)的對比
Fig. 6. Comparison of box plots for different models. (a)–(n) represent the results of GoogleNet, ViT, CrossViT, ResNet50, ResNet152, DenseNet121, DenseNet161, HT-RCM,HTC-Net, GBCNet, Sononet, Hifuse, MedViT, and HTR-Net(Single-Modality), respectively
圖6:不同模型的箱線圖對比。(a)至(n)分別代表谷歌網絡(GoogleNet)、視覺Transformer(ViT)、交叉視覺Transformer(CrossViT)、殘差網絡50(ResNet50)、殘差網絡152(ResNet152)、密集連接網絡121(DenseNet121)、密集連接網絡161(DenseNet161)、HT-RCM、HTC-Net、GBCNet、Sononet、Hifuse、醫學視覺Transformer(MedViT)以及HTR-Net(單模態)的結果。
Fig. 7. Comparison of confusion matrix for different multi-modality models. (a)–(c)represent the results of HTR-Net (Single-Modality), HTNet and HTR-Net (MultiModality), respectively
圖7:不同多模態模型的混淆矩陣對比。(a)至(c)分別表示HTR-Net(單模態)、HTNet以及HTR-Net(多模態)的結果。
Fig. 8. Comparison of t-SNE visualization for different multi-modality models. (a)–(c) represent the t-SNE results of HTR-Net (Single-Modality), HTNet and HTR-Net (Multi-Modality),respectively.
圖8:不同多模態模型的t分布隨機鄰域嵌入(t-SNE)可視化對比。(a)至(c)分別表示HTR-Net(單模態)、HTNet和HTR-Net(多模態)的t-SNE結果。
Fig. 9. Comparison of accuracy and F1 score curves for different hyperparameter 𝛼.
圖9:不同超參數(\alpha)下的準確率和F1分數曲線對比
Fig. 10. Grad-CAM heatmaps of HTR-Net. The green box highlights the heterogeneous background, and the red box indicates a decrease in echogenicity. Panels A and B representsthe heterogeneous background, while panels C and D represents the background with a decrease in echogenicity. (a)–(c) represent the original ultrasound image, heatmaps fromResNet18, and HTR-Net (Single-Modality), respectively
圖10:HTR-Net的類激活映射(Grad-CAM)熱圖。綠色方框突出顯示了異質背景,紅色方框表示回聲性降低。A和B面板展示了異質背景,而C和D面板展示了回聲性降低的背景。(a)至(c)分別表示原始超聲圖像、來自殘差網絡18(ResNet18)的熱圖以及HTR-Net(單模態)的熱圖。
Fig. 11. PCA Visualization of Mapped Features from the Biological Indicator Validation Dataset under Different Configurations of the DMA Strategy and DL Function. Panels(a)–(c) represent the PCA results of the mapped features of the validation dataset obtained from models trained under the following configurations: (a) using the original biologicalindicators, (b) using the original biological indicators combined with the DL function, and (c) using the augmented biological indicators generated by integrating the DMA strategywith the DL function.
圖11:在直接內存訪問(DMA)策略和深度學習(DL)函數的不同配置下,來自生物指標驗證數據集的映射特征的主成分分析(PCA)可視化。圖(a)至(c)分別表示從以下配置訓練的模型中獲得的驗證數據集映射特征的PCA結果:(a)使用原始生物指標;(b)使用結合了深度學習函數的原始生物指標;(c)使用通過將直接內存訪問策略與深度學習函數相結合而生成的增強生物指標。
Table
表
Table 1Detailed statistic information of HT dataset
表1 ?橋本氏甲狀腺炎(HT)數據集的詳細統計信息
Table 2Performance of single-modality models (%).
表2 單模態模型的性能(%)
Table 3 Classification performances
表3 分類性能
Table 4Performance of HTR-Net in different gender subgroups (%).
表4 HTR - Net在不同性別亞組中的性能(%)。
Table 5Performance of HTR-Net in different age subgroups (%)
表5:HTR-Net在不同年齡亞組中的性能表現(%)
Table 6Performance of individual and different fusion approaches (%).
表6 單個模型以及不同融合方法的性能表現(以百分比表示)
Table 7Delong test of individual and different fusion methods
表7:單個模型以及不同融合方法的德龍(Delong)檢驗結果?
Table 8Effect of DL function and DMA strategy (%)
表8 深度學習函數和直接內存訪問策略的效果(%)
Table 9Performance of HTR-Net with different hyper-parameters 𝛼 (%).
表9:具有不同超參數(\alpha)的HTR-Net的性能表現(%)
Table 10Performance in external dataset (%)
表10 在外在數據集上的性能表現(%)
Table 11Model complexity comparison.
表11 模型復雜度比較。