如何解決機器翻譯的“幻覺“問題（Hallucination）？

如何解決機器翻譯的“幻覺“問題（Hallucination）？

bicheng/2025/8/22 6:20:52/文章來源:https://blog.csdn.net/cui_yonghua/article/details/150487678

更多內容請見：機器翻譯修煉-專欄介紹和目錄

文章目錄

- 一、數據層面優化
- 二、模型架構改進
- 三、訓練策略調整
- 四、評估與迭代
- 五、前沿方向與挑戰
- 六、案例：WMT2023幻覺緩解方案

機器翻譯中的“幻覺”（Hallucination）指模型生成與源文本語義無關、邏輯矛盾或事實錯誤的翻譯內容，尤其在低資源場景、長文本或復雜句式中更為突出。解決這一問題需從數據、模型、訓練策略、評估與后處理等多維度綜合施策。

一、數據層面優化

數據清洗與過濾
- 噪聲去除：剔除平行語料中的低質量翻譯（如機器翻譯生成的語料、語法錯誤樣本），使用語言模型（如BERT）或翻譯質量評估工具（如COMET）篩選高置信度數據。
- 領域適配：針對特定領域（如法律、醫療）構建專用語料庫，避免模型因領域偏移產生幻覺。例如，WMT比賽中的“術語一致性”任務要求模型嚴格遵循領域術語表。
數據增強與合成
- 回譯（Back-Translation）：通過目標語言到源語言的反向翻譯生成偽平行語料，增加數據多樣性。但需控制回譯質量，避免引入錯誤（如使用強模型如mBART進行回譯）。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/94056.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/94056.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/94056.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

基于STM32+NBIOT設計的宿舍安防控制系統_264

基于STM32+NBIOT設計的宿舍安防控制系統_264

文章目錄 1.1 項目介紹【1】開發背景【2】實現需求【3】項目硬件模塊組成【4】設計意義【5】國內外研究現狀【6】摘要 1.2 系統總體設計【1】系統功能需求分析【2】系統總體方案設計【3】系統工作原理 1.3 系統框架圖 1.4 系統功能總結 1.5 系統原理圖 1.6 實物圖 1.7…

閱讀更多...

SLAM文獻之-Globally Consistent and Tightly Coupled 3D LiDAR Inertial Mapping

SLAM文獻之-Globally Consistent and Tightly Coupled 3D LiDAR Inertial Mapping

一、簡介該論《Globally Consistent and Tightly Coupled 3D LiDAR Inertial Mapping》是日本先進工業科學技術研究所（AIST）的Koide等人于2022年在IEEE國際機器人與自動化會議（ICRA）上發表的一篇論文。該研究提出了一種基于全局…

閱讀更多...

【STM32】HAL庫中的實現（七）：DMA（直接存儲器訪問）

【STM32】HAL庫中的實現（七）：DMA（直接存儲器訪問）

DMA 是什么？ DMA（Direct Memory Access）是外設直接和內存之間數據搬運的機制，不需要 CPU 參與。 ? 舉個例子：傳統方式： ADC → CPU → RAM 使用 DMA：ADC → DMA → RAM（CPU 不需干…

閱讀更多...

【LeetCode熱題100道筆記+動畫】字母異位詞分組

【LeetCode熱題100道筆記+動畫】字母異位詞分組

題目描述給你一個字符串數組，請你將字母異位詞組合在一起。可以按任意順序返回結果列表。示例 1: 輸入: strs = [“eat”, “tea”, “tan”, “ate”, “nat”, “bat”] 輸出: [[“bat”],[“nat”,“tan”],[“ate”,“eat”,“tea”]] 解釋：在 strs 中沒有字符串可…

閱讀更多...

【Kafka】常見簡單八股總結

【Kafka】常見簡單八股總結

為什么使用消息隊列？ 解耦： 我以我的一段開發經驗舉例： 【Kafka】登錄日志處理的三次階梯式優化實踐：從同步寫入到Kafka多分區批處理我做過一個登錄日志邏輯，就是在登錄邏輯末尾，加一段寫進數據庫登錄日志…

閱讀更多...

微信小程序連接到阿里云物聯網平臺

微信小程序連接到阿里云物聯網平臺

目錄準備階段阿里云配置下載mqtt.min.js文件小程序實現注意小程序配置服務器域名概述：介紹使用微信小程序連接到阿里云平臺的快捷方法和完整過程。阿里云平臺建立設備，提供mqtt連接參數，小程序借助mqtt.min.js，也就是基于Github下…

閱讀更多...

2-3〔O?S?C?P? ? 研記〕? 漏洞掃描?AppScan（WEB掃描）

2-3〔O?S?C?P? ? 研記〕? 漏洞掃描?AppScan（WEB掃描）

鄭重聲明： 本文所有安全知識與技術，僅用于探討、研究及學習，嚴禁用于違反國家法律法規的非法活動。對于因不當使用相關內容造成的任何損失或法律責任，本人不承擔任何責任。如需轉載，請注明出處且不得用于商業盈利。 …

閱讀更多...

LeetCode 刷題【47. 全排列 II】

LeetCode 刷題【47. 全排列 II】

47. 全排列 II 自己做解1：檢查重復 class Solution { public:void circle(vector<int> nums, vector<vector<int>> &res,int start){int len nums.size();if(start len - 1){ //到頭了//檢查重復bool is_exist fa…

閱讀更多...

Https之(一)TLS介紹及握手過程詳解

Https之(一)TLS介紹及握手過程詳解

文章目錄簡介 TLSTLS第一次握手1.Client HelloTLS第二次握手2.Server Hello3.Certificate4.Server Hello DoneTLS第三次握手5.Client Key Exchange6.Change Cipher Spec7.Encrypted Handshake MessageTLS第四次握手8.New Session Ticket9.Change Cipher Spec10.Encrypted Hands…

閱讀更多...

【WEB 】從零實現一個交互輪播圖（附源碼）

【WEB 】從零實現一個交互輪播圖（附源碼）

文章目錄一、輪播圖整體功能規劃二、HTML結構深度解析三、CSS樣式實現細節1. 定位系統詳解2. 顯示/隱藏機制3. 按鈕交互效果實現4. 純CSS箭頭實現5. 指示器：當前位置可視化四、JavaScript邏輯深入解析1. 核心變量與DOM獲取2. 圖片切換函數（核心邏輯&am…

閱讀更多...

機器學習--PCA降維

機器學習--PCA降維

一核心部分 1解決的問題：應對高維數據帶來的計算量大、冗余信息多、易出現過擬合等問題，在減少數據維度的同時盡可能保留原始數據的關鍵信息。2核心思想&#xff1a…

閱讀更多...

leetcode 1277. 統計全為 1 的正方形子矩陣中等

leetcode 1277. 統計全為 1 的正方形子矩陣中等

給你一個 m * n 的矩陣，矩陣中的元素不是 0 就是 1，請你統計并返回其中完全由 1 組成的正方形子矩陣的個數。示例 1：輸入：matrix [[0,1,1,1],[1,1,1,1],[0,1,1,1] ] 輸出：15 解釋： 邊長為 1 的正方形有…

閱讀更多...

知識蒸餾 - 各類概率分布

知識蒸餾 - 各類概率分布

知識蒸餾 - 各類概率分布 flyfish一、離散概率分布離散分布描述的是取值為離散值（如0,1,2,…）的隨機變量的概率規律，通常用概率質量函數（PMF） 表示某一取值的概率。 1. 伯努利分布（Bernoulli Distribution…

閱讀更多...

軟件測試-Selenium學習筆記

軟件測試-Selenium學習筆記

""" 目標： driver.find_element() 需求： 1. 使用driver.find_element()方法 2. 輸入用戶名：admin 3. 輸入密碼：123456 """ # 導包 from selenium import webdriver from time import …

閱讀更多...

知微傳感3D相機上位機DkamViewer使用：給相機升級固件

知微傳感3D相機上位機DkamViewer使用：給相機升級固件

寫在前面本人從事機器視覺細分的3D相機行業。編寫此系列文章主要目的有： 1、便利他人應用相機，本系列文章包含公司所出售相機的SDK的使用例程及詳細注釋；2、促進行業發展及交流。知微傳感Dkam系列3D相機可以應用于定位分揀、焊接焊縫提取、…

閱讀更多...

CMake進階: CMake Modules---簡化CMake配置的利器

CMake進階: CMake Modules---簡化CMake配置的利器

目錄 1.簡介 2.為什么需要 CMake Modules？ 3.內置模塊：開箱即用的工具 3.1.依賴查找模塊（FindXXX.cmake） 3.2.功能檢測模塊（CheckXXX.cmake） 3.3.通用工具模塊（如 FetchContent.cmake、CT…

閱讀更多...

【Docker】Ubuntu上安裝Docker（網絡版）

【Docker】Ubuntu上安裝Docker（網絡版）

【Docker】Ubuntu上安裝Docker注意：一、環境準備1. 系統要求2. 卸載舊版本二、安裝步驟1.配置倉庫源2.安裝 Docker引擎3.驗證安裝情況三、解決報錯1、檢查網絡連接2、檢查Docker服務狀態3、換源4.重載生效、重啟服務、查看是否配置成功5.驗證解決情況四、權限與配置…

閱讀更多...

Socket 編程 TCP

Socket 編程 TCP

TCP 網絡程序和剛才 UDP 類似. 實現一個簡單的英譯漢的功能。TCP是面向字節流的可靠傳輸，如同前文的管道流，只要是流，它的操作就是文件的寫出與讀入。TCP socket API 詳解下面介紹程序中用到的 socket API,這些函數都在 sys/socket.h 中。so…

閱讀更多...

使用AWS S3 + Lambda + MediaConvert 實現上傳視頻文件并自動轉碼

使用AWS S3 + Lambda + MediaConvert 實現上傳視頻文件并自動轉碼

前言最近團隊在做短視頻平臺的技術調研，其中有一個環節便是音視頻開發，即對用戶上傳的視頻進行自適應轉碼。自適應的原理其實就是預先將視頻轉換為幾個常用的分辨率，app端根據用戶手機分辨率拉取相應分辨率的視頻。目前嘗試了兩種方案&…

閱讀更多...

QT之QWaitCondition降低cpu占用率，從忙等待到高效同步

QT之QWaitCondition降低cpu占用率，從忙等待到高效同步

在多線程編程中，線程間的同步是一個核心問題。在處理線程等待時，經常會寫出高CPU占用率的代碼，其中最典型的就是使用忙等待（busy waiting）。本文將詳細介紹如何使用Qt框架中的QWaitCondition類來優雅地解決這一問題&am…

閱讀更多...

最新文章