AI“胡說八道”?怎么解?

原創 | 文 BFT機器人?

圖片

01

引言

近年來,人工智能產業迅猛發展,大型語言模型GPT-4發展勢頭強勁,OpenAI推出ChatGPT、微軟推出Bing、馬斯克推出“最好的聊天機器人Grok”……科技巨頭紛紛入局AI領域,引入人工智能作為辦公工具的行業也越來越多。

人工智能的便利性,讓人們越來越依賴它的幫助,正因如此,AI的各項危機也逐漸浮現。人們在尋求AI幫助的時候,往往抱著信任的態度,而AI卻也可能會傳遞錯誤訊息。

02

什么是人工智能幻覺?

人工智能幻覺是指人工智能模型在處理數據或執行任務時產生的自我欺騙現象。

近日,劍橋詞典公布2023年度詞語:“Hallucinate”。這個詞的釋義原本為“似乎看到、聽到、感覺到或聞到一些不存在的東西,通常是因為健康狀況或因為你服用了某種藥物而產生幻覺”。但在AI時代的背景下,“Hallucinate”新增了一個注解:“當AI制造幻覺,它會產生錯誤訊息”。

劍橋詞典官方對選擇“Hallucinate”為年度代表詞做出了解釋:新含義“觸及了人們正在談論的AI核心”。

圖片

圖片來源:新浪網

“幻覺”的含義是:在沒有相應的外部或軀體刺激的情況下的感覺知覺,并根據其發生的感覺域進行描述。無論是否了解幻覺的本質,幻覺都可能發生。人工智能幻覺隱喻性地借鑒了這個概念,將人工智能產生的不準確信息描述為“幻覺”。

舉個例子:

1.圖像識別領域:一張包含斑點的狗的照片可能被錯誤地識別為豹子,這種錯誤識別即是幻覺的一種表現。

2.自然語言處理:人工智能模型可能產生語法不通或語義混亂的句子,甚至是完全無意義的文字。這可能導致誤解、信息錯誤傳達或者根本無法理解的輸出結果,稱為語言領域的幻覺。

人工智能幻覺有很多種類型,但所有這些都歸結為同一個問題:混合和匹配它們接受過訓練的數據,以生成一些全新的錯誤的東西。這些幻覺現象可能會對人工智能應用的可靠性和準確性造成嚴重影響。

圖片

03

人工智能的答案可信嗎?

生成式人工智能的誕生,推動了AI產業的發展,人們對于人工智能的評價多為肯定。人工智能聊天機器人擅長從不同來源收集信息,并將其以對話式、易于理解的格式合成。

但許多人在使用人工智能時,發現AI給出了不合理的結論,甚至是徹頭徹尾的謊言。AI的許多回應都很滑稽。例如,ChatGPT收集了很多公眾人物的出生和死亡日期,但無法明確表明他(她)已經死亡;它還聲稱有人徒步穿越英吉利海峽,金門大橋兩次穿越埃及;谷歌的巴德聲稱詹姆斯·韋伯太空望遠鏡拍攝到了太陽系以外行星的第一張圖像,而事實上,第一張此類圖像是由另一臺望遠鏡在2004年拍攝的。

這些例子引出了一個詞:“人工智能幻覺”。大型語言模型(LLM)生成的信息與現實的關系很微妙。其中一些內容似乎完全是捏造的,而另一些似乎借鑒事實虛構的,對于空白內容,人工智能會引用不相關內容填充。

調查顯示,這些不準確的回復內容在人工智能的應用中非常常見,而人類的反饋對于確保它們不會完全偏離軌道至關重要。

圖片

04

人工智能幻覺是怎么產生的?

目前,對于人工智能幻覺產生的原因眾說紛紜。研究人員認為,人工智能環境的現象與設計和測試期間數據提供不足有關。人工智能技術在不斷發展,但支持AI產品運轉的數據不充分,這會導致人工智能給出的答案偏離軌道。

另外,人工智能沒有情感,它們通過算法理解用戶的訴求,而有些問題人工智能無法理解,它們就有可能給出無意義或不準確的答案。

05

為什么人工智能幻覺是一個問題?

人工智能幻覺的產生根植于模型的處理復雜性以及對輸入數據的誤解。模型可能在處理數據時過于注重某些特定特征,而忽略了其他重要的上下文信息。

如今有數百萬人使用人工智能,有些人是出于好奇,有些人則把人工智能當做生活工作的工具,甚至有很多人非常依賴和信任人工智能。而人工智能平臺已經多次出現提供錯誤信息的現象,使人們對失誤的認知造成影響。

圖片

如果生活中的錯誤是小事,那么當人工智能用于關于生命的領域時,會直接影響到結果。例如:在醫療診斷中,人工智能模型的幻覺可能導致錯誤的疾病診斷,嚴重威脅患者的健康;在自動駕駛汽車領域,幻覺可能導致錯誤的環境感知,增加交通事故的風險。

人工智能幻覺也可能在社會層面引發問題。誤導性的信息輸出可能導致負面影響,例如在社交媒體傳播虛假新聞,影響公共輿論。

人工智能幻覺的問題不僅僅是技術發展中的攔路虎,更是社會發展中的潛在風險。

06

人工智能幻覺問題怎么解決?

在迎接人工智能時代的挑戰中,OpenAI提出的“過程監督”策略為解決“AI幻覺”問題提供了新的思路。通過獎勵大模型每個正確的推理步驟,而非簡單地獎勵最終答案,這一方法為人工智能的發展注入了更多的透明度和可信度。

圖片

圖片來源:新浪網

然而,我們作為使用者,同樣有責任保持警惕,不能完全信賴人工智能平臺給出的答案。要積極參與反饋,及時指出錯誤,讓技術人員盡快修補人工智能的漏洞,確保其他人在問相類似問題時人工智能不再給出錯誤答案。

另外,開發者也需要投入更多的時間測試人工智能、尋找更多的數據支持,讓模型盡可能多地熟悉數據,并不斷更新支持模型運轉的數據,確保模型數據來源的真實性。

注:部分圖片來源網絡

注:文章版權歸原作者所有,如有不妥,請聯系刪除。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/166004.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/166004.shtml
英文地址,請注明出處:http://en.pswp.cn/news/166004.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

合封芯片未來趨勢如何?合封優勢能否體現?

芯片已經成為現代電子設備的核心組件。為了提高系統的性能、穩定性和功耗效率,一種先進的芯片封裝技術——合封芯片應運而生。 合封芯片作為一種先進的芯片封裝技術,合封芯片是一種將多個芯片(多樣選擇)或不同的功能的電子元器件…

AIGC專題報告:生成式人工智能用例匯編

今天分享的是AIGC系列深度研究報告:《AIGC專題報告:生成式人工智能用例匯編》。 (報告出品方:德勤) 報告共計:16頁 生成式人工智能(AI)的興起 生成式AI給人類文明創造了無限的可…

文心一言 VS 訊飛星火 VS chatgpt (142)-- 算法導論12.1 2題

二、用go語言,二叉搜索樹性質與最小堆性質(見 6.1 節)之間有什么不同?能使用最小堆性質在 O(n)時間內按序輸出一棵有 n 個結點樹的關鍵字嗎?可以的話,請說明如何做,否則解釋理由。 文心一言: 在二叉搜索樹(Binary …

如何更有效地進行薪酬調查?

薪酬調查是企業管理中非常重要的一環,它不僅能夠幫助企業了解員工的薪酬情況,還可以為企業提供合理的薪酬標準,從而吸引和留住優秀人才。然而,進行薪酬調查并不是一項簡單的任務,需要有一定的方法和技巧,許…

ruoyi 若依框架采用第三方登錄

在項目中,前后端分離的若依項目,需要通過統一認證,或者是第三方協帶認證信息跳轉到本系統的指定頁面。需要前后端都做相應的改造,由于第一次實現時已過了很久,再次重寫時,發現還是搞了很長時間,…

PasteNow for mac剪貼板工具

PasteNow 是一款簡單易用的剪貼板管理工具,可幫助用戶快速存儲和管理剪貼板上的文本和圖片內容。用戶可以使用 PasteNow 軟件快速將文本內容保存到不同的筆記或頁面中,也可以方便地將剪貼板上的圖片保存到本地或分享給其他應用程序。 此外,P…

如何進行合理的股權激勵?

股權激勵是企業激勵員工和管理層的一種重要手段,通過向員工提供股權,可以將他們與企業利益緊密聯系在一起,激發員工的積極性和創造力,提高公司的績效和競爭力。然而,要實施合理的股權激勵,需要考慮多個因素…

vue 通過ref調用router-view子組件的方法

由于用的vue2.7版本,但用了vue3 setup的語法; 注意:是vue2的template結構,vue3的setup語法;非這種情況需要舉一反三。 處理方案: 1、對router-view加上ref template修改 直接對router-view加上ref&#x…

金蝶云星空和四化智造MES(WEB)單據接口對接

金蝶云星空和四化智造MES(WEB)單據接口對接 對接系統:四化智造MES(WEB) MES系統是集成生產管理、品質管理、設備管理、BI數據中心、庫存管理、工時管理、數據采集、看板管理等為一體的綜合性生產管理系統。通過強調制造…

wagtail-安裝配置

系列文章目錄 文章目錄 系列文章目錄安裝虛擬環境安裝wagtail查看安裝后的包 創建wagtail項目安裝依賴遷移創建超級用戶運行項目 安裝虛擬環境 https://blog.csdn.net/gsl371/article/details/117917857 安裝wagtail (wagenv) C:\djproject\wagprj>pip list Package V…

淘寶88vip退費問題

前一段時間,雙十一活動,想著開個淘寶的88vip領卷買東西會實惠一點,另外,它自帶的權益也不錯,有餓了嗎、網易云、優酷或者芒果的。但是到了當天發現,一個vip的卷也用不了,頓感什么惱火&#xff0…

synchronized的輕量級鎖居然不會自旋?

《Java并發編程的藝術》中說到「如果失敗,表示其他線程競爭鎖,當前線程便嘗試使用自旋來獲取鎖」,并且下文所配的流程圖中明確表示自旋失敗后才會升級為重量級鎖,但《深入理解Java虛擬機》又說「如果出現兩條以上的線程爭用同一個…

超聲波雪深傳感器冬季里的科技魔法

在冬季的某個清晨,當你打開大門,被厚厚的積雪覆蓋的大地映入眼簾,你是否曾想過,這片雪地的深度是多少?它又如何影響著我們的生活和環境?今天,我們將為你揭開這個謎團,介紹一款神秘的…

眼鏡清洗機原理是怎么樣的?2023年眼鏡清洗機推薦

在日常生活中有許多小伙伴是因為看太多書或者是看太多電子產品導致近視佩戴上了眼鏡,畢竟眼鏡佩戴上后就再也離不開它了,像日常佩戴的眼鏡上會積累非常多污垢以及堆積細菌,而我們手動清洗眼鏡時不能除菌也不能清潔到縫隙中,像眼鏡…

thingsboard的WebSocket API的使用

1、參考文檔 Working with telemetry data | ThingsBoard Community Edition 2、訂閱的命令 我們需要訂閱不同的數據,那么該如何來填寫參數呢,你需要參考后端代碼 TelemetryPluginCmdsWrapper 以及訂閱返回的結果參考類:TelemetrySubscriptionUpdate 鏈接地址: https:/…

error: ‘for‘ loop initial declarations are only allowed in C99 or C11 mode

在使用for循環時,在循環內定義變量,出現如下錯誤 [Error] ‘for’ loop initial declarations are only allowed in C99 or C11 mode [Note] use option -stdc99,-stdgnu99,-stdc11 or-stdgnu11 to compile your code 出現這個錯誤…

使用Pytorch從零開始構建GRU

門控循環單元 (GRU) 是 LSTM 的更新版本。讓我們揭開這個網絡的面紗并探索這兩個兄弟姐妹之間的差異。 您聽說過 GRU 嗎?門控循環單元(GRU)是更流行的長短期記憶(LSTM)網絡的弟弟,也是循環神經網絡&#x…

極智AI | LLM大模型部署框架之OpenLLM

歡迎關注我的公眾號 [極智視界],獲取我的更多經驗分享 大家好,我是極智視界,本文來介紹一下 LLM大模型部署框架之OpenLLM。 邀您加入我的知識星球「極智視界」,星球內有超多好玩的項目實戰源碼下載,鏈接:https://t.zsxq.com/0aiNxERDq 由于 LLM 大模型在模型結構、模型規…

圖像評價之計算PSNR、SSIM、MSE、LPIPS和NIQE評價指標

文章目錄 鏈接說明代碼峰值信噪比結構相似性均方誤差學習感知圖像塊相似性自然圖像質量評估器 鏈接 GitHub 倉庫 如果代碼對你的研究有所幫助,請為該倉庫點上小星星。 說明 PSNR、SSIM、MSE和LPIPS是有監督指標,計算時必須是兩對圖像參與;…

安索夫矩陣(ANSOFF)

👉安索夫矩陣是策略管理之父安索夫博士于1957年提出的營銷策略模型,該模型以“產品”和“市場”作為兩大基本面,提出了4種不同組合下的營銷策略,是營銷分析中應用最廣泛的工具之一。其主要邏輯是通過選擇4種不同的成長性策略來實現…