GenAI 技術(例如 AI 代理和 DeepSeek)的快速迭代導致企業抱有不切實際的期望。本研究借鑒了我們與中國 AI 領導者就常見的 GenAI 陷阱進行的討論,并提供了最終有助于成功采用的建議。
主要發現
-
接受調查的首席信息官表示,生成式人工智能(GenAI)是 2025 年企業資金增加的主要技術領域。與 2024 年相比,2025 年中國企業對 GenAI 的投資平均將增加 40.3%?。
-
58%的受訪中國企業正在探索GenAI。GenAI的用例范圍廣泛,涵蓋編碼、對話助手、圖像和視頻生成、摘要、工作流自動化、寫作以及數據和分析。然而,74% 的企業將尋找具有重大商業價值的 GenAI 用例視為其最大的挑戰。
-
中國企業在 GenAI 的應用方面雄心勃勃,但生產部署進展緩慢。截至 2024 年 6 月,中國僅有 8% 的企業在生產中部署了 GenAI,僅比 2023 年 4 月的 6% 增長了 2%。這遠低于全球企業 20% 以上的采用率。
-
我們的調查顯示,大多數中國企業缺乏人工智能治理政策,目前正在積極努力彌補這一差距。過去六個月出現的一些關鍵主題包括人工智能治理和負責任的人工智能。
建議
-
確定合適的用例并管理 GenAI 投資的現實期望,避免過分強調投資回報率。相反,應關注人才發展和研發等其他關鍵因素,以確保與業務戰略相符的長期競爭優勢。
-
追求小規模實施的同時認識到它們最終需要與戰略指導相協調,包括增長目標、人工智能禁區和可接受的風險,以及最合適的人工智能技術和表現形式,而這些不僅限于 GenAI。
-
通過集成 AI 工程工具、應用程序、AI 就緒數據和基礎設施,促進 AI 在現實環境中的部署。這種方法需要在成本和風險偏好與額外運營工作帶來的潛在回報之間取得平衡。
-
通過記錄與人工智能相關的決策背后的事實和理由,確保治理決策的透明度,特別是在幻覺、隱私、人權、知識產權(IP)和客戶安全等敏感領域。
戰略規劃假設
-
到2027年,中國80%的企業將采用多模型GenAI策略,以滿足多樣化的模型能力、本地部署需求和成本效益。
-
到2027年,中國采用復合AI的企業將比全力采用GenAI模型的企業領先兩年。
-
到2028年,中國企業對AI就緒數據(特別是非結構化數據)的投資將比2024年增加20倍。
概述
DeepSeek V3?和 DeepSeek R1 模型的最新創新由于其與 OpenAI 等現有領先者相比具有更好的性能和成本效益,在全球 GenAI 領域引起了新的興奮。
事實上,Gartner 預計2024 年中國企業對 GenAI 相關問題的咨詢量將比 2023 年增加 300%?。
確保高效、可信的人工智能交付有四個關鍵步驟(問題、實驗、工程師和答案),如下所述(如圖1 所示):
1.????問題:首先確定可以使用 AI 解決的業務問題。
2.????實驗:根據已確定的業務問題,通過實驗定義約束、選擇表示形式并使用正確的數據和算法。
3.????工程師:部署AI模型,并將其與實際數據和業務系統進行操作和集成,以獲得預期的業務結果。
4.????答案:制定決策來回答生產中業務方面提出的問題,持續監控系統并在必要時進行改進。
圖 1:如何利用人工智能?
GenAI?引入了一種新的 AI 交付范式,從使用數據構建模型轉變為使用預訓練模型分析數據。沒有深厚 AI 專業知識的團隊可以使用他們喜歡的語言構建和使用 AI 應用程序。由于 GenAI 的復雜性和作為一種新實踐的普及性,它對企業 AI 的采用進行了壓力測試,如圖 2 所示。
圖 2:GenAI 對企業 AI 采用進行了壓力測試
所有這些因素都為中國企業在實施和使用 GenAI 時帶來了額外的挑戰。這項研究重點介紹了與四種 GenAI 趨勢相關的 12 個常見陷阱,這些陷阱是在過去一年中通過 1,000 多個中國客戶咨詢確定的。D&A 領導者可以使用本研究提供的建議來克服這些常見陷阱并推動成功采用 GenAI。
分析
在過去一年中,我們從客戶咨詢中發現了 12 個常見陷阱。這 12 個陷阱被歸類為 AI 生命周期的四個關鍵步驟(問題、實驗、工程師和答案),如下圖 3 所示。
圖 3:GenAI 正確實施需避免的 12 個陷阱
陷阱一:過于癡迷于短期價值
計算 GenAI 的投資回報率是我們客戶最常問的問題之一。然而,我們觀察到,我們的客戶往往過于關注有形回報,這導致他們忽視了其戰略的更廣泛范圍。因此,他們可能會錯過其他機會,例如人才招聘和顛覆性創新。
DeepSeek R1?模型最近的成功表明,創新可以在不遵循傳統商業模式的情況下實現,從而可以優先考慮研究而不是商業化。這種靈活性促進了探索和實驗,使工程師能夠追求創新想法而不受創收或客戶需求的限制。雖然復制這一成功對于中國的傳統企業來說可能具有挑戰性,但它可以激勵企業培養人才并專注于研究創新而不是嚴格的業務 KPI。
建議:
-
提供自上而下的戰略指導,說明人工智能如何支持企業目標和公眾/市場認知。
-
避免過度關注人工智能投資的投資回報率,而他們的策略是利用人工智能來推動顛覆性創新并加強人才獲取。
-
根據您的 AI 戰略,平衡人才建設、員工生產力、投資回報率和長期研發效益之間的 AI 投資。
確保您的 AI 用例優先級與業務戰略一致。
陷阱二:錯過問題的關鍵
了解 AI 可以為您的業務帶來哪些好處可能并非易事。我們經常聽到客戶說他們渴望應對雄心勃勃的、登月式的挑戰,但由于預算有限和缺乏內部 AI 能力而面臨限制。
許多企業專注于觀察競爭對手,并力圖借鑒他們的最佳實踐。雖然向他人學習是有益的,但大多數企業往往忽視了自身業務挑戰的獨特背景。這種疏忽可能會導致其投資價值被稀釋。
例如,一家中國公司試圖通過使用人工智能代碼助手來提高開發效率,將開發流程提高了 10%。他們將該工具的使用范圍擴大到更多開發人員,從而使代碼產量提高了 10%。然而,這也需要大量測試人員和業務用戶來完成無法自動化的任務。因此,由于真正的瓶頸沒有得到妥善解決,開發過程變得更加緩慢。
建議:
-
首先關注您的業務挑戰并對技術投資有合理的期望,然后開始您的 AI 用例。
-
借鑒他人成功的 GenAI 實施經驗,同時為您的 AI 用例添加背景信息。
-
從整個業務價值鏈中識別出真正的業務瓶頸,避免你的AI價值分散。
根據合理的預期提出正確的問題。
陷阱三:優先考慮技術產出,而非業務成果
GenAI?技術創新在中國蓬勃發展,有超過 100 家供應商提供基礎模型,包括開源和商業模型,可在本地和云端使用。低成本、開放重量的 DeepSeek R1 和 V3 模型帶來的最新技術進步釋放了新的潛力,特別是在科學研究、數學和編碼領域,這些領域將受益于強化學習帶來的探索、反思和規劃技能。
然而,GenAI 技術本質上是概率性的,這對于試圖在關鍵業務場景中實現穩健性和可靠性的企業提出了重大挑戰。
在中國企業中,IT 往往是創新的先行者,引領轉型。但如果創新完全由 IT 驅動,而沒有業務的主導,則可能因權責不清而導致業務成果不明確、轉型停滯。
例如,一家中國企業已從 IT 部門投入 2 億元人民幣購買 GPU 資源,以應對未來的需求,但發現并沒有實際用例可采用。在花了六個多月的時間與不同的供應商進行各種概念驗證 (POC) 后,該公司只取得了很小的進展。
建議:
-
組建一支融合技術與業務專長的團隊,匯聚 IT 和業務專業人員。該團隊將專注于探索 AI 用例并定義成功的業務指標。
-
通過評估用例的具體要求和約束來認識到何時 GenAI 可能不適合。
-
通過控制炒作和采用人工智能技術的通用分類法來防止“GenAI洗牌”,正如Gartner的人工智能技術框架中所概述的那樣。
避免盲目追逐 GenAI 技術時尚。
陷阱四:堅持太久
有些客戶在 POC 上投入了一年時間,但最終卻對模型的功能感到失望。根據客戶的經驗,典型的 POC 不應超過三個月;否則,放棄努力可能是明智之舉。
例如,一位中國客戶抱怨他們在 GenAI 上投入了太多資金,卻沒有任何實質性的商業成果。該客戶已經連續一年多為三個用例開發 POC,卻沒有任何退出標準。他們在年終審查時面臨著高級管理團隊對投資回報率的強烈反對。
建議:
-
建立創新預算池來支持實驗,而不必過分關注投資回報率。但是,要確保每個用例都有明確定義的進入和退出標準。
-
避免在單個用例上停留太久,尤其是當最先進的模型都無法提供接近預期的結果時。
-
專注于通過收集和重復使用那些黃金測試用例來設置您自己的評估數據集,以進行所有用例評估。
-
對于需要靈活性和敏捷性的案例,請考慮使用云部署而不是本地解決方案。
通過快速失敗變得敏捷且適應性強。
陷阱五:民主化導致混亂
ChatGPT?等 GenAI 技術讓高級工具的使用變得大眾化,讓更多人能夠編寫文檔、生成代碼和進行數據分析。然而,這種可訪問性也帶來了挑戰,例如存在泄露 IP 數據和產生幻覺信息的風險。
如果不正確理解人工智能的技術和必要的防護措施,那么推廣和對待人工智能可能會帶來重大的商業挑戰。
例如,當一家中國公司將敏感的公司信息輸入公共 ChatGPT 以獲取有關主要競爭對手的市場情報時,它將面臨巨大的數據泄露風險。
建議:
-
制定一個多渠道教育計劃,通過人工智能素養計劃在整個組織內傳達分類法。
-
通過在整個企業內建立明確的 AI 使用政策,概述應該做什么和不應該做什么,同時鼓勵采用 GenAI 解決方案,為員工設定合理的期望。
-
鼓勵員工利用 GenAI 解決方案來增強日常工作并轉變關鍵業務流程。同時,確保建立強大的 AI 治理流程來指導和監督這些舉措。
為您的員工構建人工智能素養計劃,同時鼓勵他們進行嘗試。
陷阱六:過于關注基礎模型
許多 AI 企業將成功的 AI 項目等同于擁有強大的基礎模型。雖然強大的基礎模型可以為應用程序性能設定上限并釋放新的可能性,但過分強調模型而忽視其他組件可能會導致“木桶效應”。這意味著其他領域(例如數據就緒性、基礎設施能力、護欄和編排)的任何重大弱點都可能阻止您獲得真正有意義的結果。
超過一半的中國客戶正在完善或開發自己的模型。然而,建立定制模型仍然是一項艱巨的任務。
通過不斷的預訓練或微調來訓練自己的模型可能達不到預期的效果,更不用說大量的 GPU 資源和成本。許多中國客戶反映,他們在訓練或微調模型時花費了過多的 GPU 資源,但與使用現有的商業模型相比,效果卻非常有限。
企業往往過于注重基礎模型,忽視傳統AI方法、數據就緒性和其他AI工程實踐的價值和有效性。
例如,在大型語言模型 (LLM) 解決方案廣泛使用的檢索增強生成 (RAG) 架構中,混合搜索方法(將 GenAI 支持的語義搜索與關鍵字搜索相結合)通常比單純依賴 GenAI 技術提供更強大的性能。
建議:
-
通過系統視圖關注業務價值,而不是過多關注模型。如果您的資源有限,請務實地將資源用于應用程序開發、數據、模型和基礎設施。
-
專注于整理您的數據并使用上下文元數據來增強您的數據,將其定位為關鍵的區別因素,而不是僅僅依靠模型來區分。
-
在訓練自己的模型之前,利用最先進的商業模型來測試用例的可行性。
-
通過探索新興的 GenAI 框架(例如 RAG 或多智能體系統)采用系統方法,以有效地利用 AI 基礎模型與其他傳統 AI 技術結合。
-
通過基于既定設計模式集成多種技術來利用復合 AI。
在構建自己的模型之前,關注廣泛的技術并利用最先進的模型。
陷阱七:低估人工智能工程在運營過程中的努力
GenAI?為人工智能工程帶來了新的挑戰和實踐,迫使企業重新審視其數據、模型和開發流程。
實施 GenAI 需要付出巨大努力來解決極端情況和長尾問題。在許多情況下,在將 AI 有效地應用于特定用例之前,強大的業務流程仍然需要規則和其他程序邏輯的支持。
DeepSeek?最近取得的成功也證明了人工智能工程的價值。
開源并不意味著它是免費的;事實上,它最終可能會讓你花費更多。
此外,網上還有許多開源解決方案和軟件包,可提供一系列功能。雖然某些框架提供無代碼/低代碼選項并且看似易于使用,但它們可能缺乏在運營過程中關鍵業務場景所需的企業級功能。這需要進一步研究,以便有效地將這些開源組件集成到您的整體 AI 生態系統中。
例如,客戶能夠以不到10 萬美元的成本為其知識庫部署基于開源解決方案的開箱即用模型,實現超過 60% 的召回率。通過額外投資 20 萬美元,他們通過增強分塊和重新排序策略成功將召回率提高到 80%。然而,該企業發現,進一步將召回率提高到 90% 需要花費 100 萬美元,預計再花 100 萬美元可能只會帶來 1% 的提升。
建議:
-
通過平衡解決方案穩健性帶來的業務期望與人工智能工程相關成本來管理業務需求。
-
通過建立一個中央 AI 工程團隊來擴展您的 AI 計劃,該團隊致力于確保整個企業 AI 采用的可重用性和治理。
-
通過實施 DataOps、ModelOps 和 DevOps 最佳實踐來自動化管道并整合持續監控循環,從而提高 AI 開發的生產力。
-
使用模塊化方法設計您的 AI 工程平臺架構,以集成基礎設施、模型管理、數據管理和應用程序開發中的 AI 組件。
陷阱八:合規阻礙一切
我們經常聽到中國客戶反映,一些成功的 POC 由于數據安全、隱私和道德等合規問題而無法繼續實施。
雖然在大多數情況下情況確實如此,但進行必要的評估以確保這些觀點符合公司的合規性要求至關重要。然而,這些流程通常對 AI 團隊來說并不透明,導致團隊感到沮喪。
人工智能委員會對于克服多學科挑戰、推動價值增長和降低風險至關重要。然而,委員會的范圍、持續時間和資源是針對具體情況的,取決于具體用例。對于一些公司來說,它是一種短期的權宜之計,而對于另一些公司來說,它代表著對其運營模式的長期改變。
建議:
-
設立一個人工智能委員會,綜合考慮相互競爭的利益相關者的優先事項和受托義務,同時審查成本、風險和價值工程的用例。
-
首先,提名一位人工智能領導者來定義人工智能委員會的職權范圍,使其與高管層和董事會的優先事項(包括企業業務戰略)保持一致;然后根據您的資源承諾調整討論主題和相應的可交付成果。
-
任命您的 AI 領導者擔任 AI 委員會主席,與利益相關者合作,并通過從整個企業中找出經驗豐富的業務領導者來選擇 AI 委員會成員。。
應用中央 AI 治理來更好地進行風險評估和決策以實現運營。
陷阱九:對人工智能使用千篇一律的數據管理方法
大多數中國企業在運營階段都實施傳統的數據管理方法,以確保滿足數據質量和治理要求。
傳統的質量、適用數據、管理控制和領域專業知識標準可能不足以滿足 AI 用例所適用的多種環境和階段(例如操作化和生產)的需要。
企業必須解決 AI 就緒數據問題,以確保根據數據變化持續學習。
通過獲取和利用正確的元數據,D&A 領導者可以將風險管理從技術團隊轉移到工具上,從而提高效率。這種轉變包括一系列自動化活動,包括整理與用例相關的黃金文本記錄、使用附加上下文標記內容以便在使用過程中更好地解釋,以及根據上下文將數據與不同的模型相關聯。
建議:
-
通過評估每個 AI 用例的數據背景和代表性變化,將數據的代表性和背景與 AI 利用率保持一致。訪問、積累和利用現有系統中盡可能多的元數據,以比較多個場景中的數據重用情況。
-
通過增強元數據利用率來提高 AI 數據準備度。使用來自現有數據流程的元數據,持續監控數據資產的值漂移、重構和其他數據變化和模式。然后提醒 AI 解決方案經理。
-
實施具有精選黃金記錄的評估框架,可以不斷增強解決方案的功能。
-
通過生態系統協作構建強大且適應性強的數據基礎設施,以維持持續的人工智能計劃和技術動態。
確保您的數據能夠適應您的特定用例并具有情境感知能力。
陷阱十:忽視一致的目標
從技術角度來看,該系統在 POC 和運營階段可能表現良好。然而,當業務團隊對用例缺乏透明度時,就會出現挑戰,導致他們認為系統運行風險太大。如果您缺乏適當的指標來監控模型是否符合您的 AI 道德標準,情況會變得更糟。
例如,一位客戶利用 GenAI 預測員工流失,并將晉升和加薪確定為與員工流失相關的最大風險因素。這一洞察讓高層管理團隊陷入兩難境地,是否根據員工流失風險而不是績效來增加薪水或晉升員工。結果,該用例被視為不成功,隨后被取消。
此外,我們發現許多中國客戶在人工智能用例方面缺乏完全透明度,并且在沒有業務團隊參與的情況下要求供應商對結果負責。
此外,可能存在涉及不同業務線和團隊的角色和決策,需要協調和跟蹤各種道德和決策。
建議:
-
與利益相關者就相關人工智能原則達成一致。確保治理決策的透明度,以表明對隱私、人權、知識產權或客戶安全等敏感話題的考慮。記錄有關人工智能決策的事實和理由。
-
企業應通過在整個AI生命周期中設定目標、流程和標準來實施AI治理運營模型,以管理AI解決方案的可信度。
-
利用模型護欄等工具來平衡 GenAI 解決方案的創造性和多功能性,并通過控制 GenAI 模型的輸入和輸出來降低其他風險。
通過擴大人工智能治理來增強信任,以確保透明度、可靠性和有效性。
陷阱十一:將人工智能計劃視為一次性項目
人工智能項目計劃通常無法考慮到開發過程中出現的不可預見的復雜性和資源需求,并且低估了數據準備成本、模型服務成本、測試和評估成本以及基礎設施成本等運營階段。
許多企業對 GenAI 項目所需的預算表示擔憂,因為他們面臨重大的預算問題,這是因為他們無法準確計算所有風險和工作量。
建議:
-
聘請一位全職、專職的產品經理,與業務和技術團隊建立長期關系并充分了解產品背景,從而關注結果而不是產出。
-
使用敏捷方法應對快速變化。隨著工作進展,要樂于發現新的要求和復雜情況,而不是試圖預先詳細說明一切。
將人工智能作為產品而不是項目來管理。
陷阱十二:放棄得太快
雖然將 AI 項目部署到生產中是一項重大挑戰,但對于團隊來說,在生產環境中維持對其的支持可能更具挑戰性。
我們觀察到,客戶在生產中使用 AI 解決方案時通常會取得初步成功。然而,隨著業務和數據不斷變化,這些解決方案很快就會失敗。
因此,持續監控、評估和可觀察性對于客戶建立和有效維護 GenAI 解決方案至關重要。
例如,在 POC 和運營階段,一家企業最初成功滿足了其業務需求。然而,進入生產階段后,由于業務需求的變化和數據變化,它面臨著巨大的挑戰,這引發了對系統可靠性的擔憂。企業沒有放棄該項目,而是采用了額外的 LLMOps 功能,例如監控、評估、可觀察性和基礎。這些改進使他們能夠更有效地處理業務需求的動態特性。
建議:
-
通過持續監控生產 AI 系統中的業務和數據漂移來調整解決方案。
-
通過首先推出包含基線和管道設置的最小可行產品 (MVP),然后逐步引入復雜性,不斷提高 GenAI 性能。
-
通過建立管道并利用積累的黃金測試用例來創建自動化回歸測試,以提高效率。
-
通過建立企業評估驅動的開發方法來衡量解決方案的有效性和可靠性,從而衡量解決方案的結果。