大數據產業創新服務媒體
——聚焦數據?· 改變商業
在當今數字化快速發展的時代,數據已經成為業務經營與管理決策的核心驅要素。無論是跨國大企業還是新興創業公司,正確、迅速地洞察數據已經變得至關重要。然而,傳統的BI工具往往對用戶有一定的技術門檻,需要熟練的操作技能和復雜的查詢語句,這使得大部分的企業員工難以深入挖掘數據的價值。
那么,如何讓數據分析變得更為直觀、更為人性化呢?
8月10日,網易數帆舉辦主題為“精耕數智 為創新加速——網易數帆城市行(北京)”的行業峰會,發布了AIGC結合數據分析、軟件開發等領域的的最新進展與成果。
網易副總裁,網易杭州研究院執行院長、網易數帆總經理汪源介紹AIGC應用潛力
其中,在大數據領域,網易數帆發布融合前沿AIGC技術研發而成的對話式BI產品——有數ChatBI。這是數據分析領域的一個全新的解決方案,通過自然語言與BI平臺進行交互,實現數據查詢和分析。這種方式像是與一位數據專家進行對話,簡單、直接,無需復雜的技術背景。這一創新,有望開啟數據分析新范式。
網易數帆是如何做到的呢?ChatBI跟以往的BI又有哪些顯著不同?如何解決大模型被廣為吐槽的“胡說八道”難題,本文將對這些問題進行深入的分析。
AIGC變革人機交互方式,數據分析從此不同
網易數帆大數據產品線總經理余利華認為,人機交互其實是很重要的事情,更好的人機交互往往會帶來顯著的技術和產業革新,比如電腦圖形界面、iPone多點觸控的出現,都對產業帶來重要的影響。
人類和計算機之間的交互歷經數十年的發展,已經從初期的復雜、難用,轉化為現今的直觀、人性化。簡單來說,人機交互經歷了三個顯著的變革階段,每一個階段的變化都為數據分析帶來了深遠的影響。
第一階段:程序命令行交互
在計算機剛剛誕生的年代,與計算機的交互基本依賴于程序命令行。用戶需要精通各種命令,才能讓計算機完成特定的任務。這種方式雖然為早期的計算機專家和愛好者提供了強大的靈活性,但顯然,對于大多數普通用戶來說,它的學習曲線相對陡峭,使用門檻較高。
第二階段:圖形界面交互
隨著技術的進步,圖形用戶界面(GUI)開始逐漸流行。用戶不再需要記憶復雜的命令,只需通過電腦鼠標或是手機觸屏進行操作,即可完成任務。圖形界面的出現顯著降低了計算機使用的難度,大大擴展了計算機的用戶群體。對于數據分析來說,圖形化的數據展示和拖拽式的操作界面使得BI平臺變得更為直觀易用,但仍然需要一定的培訓和熟練度,依然有不小的使用門檻。
第三階段:基于AIGC的自然語言交互
2023年,大模型和AIGC迅速進入人們視野,為我們打開了一個全新的人機交互思路。用戶可以直接用自然語言與機器對話,就像與另一個人交談一樣。這意味著,無論用戶是否具有專業技能或背景知識,都可以輕松、直接地與計算機互動,進行數據查詢和分析。
網易有數ChatBI產品應用界面
總的來說,AIGC技術徹底改變了數據分析的游戲規則,讓數據分析從此走入了一個全新的時代。
以ChatBI,開啟數據分析新范式
ChatBI是數據分析領域的一次革命性突破,它將BI與AI技術完美結合,為企業提供了前所未有的便利和效率。具體來看,相對于傳統BI,ChatBI具有以下幾個顯著的優勢:
1、對話即分析,顯著降低數據分析門檻。
相對于傳統BI工具,ChatBI的對話式數據分析為企業和個人帶來了獨特的便利性。傳統BI通常需要深入的培訓、編程知識,以及對數據結構的深入理解,這使得非技術背景的員工在數據分析過程中可能會感到手足無措。但ChatBI破除了這種障礙,提供了一個自然且直觀的方式來獲取數據洞察。
在ChatBI中,問題不再是通過復雜的查詢語言或拖放界面提出的,而是通過日常語言。這意味著即使是營銷、銷售或管理團隊的非技術人員,也可以直接詢問并獲取他們需要的答案。此外,這種直接的交互方式極大地加快了響應時間,使得實時決策成為可能。
此外,對話式的數據分析還增強了數據的可訪問性。傳統的BI工具可能會在用戶界面上有大量的選項和配置,而ChatBI簡化了這一過程,使用戶可以集中精力在真正的問題上,而不是工具的操作上。這種便捷性不僅提高了效率,也使得數據分析更具吸引力,鼓勵更多的人參與其中,進而促進數據消費。
2、報告生成與解釋,用業務語言,讓數據分析結果更清晰易懂。
ChatBI不僅能夠生成數據分析報告,還能夠以業務語言、管理語言來解釋分析結果。對于非技術背景的決策者而言,這種方式更易于理解和接受。當數據不再是冰冷的數字,而是與我們對話、解釋、討論的“伙伴”時,數據分析和業務決策過程也變得更加高效。
以一個市場營銷團隊為例,考慮這樣一個場景:市場部經理想知道上個月社交媒體廣告活動的效果,特別是哪些帖子或廣告得到了最多的互動和轉化。
在ChatBI中,市場部經理只需輸入:“上個月的社交媒體廣告活動效果如何,哪些內容的互動和轉化率最高?”系統可能會迅速地回應:“上個月,我們在小紅書的‘夏日促銷’帖子得到了最多的互動,共有5,000次點贊和500條評論。抖音上的‘新品發布’視頻廣告轉化率最高,為3.5%,為我們帶來了2000個新用戶。”
3、更深入的數據挖掘能力,發現大數據中隱藏的業務關聯。
傳統的數據分析往往依賴于預設的規則和模型,而ChatBI則利用了先進的AI技術,可以從大數據中自動學習規則,處理更復雜、更深入的分析任務。這意味著,ChatBI可以幫助企業發現之前被忽視的業務關聯和潛在機會。
讓我們來看一個例子。
假設有一家大型零售公司,該公司有多個銷售渠道,包括實體店、網店和移動應用。此外,他們也運營一個會員積分系統,消費者可以在購買后獲得積分,并在特定時間或活動中兌換商品或服務。
使用傳統的數據分析工具,可能會得到一些粗淺的分析結果:在某些城市的實體店,周五下午3-5點是銷售高峰;而網店和移動應用則在周末和節假日的晚上7-10點銷售最佳。
但是,使用ChatBI進行深入挖掘,他們更可能發現了一些更復雜、更隱秘的模式,例如:那些在實體店周五下午購買家居或廚房用品的消費者,有超過65%的可能性在接下來的48小時內,通過移動應用購買與烹飪或食品相關的商品。進一步的分析揭示,這可能與一些消費者在周五購買新的廚房用品后,希望在周末嘗試新菜譜,因此會通過移動應用購買食材或其他相關產品。為此,這個零售公司可以為在實體店購買廚房用品的消費者提供移動應用內的食材折扣,進一步促進其二次消費。
4、自我進化能力,實現個性化BI。
ChatBI的一個顯著特點是其自我進化能力。隨著使用的增加,它會持續學習、優化,從而提供更準確的分析結果。更為重要的是,ChatBI能夠了解并適應每個用戶的習慣,為每位用戶提供真正的個性化服務,這使得數據分析過程更加靈活和高效。
5、打通數據應用,推動數據驅動的業務流程自動化。
ChatBI不僅僅是一個數據分析工具,它還可以作為BI數據分析結果與其他應用系統的橋梁。通過將數據分析結果與企業的業務流程相結合,ChatBI可以自動觸發相應的業務操作。這種集成方式不僅提高了工作效率,還為企業帶來了更高的靈活性和響應速度,從而實現真正的數據驅動決策。
在這個大數據和AI技術飛速發展的時代,ChatBI無疑為企業指明了一條新的、更為高效的數據分析之路。
解決AIGC“胡說八道”的問題,打造可商用的ChatBI
值得指出的是,盡管ChatBI沿用了大模型的設計理念,但這并不意味著我們可以直接用ChatGPT這類通用大模型來進行數據分析和圖表生成。
盡管ChatGPT是一個功能強大的模型,它在直接調取數據庫或數據平臺上的數據方面并不盡如人意。這涉及到在不同平臺之間實現數據整合,背后是一系列復雜的技術產品整合挑戰。再者,ChatGPT在數據可視化方面的表現也相對較弱,它能做的只是簡單的表格展示,而真正的數據分析需要更為復雜和詳細的可視化圖表。
更重要的是,ChatGPT作為一個通用知識模型,可能在專業領域如數據分析中出現計算和解釋上的偏差。例如,當涉及復雜的數學計算或針對特定數據集的統計分析時,ChatGPT可能由于信息不完整、模型的推斷限制或其他因素而導致答案的不準確。然而,對于BI產品而言,數據的準確最基本的要求,ChatGPT這種潛在的不準確性在數據分析領域是不可接受的。
余利華認為,可信才是“AIGC+BI”成熟商用的核心關鍵,通過需求可理解,過程可驗證,用戶可干預和可調整查詢條件,產品可運營可調整等四種手段,網易數帆大大提升了有數ChatBI的結果可信度。
那具體怎么做呢?以網易數帆的創新實踐來看,以下方法有助于解決大模型、AIGC存在的“胡說八道”的問題,提升數據分析精確性:
網易數帆大數據產品線總經理余利華介紹ChatBI產品
1、借助NL2SQL能力實現雙重驗證,提升生成內容的精確度,降低錯誤率。
網易數帆通過引入NL2SQL(Natural Language to SQL)技術,顯著增強了用戶與數據庫的交互體驗。在傳統的數據庫查詢方法中,用戶需要明確掌握SQL語言和相應的數據庫結構來提取所需信息。而通過NL2SQL,用戶只需使用自然語言描述需求,由后端系統將其轉換為適當的SQL語句,大大簡化了查詢過程。
余利華在接受媒體采訪時指出,之前自然語言處理能力其實比較弱,這導致以往的NL2SQL技術在處理模糊或不清晰的查詢、理解復雜的查詢意圖方面存在挑戰,AIGC、大模型為NL2SQL帶來了更強大的語境和意圖理解能力。這意味著在處理模糊、多義或復雜的用戶查詢時,系統可以更準確地識別用戶的真實需求。例如,用戶可能提出“最近三個月銷售額最高的產品是什么?”這種涉及時間、數值和排序的復雜查詢,大模型的強大自然語言處理能力確保了它可以準確解析這樣的需求,并轉化為有效的SQL查詢。
大模型+NL2SQL,這一機制打通了用戶需求、數據獲取、數據分析的整個鏈路,確保數據的準確可靠。目前,網易數帆已經能夠處理超過30萬種不同的自然語言問法,并且其效果在準確性上已經達到了GPT-3.5的水平。
2、表格粒度的知識增強,根據用戶問題將相關表格知識實時“喂養”大模型。
網易數帆的另一個創新是,根據用戶問題將相關表格粒度的知識實時“喂養”大模型,讓大模型更透徹地理解結構化數據,顯著提升生成結果的準確率。
表格,作為結構化數據的核心形式,是數據決策的基石。實時“喂養”大模型表格知識,意味著模型不只基于原始訓練響應,而是獲取實時表格數據作出回答。這就如同向專家提問,他不僅用舊知識,還立刻查最新資料回答。這方法的優勢在于:因為它利用最新數據,可以保證答案的時效性;提升模型的靈活性,使其更針對性地回答,而非只基于訓練知識。
3、通過自定義提示向模型灌輸企業專有知識,提升個性化場景分析效果。
自定義提示為模型注入企業專有知識,是增強模型個性化和針對性的關鍵。預訓練模型雖然具有廣泛知識,但可能缺乏對特定企業文化、業務特性、工作流和術語的理解。通過自定義提示,模型可以更準確地為企業提供答案,確保其輸出與企業的業務特性一致。
此外,每家企業的需求都是獨特的,通用答案可能不適用于所有場景。因此,為模型灌輸專有知識,不僅可以加深其對企業的理解,還可以確保為企業提供量身定制的策略和建議,進而提高決策的準確性。
4、將數據模型和查詢條件結構化,用戶可干預可調整,隨時可切換數據模型或者查詢條件。
余利華認為,在數據驅動的決策制定中,用戶期望的是準確、有針對性和即時的數據分析結果。但自動化的數據分析系統,盡管高效,可能不總是滿足這些要求。有時,系統輸出的結果可能與用戶的期望或其特定業務情境不完全吻合。
這時,將數據模型和查詢條件結構化,并允許用戶進行干預和調整變得尤為關鍵。如果ChatBI給出的結果錯了,用戶知道錯在哪里,并且平臺可以輔助用戶很便捷的改正錯誤,這是可信ChatBI的應有之意。例如,一個零售商可能對上個月的銷售數據感興趣,而系統默認提供的是本年度的累計數據。在一個可調整的結構中,這位零售商可以簡單地切換查詢條件,以獲取所需的信息,而不必重新構建整個查詢。
此外,業務環境和需求是多變的。今天的分析框架可能在明天不再適用。允許用戶干預、調整并切換數據模型或查詢條件,不僅確保了數據分析的即時性和準確性,還賦予了用戶更大的數據掌控權,使他們能夠根據具體需求進行快速反應和決策。
5、構建產品運營反饋機制,通過用戶和管理員的數據反饋、知識運營,來持續優化產品表現。
一個創新產品的開發不是一蹴而就的,而是在持續的迭代、優化中變得更好。為此,網易數帆構建了用戶和管理員參與的運營反饋機制。
用戶通常是第一時間發現并經歷數據錯誤或不一致性的人,他們的反饋往往針對性強,有助于快速定位并修復問題。對于反饋的數據,管理員可以將其標記為“badcase”,并進行相應的優化。這樣的標記和整理使得問題的出現不再是孤立的事件,而是被納入一個持續優化的過程中。這也為后續的數據分析和模型訓練提供了寶貴的訓練樣本,有助于模型的持續迭代和優化。
這種反饋機制不僅增強了數據的可靠性,還增強了用戶與產品之間的互動關系,加深了用戶與產品之間的連接,從而實現了數據和產品的雙向優化。當用戶看到他們的反饋被采納和處理,他們更有可能建立起對產品的信任,并愿意持續使用。
在數據分析和內容生成的領域,準確性不僅僅關乎信譽和用戶體驗,更是決策支持的關鍵。錯誤的數據或分析可能導致企業做出不合理的策略決策,帶來不可估量的損失。如果ChatBI進行錯誤的數據分析和內容生成,甚至“胡說八道”,不僅會降低用戶對產品的信心,還可能損害企業的品牌形象。
因此,網易數帆對大模型生成內容的準確性賦予了極高的重視。通過上述方法,網易數帆確保了大模型生成內容的準確性,打造需求可理解、過程可驗證、用戶可干預、產品可運營的可信ChatBI,為這種全新數據分析方式的商業化應用奠定了堅實的基礎。
對于網易數帆而言,此次ChatBI產品的發布,不僅是其構建AIGC+BI商業藍圖的關鍵一步,更是對現有數智競爭力的重塑。網易數帆對這一創新方向的堅持和深入探索將成為公司未來發展的重要驅動力。未來,通過陸續推出一系列針對不同需求的產品,網易數帆有望塑造一個全新的、更加智能化的商業生態體系,不僅助推自身的快速發展,同時也推動整個行業的創新和轉型。
對于企業而言,ChatBI的推出無疑降低了數據分析和使用的門檻,使更多的人能夠輕松獲取并利用數據。這種開放和便捷的特性,將極大地擴大數據消費群體規模,提升數據消費的廣度、深度和頻率,進而推動企業在數字化、智能化方向的升級和轉型。在全球經濟日益依賴數據和智能技術驅動的今天,這一轉型對于企業的競爭力提升有著不可忽視的意義。
從更廣泛的角度看,ChatBI這類創新產品與中國當前數字經濟的發展戰略緊密相連。根據中國國家互聯網信息辦公室日前發布的《數字中國發展報告(2022年)》,2022年我國數字經濟規模已達50.2萬億元,總量位居世界第二,占國內生產總值比重提升至41.5%。這一趨勢的背后,離不開眾多像ChatBI這樣的創新產品共同推動。
正如網易數帆總經理汪源在會上指出,數字中國建設的關鍵驅動力,在于數智生產力與軟件供給能力。如果把數字中國建設比作一棵參天大樹,那發展數智生產力,可以促進數字創新應用“枝繁葉茂”。未來,隨著這類產品的不斷完善和推廣,它們將進一步促進中國數字經濟的快速發展,為國家和社會的繁榮做出更大貢獻。從這個角度看,ChatBI不僅是一次成功的產品創新,更是一次對未來商業和社會發展方向的深刻洞察和積極響應。
文:月滿西樓?/?數據猿