關于AI數據分析可行性的初步評估

一、結論:可在部分環節嵌入,無法直接處理大量數據

1.非本地部署的AI應用處理非機密文件沒問題,內部文件要注意數據安全風險。

2.AI(指高規格大模型)十分適合探索性研究分析,對復雜報告無法全流程執行,主要應用于快速搭建分析框架輔助人工分析,例如:提供背景需求→生成分析大綱(人工修訂)→根據大綱統計各維度數據(人工執行:提供統計模板→生成統計腳本/AI執行:直接統計源數據需注意驗證)→數據解讀(人工修訂)。

3.AI不完全適合固定模版的統計分析,對復雜模板的生成穩定性不足,大模型對同一指令的多次輸出都會有偏差,在復雜的清洗環節有一定可行性,無法全流程執行。對簡單模板的生成算力消耗高、性價比對于傳統自動化程序而言不高,但在非本地化部署、非自主開發的情況下,某些場景使用各大模型商的產品或許能達到不錯的效果。

4.目前體驗有潛力的適合非技術人員使用的工具是WPS AI,對標OFFICE 365+Copilot?非廣告,先說結論:難以適應實戰(= 。=),優點是集成對WPS接口的調用,可直接操作文檔和表格,相比各網頁版大模型上傳EXCEL后進行問答分析,或輸出公式、腳本,省去了間接學習操作和復制粘貼的步驟。缺點是還比較弱智。

5.大模型分析(含清洗、統計、解讀)表格數據主要有三種模式,一是提供方法教學(模擬專家,只教不做),自己再去用別的工具來實現(比如教你用Excel和Python)。二是用大模型的原生能力(直接做),本質是把數據降維,類似轉換文本向量,相當于長文檔總結,但因大模型幻覺、未在垂直領域微調、源數據未清洗等,不能保障分析質量,且對用戶的prompt工程能力要求也較高。三是自動執行腳本(Agent,集成其他工具的工作流),類似WPS AI,理解用戶需求后生成清洗、統計和可視化腳本,在底層調用插件(解釋器)執行代碼,再將結果返回頁面展示,好處是數據清洗和統計是準確的,大模型主要負責設計分析思路和對統計結果進行解讀。個人可按情況選用,企業級開發應按Agent方向。
在這里插入圖片描述

二、數據分析流程替代率預估

分析大綱設計(30%至60%,AI提供分析思路、制定報告大綱,但初級分析師不主動思考可能會過于依賴AI)

→采集(3%至10%,絕大部分結構化數據還是需要定制爬蟲程序,但如“近十年XX產業重點企業清單”這類需求可用AI聯網搜索,或者是去收集需要爬的目標網站)

→清洗(5%至30%,規則較模糊、傳統程序處理精度不高的用AI效果會好一點,例如:對大段口水話描述文本進行分類、提取)

→統計(10%至30%,適合非技術人員使用,對具備技術基礎的分析人員而言,清洗質量高的數據用python統計有顯著的速度優勢)

→分析解讀(10%至30%,對已經統計好的數據進行解讀,表述上優于初級分析師,對源數據直接分析也可提供總結框架)

→各類交付形式(10%至30%,穩定輸出有難度,還需人力修正,若需求方對格式模板無嚴格要求就比較好用)

三、主要難題

1.基于數據安全,理論上不應將內部業務數據上傳給非本地AI進行分析。
解決方向:(非要上傳的話)脫敏用密文表示分析對象,上傳AI分析輸出后再轉換回來?更復雜的體系,如結合隱私計算有一定技術門檻。或勇敢相信各大模型商的安全協議?

2.個人現有條件下本地部署大模型性能表現不及官方API。
解決方向:emmm調優?分析師不必在這上面硬磕,交給研發團隊吧,讓老板買服務器吧。

3.簡單的模擬數據處理效果尚可,暫無法適應復雜的真實分析任務,審核成本高,計算精度、輸出穩定性、流程可驗證性不足,長期使用可能哪天出錯了也發現不了,因為AI最擅長的就是一本正經的胡說八道。把AI比作實習生,它可能要很久才能轉正(隨著技術進步也可能很快),總是不能放心直接使用它輸出的東西。
解決方向:長期試驗調優。

四、WPS AI數據分析體驗案例

AI表格助手:理解需求后通過自動生成執行js宏來直接操作表格,更方便快捷,適合清洗和格式整理。

AI數據分析:理解需求后通過自動生成執行python來間接操作表格,銜接不夠流暢,只能做清洗和統計,不利于格式整理。
在這里插入圖片描述

上述功能均需拆解分析流程,通過多輪指令逐步引導AI執行才能有較好效果,“一句話指令”分析不夠智能。指定細節和等待響應的時間成本較高,對精通Excel和Python的分析師而言比較雞肋,但這種模式還算是未來可期吧。測試示例如下:
在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/73112.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/73112.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/73112.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

矩陣分析-淺要理解(深度學習方向)

梯度分析與最優化 在深度學習的任務中,我們所期望的是訓練一個神經網絡,使得預測結果與真實標簽之間的誤差最小化,這可以近似看作是一個提供梯度下降等優化找到全局最優解的凸優化問題。 奇異值分解 在信息工程領域,對數據處理的…

使用DeepSeek+藍耘快速設計網頁簡易版《我的世界》小游戲

前言:如今,借助先進的人工智能模型與便捷的云平臺,即便是新手開發者,也能開啟創意游戲的設計之旅。DeepSeek 作為前沿的人工智能模型,具備強大的功能與潛力,而藍耘智算云平臺則為其提供了穩定高效的運行環境…

固定表頭、首列 —— uniapp、vue 項目

項目實地&#xff1a;也可以在 【微信小程序】搜索體驗&#xff1a;xny.handbook 另一個體驗項目&#xff1a;官網 一、效果展示 二、代碼展示 &#xff08;1&#xff09;html 部分 <view class"table"><view class"tr"><view class&quo…

【學習筆記】Numpy和Tensor的區別

1. NumPy 和 PyTorch Tensor 的格式對比 NumPy 使用的是 numpy.ndarray&#xff0c;而 PyTorch 使用的是 torch.Tensor&#xff0c;兩者的格式在數據存儲和計算方式上有所不同。 NumPy (numpy.ndarray) import numpy as np array np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.…

每天一道算法題【藍橋杯】【在排序數組中查找元素的第一個位置和最后一個位置】

思路 本題為查找左邊界和右邊界的標準模型 查找左邊界 int left 0, right nums.size() - 1, mid 0; //查找左邊界 while (left < right) { mid left (right - left) / 2; if (nums[mid] < target) left mid 1; else right mid; } 查找右邊界 int left 0, r…

Python數據分析之機器學習基礎

Python 數據分析重點知識點 本系列不同其他的知識點講解&#xff0c;力求通過例子讓新同學學習用法&#xff0c;幫助老同學快速回憶知識點 可視化系列&#xff1a; Python基礎數據分析工具數據處理與分析數據可視化機器學習基礎 五、機器學習基礎 了解機器學習概念、分類及…

我與DeepSeek讀《大型網站技術架構》(10)- 維基百科的高性能架構設計分析

目錄 網站整體架構核心組件請求處理流程圖關鍵環節說明 性能優化策略前端優化&#xff1a;攔截 80% 以上請求服務端優化&#xff1a;高性能 PHP 集群后端優化&#xff1a;存儲與緩存極致設計Memcached 持久化連接 性能優化策略對比表 網站整體架構 核心組件 Wikipedia 的架構…

Excel多級聯動下拉菜單設置

1.問題描述 現有數據表如下圖所示&#xff1a; 該表中包括省、市、縣三級目錄。 現要將其整理成數據表模板&#xff0c;如下圖所示&#xff1a; 要求制作成下拉菜單的形式&#xff0c;且每一級目錄的下拉菜單列表要根據上一級目錄的內容來確定。 如上圖所示&#xff0c;只有…

智駕技術全鏈條解析

智駕技術全鏈條解析&#xff08;2025年最新版&#xff09; 智駕技術涵蓋從環境感知到車輛控制的完整閉環&#xff0c;涉及硬件、算法、數據與系統集成等多個領域。以下結合行業最新進展&#xff08;截至2025年3月&#xff09;進行深度拆解&#xff1a; 一、感知技術&#xff1…

SpringMVC執行的流程

SpringMVC 基于 MVC 架構模式&#xff0c;核心流程時前端控制室 DispathcherServlet 統一調度&#xff0c;通過組件協作完成 http 的請求與響應。 對于 dispatchServlet 作為前端請求的控制器&#xff0c;全局的訪問點&#xff0c;首先將根據 URL 調用 HandlerMapping 獲取 Han…

Linux學習(十五)(故障排除(ICMP,Ping,Traceroute,網絡統計,數據包分析))

故障排除是任何 Linux 用戶或管理員的基本技能。這涉及識別和解決 Linux 系統中的問題。這些問題的范圍包括常見的系統錯誤、硬件或軟件問題、網絡連接問題以及系統資源的管理。Linux 中的故障排除過程通常涉及使用命令行工具、檢查系統和應用程序日志文件、了解系統進程&#…

存儲過程和自定義函數在銀行信貸業務中的應用(oracle)

數據校驗和清洗 例如&#xff0c;檢查客戶的年齡是否在合理范圍內&#xff0c;貸款金額是否符合規定的上下限等。 對于不符合規則的數據&#xff0c;可以進行清洗和修正。比如&#xff0c;將空值替換為默認值&#xff0c;或者對錯誤的數據進行糾正。 CREATE OR REPLACE PROC…

指令微調 (Instruction Tuning) 與 Prompt 工程

引言 預訓練語言模型 (PLMs) 在通用語言能力方面展現出強大的潛力。然而&#xff0c;如何有效地引導 PLMs 遵循人類指令&#xff0c; 并輸出符合人類意圖的響應&#xff0c; 成為釋放 PLMs 價值的關鍵挑戰。 指令微調 (Instruction Tuning) 和 Prompt 工程 (Prompt Engineerin…

【c++】反轉字符串

說明 將string類型的字符串本身反轉 用到庫&#xff1a;algorithm 示例代碼 #include <iostream> #include <string> #include <algorithm> using namespace std;int main() {string str "123";reverse(str.begin(), str.end());cout <<…

正則表達式(復習)

文章目錄 一、[]: 一個字符集合二、{}: 重復次數三、特殊符號四、(): 分組五、python代碼示例六、注意 正則表達式(regular expression)描述了一種字符串匹配的模式&#xff08;pattern&#xff09;&#xff0c;可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個…

ARMV8的64位指令

一、介紹 ARMv8 體系結構最大的改變是增加了一個新的 64 位的指令集&#xff0c;這是早前 ARM 指令集 的有益補充和增強。它可以處理 64 位寬的寄存器和數據并且使用 64 位的指針來訪問內存。這 個新的指令集稱為 A64 指令集&#xff0c;運行在 AArch64 狀態。 ARMv8 兼容舊的…

線性代數之矩陣特征值與特征向量的數值求解方法

文章目錄 前言1. 冪迭代法&#xff08;Power Iteration&#xff09;冪法與反冪法求解矩陣特征值冪法求最大特征值編程實現補充說明 2. 逆冪迭代法&#xff08;Inverse Iteration&#xff09;移位反冪法 3. QR 算法&#xff08;QR Algorithm&#xff09;——稠密矩陣理論推導編程…

VScode:運行程序停止后,頻繁出現終端進程被終止

VScode里面powershell被迫關閉 bug場景排查原因解決辦法 bug場景 系統&#xff1a;Windows IDE&#xff1a;Visual Studio Code 停止運行程序后&#xff0c;按向上箭頭想要執行上一步命令&#xff0c;忽然終端頁面強行關閉&#xff0c;并報錯如下&#xff1a; 終端進程 &quo…

[MERN] 使用 socket.io 實現即時通信功能

[MERN] 使用 socket.io 實現即時通信功能 效果實現如下&#xff1a; MERN-socket.io 實現即時聊天 Github 項目地址:https://github.com/GoldenaArcher/messenger-mern 項目使用了 MERN(MongoDB, Express, React, Node.js) socket.io 實現即時通信功能&#xff0c;并且使用了…

【菜鳥飛】Conda安裝部署與vscode的結合使用

介紹 Conda 是一個跨平臺的開源工具&#xff0c;用于管理軟件包和環境。最初由 Anaconda 公司開發&#xff0c;它的設計目標是支持數據科學和機器學習領域&#xff0c;但其功能不僅局限于此。 以下是 Conda 的核心特點&#xff1a; 包管理&#xff1a;安裝、更新、卸載各種庫…