Datawhale AI數據分析 筆記

Part1:數據分析入門--信息統計

知識點:什么是提示詞(Prompt)?

在人工智能(AI)領域,"提示詞"是一個關鍵概念,它指的是輸入給AI模型的文本或指令,用于引導模型生成特定的輸出。

按照如下兩個要素進行組合的:

指標(講清楚表格構成和一些重要指標的含義)

要求(做什么樣的分析、畫什么樣的圖)

提示詞進化路線:

表格中有3張表格sheet,1.sheet是1群的統計數據,2.sheet是2群的統計數據,number.sheet是1.sheet和2.sheet數字列對應的興趣點,其中興趣點對應興趣數字列

現在需要統計1群和2群所有興趣點的統計結果,加上統計百分比的數據,并對統計百分比列按照倒序進行排列

修改為表格格式

請先統計出1群的結果,再統計出2群的結果,加上統計百分比的數據,并對統計百分比列按照倒序進行排列,行末尾加上總計,返回表格格式,注意兩個表格不要放在同一個表格中

將編號修改為整數?

百分比數值請以整數的形式輸出

導出結果為表格

請幫我把這兩個統計結果表格導出來,謝謝?

Part2:了解數據概況--描述性分析

知識點:什么是描述性分析?

描述性統計就像是給數據做一次“快照”。

它用一些簡單的數字和圖表來告訴我們數據集中的信息,比如數據的平均值、最大值、最小值,或者數據分布的形狀等。這些數字和圖表可以幫助我們快速了解數據的基本情況。

參考prompt

這里統計的是大學生對感興趣活動主題的調查結果,其中:

number.sheet是活動主題編號和主題詳情, 編號對應的1.sheet和2.sheet的數字列, 1.sheet是1班的數據,2.sheet是2班的數據。

請根據這份表格,完成描述性分析

  • 有多少同學參與了問卷
  • 不同選項數對應的同學人數和人數比例分別是多少
  • 超過3個選項的回答是不合規的回答,不合規回答的同學人數和比例分別是多少 ...

小知識:描述性分析一般包括如下內容

  1. 集中趨勢度量?:

    • 平均數(Mean):所有數據值的總和除以數據的數量。
    • 中位數(Median):將數據從小到大排列后位于中間位置的值。
    • 眾數(Mode):數據中出現次數最多的值。
  2. 離散程度度量?:

    • 極差(Range):數據中最大值和最小值的差。
    • 方差(Variance):衡量數據值與平均數之間差異的平方的平均值。
    • 標準差(Standard Deviation):方差的平方根,也是衡量數據分散程度的指標。
  3. 分布形狀?:

    • 偏度(Skewness):衡量數據分布的不對稱性,正偏度表示數據右尾長,負偏度表示數據左尾長。
    • 峰度(Kurtosis):衡量數據分布的尖峭程度,高峰度表示數據分布比正態分布更尖銳。
  4. 頻率分布?:

    • 統計數據中各個不同值出現的次數或頻率。

學習的過程中可以使用一些比較實際的數據進行嘗試哈,推薦大家可以拿以往高教杯數學建模的賽題進行嘗試,賽題網址在(https://dxs.moe.gov.cn/zx/a/hd_sxjm_sthb/230523/1840580.shtml),有數據分析相關的題以及相關的大量數據。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/89016.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/89016.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/89016.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JAVA青企碼協會模式系統源碼支持微信公眾號+微信小程序+H5+APP

Java青企碼協會系統源碼:構建全渠道數字化管理平臺(多端融合精準服務)在政策紅利與數字化轉型的雙重驅動下,青年企業協會正面臨資源對接低效、會員粘性不足、跨域協同困難等痛點。基于Java技術棧的青企碼協會系統,通過…

Python 中調用阿里云 OCR(Optical Character Recognition,光學字符識別)服務

在 Python 中調用阿里云 OCR(Optical Character Recognition,光學字符識別)服務,通常需要使用阿里云的 SDK。OCR 服務屬于阿里云“視覺智能(Vision Intelligence)”產品線的一部分,調用時需通過…

網絡基礎協議綜合實驗

本文結合所學的一些基礎網絡協議來完成一個綜合性的實驗(實驗完整代碼放在最后)會先說明使用協議的原理,然后分析具體在拓補圖中的應用過程,最后再給出配置明確實驗目標:拓撲分 核心層(R1)、匯聚…

圖機器學習(5)——無監督圖學習與淺層嵌入方法

圖機器學習(5)——無監督圖學習0. 前言1. 無監督圖嵌入2. 矩陣分解2.1 圖分解2.2 高階鄰接保留嵌入2.3 帶有全局結構信息的圖表示3. skip-gram 模型3.1 DeepWalk3.2 Node2Vec3.3 Edge2Vec3.4 Graph2Vec0. 前言 無監督機器學習是指訓練過程中不利用任何目…

lua中檢查靜態常量是否正確引用

lua中檢查靜態常量是否正確引用思路代碼因在項目開發中會出現引用了不存在的常量,為了方便檢查這種情況,所以想著添加針對性腳本check 思路 加載要檢查的常量結構到KEYWORD通過gmatch匹配指定路徑下的所有文件,依次檢查引用到目標變量的key是…

考完數通,能轉云計算/安全方向嗎?轉型路徑與拓展路線分析

不少網工考完 HCIE數通 后,都會面臨一個現實問題:“能不能往云計算、安全這些熱門方向轉?”可以,而且非常值得。但怎么轉、學什么、有沒有路線圖,是關鍵。一、為什么考完HCIE數通后適合轉方向?技術基礎扎實…

2.邏輯回歸、Softmax回歸——鳶尾花大作戰

邏輯回歸 邏輯回歸其實并不是回歸,而是一個分類算法 分類問題:郵件分類、圖像識別、疾病診斷、文字情感分析、金融欺詐檢測 根據歷史數據,預測樣本是屬于哪個類別,通過數據擬合分界 主要用于二分類任務 邏輯回歸公式 事實上是在多…

【Lucene/Elasticsearch】**Query Rewrite** 機制

這段話描述的是 Lucene/Elasticsearch 的 **Query Rewrite** 機制,核心一句話:> **把“高級”或“邏輯”查詢(如 PrefixQuery、WildcardQuery、RangeQuery)在真正執行前,拆成最底層的、可直接倒排索引查的“原子查詢…

小智完整MCP交互流程(以調節音量為例)

1. 初始化階段 - MCP工具注冊 在 mcp_server.cc 中,音量控制工具在 AddCommonTools() 中注冊: AddTool("self.audio_speaker.set_volume", "Set the volume of the audio speaker. If the current volume is unknown, you must call self…

極狐GitLab CEO 柳鋼——極狐 GitLab 打造中國企業專屬 AI 編程平臺,引領編程新潮流

當下,AI 編程已成為人工智能大模型領域的耀眼明星,是公認的最好應用領域之一。其發展速度驚人,從最初簡單的代碼建議、代碼補全等基礎智能功能,一路高歌猛進,如今已涵蓋智能單元測試、智能代碼審核、智能體編程、代碼倉…

tiktok 彈幕 逆向分析

聲明: 本文章中所有內容僅供學習交流使用,不用于其他任何目的,抓包內容、敏感網址、數據接口等均已做脫敏處理,嚴禁用于商業用途和非法用途,否則由此產生的一切后果均與作者無關! 逆向分析部分python代碼部分python代碼…

Java學習打卡22(JAVA中的錯誤Error和異常Exception)

異常( Exception ):軟件程序在運行過程中,出現的不期而至的各種情況,如:文件找不到、網絡連接失敗、非法參數等。要理解JAVA異常處理是如何工作的,需要掌握以下三種類型的異常:檢查性…

AntV G6 基礎元素詳解(React版)

一、初識 AntV G6 AntV G6 是螞蟻集團推出的專業級圖可視化引擎,適合構建關系圖譜、拓撲圖、流程圖等場景。相比其他圖形庫,G6 提供完整的布局算法 和交互體系 ,開發者在 10 分鐘內即可搭建可交互的圖應用。 技術特點速覽: 支持 C…

【解決】聯想電腦亮度調節

更新后圖標變大調節分辨率然后亮度就不能調節了快捷鍵WindowsX打開設備管理器右鍵顯卡更新驅動程序選擇“瀏覽我的電腦以查找驅動程序(R)”選擇“讓我從計算機上的可驅動程序列表中選取(L)”點擊下一步成功解決

將Blender、Three.js與Cesium集成構建物聯網3D可視化系統

將Blender、Three.js與Cesium集成構建物聯網3D可視化系統,可實現從精細設備建模到宏觀地理空間展示的全棧能力。以下是技術整合方案及典型應用場景:一、技術棧分工與集成邏輯 #mermaid-svg-gCvcBVB9ebl092ap {font-family:"trebuchet ms",verd…

用TensorFlow進行邏輯回歸(一)

這一節我們用TensorFlow定義簡單的分類器。首先考慮分類器的方程式是什么是值得的。數學習的技巧是使用sigmoid函數。sigmoid函數繪制如圖3-40, 通常標記為σ, 是實數域里的函數取值(0, 1)。這個特征很便利,因為我們可以將sigmoid的輸出解釋為事件發現的概率。 (轉…

【Java代碼審計(2)】MyBatis XML 注入審計

代碼背景:某公司使用 MyBatis 作為持久層框架,登錄功能如下: Java 接口代碼: public interface UserMapper {User findByUsernameAndPassword(Param("username") String username,Param("password") String p…

Spring Boot目錄變文件夾?3步解決!

在 Spring Boot 項目中,當你在 src/main/java 下看到目錄結構而不是包結構時,這通常是 IDE(如 IntelliJ IDEA)的顯示問題或項目配置問題。以下是原因和解決方案:問題原因IDE 未正確識別 Java 源代碼根目錄 src/main/ja…

Appium源碼深度解析:從驅動到架構

Appium源碼深度解析:從驅動到架構 Appium 源碼概覽 Appium 是一個開源的移動自動化測試框架,支持跨平臺(iOS、Android)和多種編程語言(Java、Python 等)。其源碼托管在 GitHub 上,主要由 JavaScript 和 Node.js 實現,核心邏輯圍繞客戶端-服務器架構設計。 GitHub 倉庫…

給 Excel 整列空格文字內容加上前綴:像給文字穿衣服一樣簡單!

目錄 步驟一:選中目標列 打開Excel表格并定位列點擊列標題選中整列 步驟二:輸入公式,變身“魔法” 在公式編輯欄輸入公式按下回車鍵查看效果 步驟三:向下填充,批量處理 鼠標定位到單元格右下角按住鼠標左鍵向下拖動填充…