Part1:數據分析入門--信息統計
知識點:什么是提示詞(Prompt)?
在人工智能(AI)領域,"提示詞"是一個關鍵概念,它指的是輸入給AI模型的文本或指令,用于引導模型生成特定的輸出。
按照如下兩個要素進行組合的:
指標(講清楚表格構成和一些重要指標的含義)
要求(做什么樣的分析、畫什么樣的圖)
提示詞進化路線:
表格中有3張表格sheet,1.sheet是1群的統計數據,2.sheet是2群的統計數據,number.sheet是1.sheet和2.sheet數字列對應的興趣點,其中興趣點對應興趣數字列
現在需要統計1群和2群所有興趣點的統計結果,加上統計百分比的數據,并對統計百分比列按照倒序進行排列
修改為表格格式
請先統計出1群的結果,再統計出2群的結果,加上統計百分比的數據,并對統計百分比列按照倒序進行排列,行末尾加上總計,返回表格格式,注意兩個表格不要放在同一個表格中
將編號修改為整數?
百分比數值請以整數的形式輸出
導出結果為表格
請幫我把這兩個統計結果表格導出來,謝謝?
Part2:了解數據概況--描述性分析
知識點:什么是描述性分析?
描述性統計就像是給數據做一次“快照”。
它用一些簡單的數字和圖表來告訴我們數據集中的信息,比如數據的平均值、最大值、最小值,或者數據分布的形狀等。這些數字和圖表可以幫助我們快速了解數據的基本情況。
參考prompt
這里統計的是大學生對感興趣活動主題的調查結果,其中:
number.sheet是活動主題編號和主題詳情, 編號對應的1.sheet和2.sheet的數字列, 1.sheet是1班的數據,2.sheet是2班的數據。
請根據這份表格,完成描述性分析
- 有多少同學參與了問卷
- 不同選項數對應的同學人數和人數比例分別是多少
- 超過3個選項的回答是不合規的回答,不合規回答的同學人數和比例分別是多少 ...
小知識:描述性分析一般包括如下內容
集中趨勢度量?:
- 平均數(Mean):所有數據值的總和除以數據的數量。
- 中位數(Median):將數據從小到大排列后位于中間位置的值。
- 眾數(Mode):數據中出現次數最多的值。
離散程度度量?:
- 極差(Range):數據中最大值和最小值的差。
- 方差(Variance):衡量數據值與平均數之間差異的平方的平均值。
- 標準差(Standard Deviation):方差的平方根,也是衡量數據分散程度的指標。
分布形狀?:
- 偏度(Skewness):衡量數據分布的不對稱性,正偏度表示數據右尾長,負偏度表示數據左尾長。
- 峰度(Kurtosis):衡量數據分布的尖峭程度,高峰度表示數據分布比正態分布更尖銳。
頻率分布?:
- 統計數據中各個不同值出現的次數或頻率。
學習的過程中可以使用一些比較實際的數據進行嘗試哈,推薦大家可以拿以往高教杯數學建模的賽題進行嘗試,賽題網址在(https://dxs.moe.gov.cn/zx/a/hd_sxjm_sthb/230523/1840580.shtml),有數據分析相關的題以及相關的大量數據。