說明:如需數據可以直接到文章最后關注獲取。
1.數據背景???
Automobile數據集源自于對汽車市場深入研究的需求,旨在為汽車行業提供一個全面且詳細的資源,以便更好地理解影響汽車價格及性能的各種因素。該數據集最初由卡內基梅隆大學(Carnegie Mellon University)的研究人員收集并整理,并被廣泛用于機器學習和統計分析的教學與實踐中。其主要目的是通過包含多維度信息的數據集,支持從價格預測到車輛分類等多種任務的研究,幫助學術界和工業界的專家探索如何利用數據分析提升汽車設計、定價策略以及市場營銷的效果。
此數據集包含了來自不同制造商的汽車詳細屬性,包括但不限于制造地、燃料類型、引擎規格、車身樣式、驅動輪配置等。這些屬性不僅涵蓋了基本的物理尺寸如車長、車寬、車重等,還涉及了技術細節如發動機位置、馬力輸出等,以及經濟指標如城市和高速公路燃油消耗量等。此外,數據集中還包括了一些描述性統計變量,例如每輛汽車的價格區間和維修記錄等級,這使得它成為了一個理想的工具,可用于探索各種因素對汽車價值的影響,以及在不同市場條件下的表現。
Automobile數據集自發布以來,已被應用于多個領域的研究和實踐中,包括但不限于經濟學、工程學、計算機科學等。特別是在機器學習領域,該數據集常被用來進行回歸分析以預測汽車價格,或作為分類算法的基礎來評估車輛的燃油效率等級。隨著汽車行業向智能化、電動化方向的發展,此類數據集的重要性日益凸顯,不僅有助于改進現有的模型和技術,也為未來交通解決方案的設計提供了寶貴的參考。因此,持續更新和完善Automobile數據集,對于推動相關領域的進步具有重要意義。 ?
2.數據介紹
數據格式為xlsx格式。 ???
編號 | 變量名稱 | 描述 |
1 | price | 汽車的價格(單位:美元) |
2 | highway-mpg | 高速公路工況下的燃油效率(單位:每加侖行駛的英里數,MPG) |
3 | city-mpg | 城市工況下的燃油效率(單位:每加侖行駛的英里數,MPG) |
4 | peak-rpm | 發動機達到最大功率時的轉速(單位:每分鐘轉數,RPM) |
5 | horsepower | 發動機輸出功率(單位:馬力,hp) |
6 | compression-ratio | 發動機的壓縮比,表示氣缸內氣體被壓縮的程度 |
7 | stroke | 活塞行程(單位:英寸),即活塞從上止點到下止點的距離 |
8 | bore | 氣缸直徑(單位:英寸) |
9 | fuel-system | 燃油系統類型,例如單點噴射(mpfi)、多點噴射(spdi)等 |
10 | engine-size | 發動機排量(單位:立方厘米,cc) |
11 | num-of-cylinders | 氣缸數量,例如 4 缸、6 缸、8 缸 |
12 | engine-type | 發動機類型,例如直列式(dohc)、V 型(ohcv)等 |
13 | curb-weight | 整車空載重量(單位:磅) |
14 | height | 車輛高度(單位:英寸) |
15 | width | 車輛寬度(單位:英寸) |
16 | length | 車輛長度(單位:英寸) |
17 | wheel-base | 軸距(前后輪中心的距離,單位:英寸) |
18 | engine-location | 發動機位置,例如前置(front)、中置(rear) |
19 | drive-wheels | 驅動輪配置,例如前驅(fwd)、后驅(rwd)、四驅(4wd) |
20 | body-style | 車身樣式,例如轎車(sedan)、硬頂車(hardtop)、敞篷車(convertible)、SUV 等 |
21 | num-of-doors | 車門數量,例如 2 門、4 門 |
22 | aspiration | 進氣方式,例如自然吸氣(std)、渦輪增壓(turbo) |
23 | fuel-type | 燃料類型,例如汽油(gas)、柴油(diesel) |
24 | make | 汽車制造商(品牌),例如 Toyota、Ford 等 |
25 | normalized-losses | 標準化損失值,用于衡量車輛在事故或其他情況下的平均損失成本 |
26 | y | 風險等級評分 |
數據詳情如下(部分展示):?
3.數據獲取
關注下方名片? ? 回復1036獲取? ?或者? CSDN私信發消息獲取。