PCA算法降維代碼示例

這段代碼將數據進行PCA降維至3維,并繪制一個三維散點圖,展示降維后的前3個主成分。

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
import matplotlib.colors as mcolors
from mpl_toolkits.mplot3d import Axes3D# 讀取數據
file_path = '4_SmCrTe3_Study_AFM_Select.txt'
data = pd.read_csv(file_path, sep='\t', header=None)# 命名列
columns = ['ID', 'f1', 'f2', 'f3', 'f4', 'f5', 'f6', 'f7', 'Energy', 'Unused']
data.columns = columns# 刪除不需要的列
data = data.drop(columns=['ID', 'Unused'])# 數據概覽
print(data.describe())# 分析Energy列的統計數據
energy_stats = data['Energy'].describe()
print("\nEnergy column statistics:")
print(energy_stats)# 1. 直方圖(1_Energy_Analysis_Histogram.png)
plt.figure(figsize=(12, 6))# 直方圖
plt.subplot(1, 2, 1)
sns.histplot(data['Energy'], kde=True)
plt.title('Energy Distribution')
plt.xlabel('Energy')# 在直方圖中標注count數量
for patch in plt.gca().patches:height = patch.get_height()plt.annotate(f'{height:.0f}', (patch.get_x() + patch.get_width() / 2, height), ha='center', va='bottom')# 第二個直方圖,用于替代箱線圖
plt.subplot(1, 2, 2)
sns.histplot(data['Energy'], bins=30, kde=True)
plt.title('Energy Distribution (Detailed)')
plt.xlabel('Energy')# 在直方圖中標注count數量
for patch in plt.gca().patches:height = patch.get_height()plt.annotate(f'{height:.0f}', (patch.get_x() + patch.get_width() / 2, height), ha='center', va='bottom')plt.tight_layout()
plt.show()# 檢查并處理NaN值
print("\nNumber of NaN values in each column:")
print(data.isna().sum())# 使用插值方法填補NaN值
data = data.interpolate()# 再次檢查NaN值是否已經處理
print("\nNumber of NaN values in each column after interpolation:")
print(data.isna().sum())# 2. 散點圖(2_Energy_Analysis_Scatter.png)
plt.figure(figsize=(12, 6))
sns.scatterplot(data=data, x=data.index, y='Energy', color='dodgerblue')
plt.title('Selected SmCrTe3 Energy Distribution', fontsize=15)
plt.xlabel('Sample Index', fontsize=12)
plt.ylabel('Energy (meV)', fontsize=12)
plt.show()# 3. 熱力圖(3_Single_f-Orbital_Couplings_with_Energy_Hot.png)
plt.figure(figsize=(12, 8))
sns.heatmap(data.corr(), annot=True, cmap='coolwarm', center=0, linewidths=0.5)
plt.title('Correlation Matrix of f-Orbital Occupations and Energy', fontsize=15)
plt.show()# 雙軌道和能量關系(4_Double_f-Orbital_Couplings_with_Energy_Hot.png)
couplings = pd.DataFrame()
for i in range(1, 8):for j in range(i + 1, 8):couplings[f'f{i}*f{j}'] = data[f'f{i}'] * data[f'f{j}']
couplings['Energy'] = data['Energy']# 計算耦合特征與能量的相關性
coupling_correlation = couplings.corr()['Energy'][:-1].values# 初始化7x7矩陣為0
coupling_correlation_matrix = pd.DataFrame(0, index=[f'f{i}' for i in range(1, 8)],columns=[f'f{j}' for j in range(1, 8)])index = 0
for i in range(1, 8):for j in range(i + 1, 8):correlation_value = coupling_correlation[index]coupling_correlation_matrix.loc[f'f{i}', f'f{j}'] = correlation_valuecoupling_correlation_matrix.loc[f'f{j}', f'f{i}'] = correlation_valueindex += 1# 繪制熱力圖
plt.figure(figsize=(10, 8))
sns.heatmap(coupling_correlation_matrix.astype(float), annot=True, cmap='coolwarm', fmt=".2f", annot_kws={"size": 10})
plt.title('Correlation of f-Orbital Couplings with Energy')
plt.xlabel('f-Orbital')
plt.ylabel('f-Orbital')
plt.show()# 主成分分析(PCA)
features = ['f1', 'f2', 'f3', 'f4', 'f5', 'f6', 'f7']
x = data[features]
y = data['Energy']# 標準化
scaler = StandardScaler()
x_scaled = scaler.fit_transform(x)# PCA降維
pca = PCA(n_components=3)
principal_components = pca.fit_transform(x_scaled)
pca_df = pd.DataFrame(data=principal_components, columns=['PC1', 'PC2', 'PC3'])
pca_df['Energy'] = y.values# 自定義顏色映射
cmap = mcolors.LinearSegmentedColormap.from_list("custom", ["red", "yellow", "green", "blue"])# 繪制PCA結果3D散點圖
fig = plt.figure(figsize=(16, 10))
ax = fig.add_subplot(111, projection='3d')# 繪制散點
sc = ax.scatter(pca_df['PC1'], pca_df['PC2'], pca_df['PC3'], c=pca_df['Energy'], cmap=cmap)# 添加顏色條
cbar = plt.colorbar(sc, ax=ax, pad=0.1)
cbar.set_label('Energy')# 設置軸標簽
ax.set_xlabel('PC1')
ax.set_ylabel('PC2')
ax.set_zlabel('PC3')
ax.set_title('PCA of f-Orbital Occupations (3D)')plt.show()

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/41380.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/41380.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/41380.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JAVA 發送短信信息工具類(騰訊云)

發送短信信息工具類 import cn.hutool.core.collection.CollUtil; import com.tencentcloudapi.common.Credential; import com.tencentcloudapi.common.exception.TencentCloudSDKException; import com.tencentcloudapi.sms.v20210111.SmsClient; import com.tencentcloudapi…

pyecharts可視化案例大全(21~30)

pyecharts可視化案例大全(21~30) 二十一、直方圖帶標記線(最大值,平均值等)二十二、折線圖帶自定義標記點二十三、折線圖帶百分號顯示二十四、象形圖自定義圖形二十五、水球圖自定義圖形二十六、GEO添加自定義坐標二十七、GEO 帶漣漪效果散點圖二十八、GEO熱力圖二十九、GEO…

關于一致性哈希

什么是一致性哈希? 定義和基本原理 一致性哈希(Consistent Hashing)是一種哈希算法,廣泛應用于分布式系統中,主要用于解決動態節點變化(如節點增加或減少)時的數據分布和負載均衡問題。 定義…

基于Java中的SSM框架實現野生動物公益保護系統項目【項目源碼+論文說明】計算機畢業設計

基于Java中的SSM框架實現野生動物公益保護系統演示 摘要 本系統按照網站系統設計的基本流程,遵循系統開發生命周期法和結構化方法,基于Java語言設計并實現了野生動物公益保護系統。該系統基于瀏覽器/服務器模式,采用JSP技術,后臺…

MySQL之備份與恢復(六)

備份與恢復 文件系統快照 先決條件和配置 創建一個快照的消耗幾乎微不足道,但還是需要確保系統配置可以讓你獲取在備份瞬間的所有需要的文件的一致性副本。首先,確保系統滿足下面這些條件。 1.所有的InnoDB文件(InnoDB的表空間文件和InnoDB的事務日志…

C++學習第十三天——stack/queue的使用及底層剖析雙端隊列容器適配器

? 少年的旅途應是星辰大海 🌏 📃個人主頁:island1314 🔥個人專欄:C學習 🚀 歡迎關注:👍點贊 👂&am…

學會python——用python制作一個繪圖板(python實例十九)

目錄 1.認識Python 2.環境與工具 2.1 python環境 2.2 Visual Studio Code編譯 3.制作一個繪圖板 3.1 代碼構思 3.2 代碼實例 3.3 運行結果 4.總結 1.認識Python Python 是一個高層次的結合了解釋性、編譯性、互動性和面向對象的腳本語言。 Python 的設計具有很強的可…

昇思25天學習打卡營第12天| 基于MindNLP+MusicGen生成自己的個性化音樂

之前都是看圖文類的東西,今天體驗一點不一樣的。來點聽力的內容。 mindspore有音樂生成模型MusicGen,MusicGen支持兩種生成模式:貪心(greedy)和采樣(sampling)。在實際執行過程中,采…

京東金融大數據分析平臺總體架構:剖析和解讀

京東金融大數據分析平臺總體架構:剖析和解讀 在現代金融行業中,大數據分析已成為決策支持和業務創新的重要工具。京東金融憑借其強大的大數據分析平臺,成功地將海量數據轉化為洞察力,為企業和用戶提供優質服務。本文將深入探討京…

代碼隨想錄訓練營第二十九天 134加油站 135分發糖果 860檸檬水找零 406根據身高重建隊列

第一題: 原題鏈接:134. 加油站 - 力扣(LeetCode) 思路: 需要三個變量,一個變量start記錄結果也就是出發的第一個加油站,一個變量curSum來記錄此時加油耗油后剩余的油量,如果發現c…

微前端的需求有哪些?微前端的原理是怎么樣的?為什么這么設計,及微前端的應用場景是什么?對有些客戶,前端的重要性高于后端

微前端(Micro Frontends)是將前端應用拆分成多個獨立、可部署的部分,每個部分可以由不同的團隊獨立開發、測試、部署和維護。這種架構類似于微服務在后端的應用,是為了應對復雜前端應用的維護和擴展問題而提出的。 來龍去脈 背景…

【吳恩達機器學習-week2】可選實驗:使用 Scikit-Learn 進行線性回歸

支持我的工作 🎉 📃親愛的朋友們,感謝你們一直以來對我的關注和支持! 💪🏻 為了提供更優質的內容和更有趣的創作,我付出了大量的時間和精力。如果你覺得我的內容對你有幫助或帶來了歡樂&#xf…

庫表設計(基礎)-實體與設計關系

實體關系分析 1 實體關系是指系統事務之間的聯系。 2 實體關系需要雙向分析。 3 實體關系決定表關系。 實體關系的種類 1 一對一 2 一對多 3 多對多 舉例: 上面關系如下: 班級和學生 : 1:N 學生和課程:N : N 學生和學籍檔案&a…

MISRA C 和MISRA C++:汽車軟件安全的守護者

一、MISRA C與C語言 自1972年Dennis MacAlistair Ritchie在美國貝爾實驗室創造C語言以來,它已成為當今最流行的編程語言之一。C語言以其使用的靈活性、功能的豐富性而廣受歡迎,但同時也因其寬松的語法和不嚴格的數據類型給開發的產品帶來了安全隱患。 …

如何批量給文件名添加編號?這個方法速度快!操作簡單!

如何批量給文件名添加編號?這個方法速度快!操作簡單!批量給文件重命名,這個是在工作中和生活中經常要用到的一個小技巧,許多人還不知道怎么操作,當然如果要按一定的格式和規律重命名大量的文件,…

Linux內核 -- 多核通信之RPMSG驅動使用

Linux Kernel RPMsg 驅動注冊流程的高級用法與注意事項 在Linux Kernel中,RPMsg(Remote Processor Messaging)是一種用于不同處理器之間通信的機制,通常用于多核系統中的通信,如主處理器和協處理器之間的消息傳遞。了…

巴西電子游戲PWA借助海外快手kwai社交廣告出海趨勢解讀

巴西電子游戲PWA借助海外快手kwai社交廣告出海趨勢解讀 在數字化時代的浪潮中,電子游戲行業蓬勃發展,而廣告投放策略也隨之日新月異。特別是在巴西這樣一個充滿活力的市場,電子游戲的普及與流行程度不容小覷。在這樣的背景下,在數…

java數據結構集合復習之ArrayList與順序表

前言: 這是我最一年學習java的一部分的回顧總結 1.List 1.1什么是List? 在框架集合中,List是一個接口,繼承自Collection。 Collection也是一個接口,該接口中規范了后序容器中常用的一些方法,具體如下所示 --------boolean add(E e)尾插 evoid a…

[pwn]靜態編譯

靜態編譯 1. 棧足夠大的情況下 程序在ida打開后,左側的函數欄目沒有紅色(系統調用的函數),而只有一些靜態函數,通常這類文件的大小會必普通的pwn題程序要大得多。 這種靜態編譯的題沒有調用庫函數,也就沒…

百度云智能媒體內容分析一體機(MCA)建設

導讀 :本文主要介紹了百度智能云MCA產品的概念和應用。 媒體信息海量且復雜,采用人工的方式對視頻進行分析處理,面臨著效率低、成本高的困難。于是,MCA應運而生。它基于百度自研的視覺AI、ASR、NLP技術,為用戶提供音視…