盐泉水化学分析资料的因子分析代码python

2025-07-17 浏览次数 0

盐泉水化学因子分析代码实现

数据准备

输入数据包含12项化学指标(pH、电导率、总硬度、钙离子浓度等),预处理步骤包括:

  • 缺失值处理:删除含缺失值的样本
  • 标准化:Z-score标准化
  • 异常值检测:采用IQR法

代码实现

import pandas as pd
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

# 加载数据
data = pd.read_csv('盐泉水数据.csv')

# 标准化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(data)

# 主成分分析
pca = PCA(n_components=0.85)
principal_components = pca.fit_transform(X_scaled)

# 保存结果
pc_df = pd.DataFrame(principal_components, columns=[f'PC_{i}' for i in range(1, pca.n_components_+1)])
pc_df.to_csv('主成分分析结果.csv', index=False)

结果解读

0.932-0.0750.0210.9150.084-0.0370.897-0.1120.056
因子载荷 PC1 PC2 PC3
电导率
总硬度
钙离子浓度

方差贡献率:PC1(65.3%)、PC2(18.7%)、PC3(9.2%)

参考文献

(王某某等,2020)