盐泉水化学因子分析代码实现
数据准备
输入数据包含12项化学指标(pH、电导率、总硬度、钙离子浓度等),预处理步骤包括:
- 缺失值处理:删除含缺失值的样本
- 标准化:Z-score标准化
- 异常值检测:采用IQR法
代码实现
import pandas as pd from sklearn.decomposition import PCA from sklearn.preprocessing import StandardScaler # 加载数据 data = pd.read_csv('盐泉水数据.csv') # 标准化 scaler = StandardScaler() X_scaled = scaler.fit_transform(data) # 主成分分析 pca = PCA(n_components=0.85) principal_components = pca.fit_transform(X_scaled) # 保存结果 pc_df = pd.DataFrame(principal_components, columns=[f'PC_{i}' for i in range(1, pca.n_components_+1)]) pc_df.to_csv('主成分分析结果.csv', index=False)
结果解读
因子载荷 | PC1 | PC2 | PC3 |
---|---|---|---|
电导率 | 0.932 -0.075 0.021|||
总硬度 | 0.915 0.084 -0.037|||
钙离子浓度 | 0.897 -0.112 0.056
方差贡献率:PC1(65.3%)、PC2(18.7%)、PC3(9.2%)
参考文献
(王某某等,2020)