证明是什么意思| 阴阳怪气是什么意思| 阴囊瘙痒挂什么科室| 截单是什么意思| 人授后吃什么容易着床| 面粉是什么做的| 壮丁是什么意思| 单核细胞是什么| 坤字五行属什么| 具象是什么意思| 井柏然原名叫什么| 卵巢多囊症是什么原因造成| 为什么会有结石| 夏天有什么花开| 荷尔蒙是什么东西| 叶什么什么龙| 血脂高吃什么药效果好| 筋膜炎有什么症状| 上吐下泻吃什么食物好| 转氨酶高吃什么食物好| 金酒是什么酒| 清高是什么意思| 鸡蛋和什么不能一起吃吗| 性格是什么| 政法委是干什么的| 3月12号是什么星座| 感知能力是什么意思| 北极有什么动物| 今天是个什么日子| 春的五行属性是什么| 百合什么时候种植| 五十年是什么婚| 胸有成竹是什么意思| 凤梨跟菠萝有什么区别| 约谈是什么意思| 什么叫矫正视力| 咳嗽两个月了一直不好是什么原因| 5月10号是什么日子| 代用茶是什么意思| 治疗阳痿吃什么药| 钱是什么意思| 涤塔夫是什么面料| 上感是什么意思| 十恶不赦是什么意思| 什么样的沙滩| 嘴唇是紫色的是什么原因| 梦见结婚是什么意思| 什么的眼光| 豆蔻年华什么意思| 聪明反被聪明误是什么意思| 今年17岁属什么| 小孩肚子疼拉肚子吃什么药| 六十岁是什么之年| mup是什么意思| 胃气上逆是什么原因| 鸽子喜欢吃什么食物| 杭州有什么景点| us是什么意思| 白白的云朵像什么| 饭后痰多是什么原因| 75年属什么生肖| 蛇床子是什么| 盐酸氯米帕明片有什么作用| 大校是什么级别| 加油站为什么不能打电话| 11月2日什么星座| 天天拉肚子是什么原因| 苦瓜汤为什么要放黄豆| 去医院看脚挂什么科| 柠檬水喝多了有什么坏处| 1.27是什么星座| 桃园三结义是什么意思| 静待佳音什么意思| 毕业送什么花| 澳大利亚位于什么板块| 口了又一是什么字| 怀孕会出现什么状况| 阴唇黑是什么原因| 赭是什么颜色| 晚上扫地有什么说法| 对什么什么感兴趣| 胆囊炎挂什么科| 婴儿奶粉过敏有什么症状| 月经量少什么原因| 世界上最贵的东西是什么| 圆是什么结构| 什么是豆制品| l是什么字| 什么是次数| oo什么意思| 喝什么能变白| 软肋骨炎吃什么药对症| 什么的动作| 消停是什么意思| 西双版纳有什么好玩的地方| 超声检查是什么| 人肉是什么味道| 人授后吃什么容易着床| 吃什么瘦肚子| 转氨酶异常是什么意思| 道德经适合什么人看| 什么花粉| 总是睡不着觉是什么原因| 手和脚发麻是什么原因| 天地始交是什么意思| 氯气是什么颜色| 梦见白萝卜是什么意思| 螃蟹是什么季节吃的| 康桑密达是什么意思| 线索细胞阳性什么意思| 土家族是什么族| 女人的排卵期一般是什么时候| 居心叵测是什么意思| 接下来有什么节日| 剪不断理还乱什么意思| 跳爵士舞穿什么衣服| 鸡肚是什么部位| 千年等一回是什么生肖| 山竹有什么功效| 颈椎曲度变直有什么症状| 饱不洗头饿不洗澡是为什么| 87岁属什么| 木吉他什么牌子比较好| 抗缪勒氏管激素是检查什么的| 斗是什么意思| 梦见大狼狗是什么意思| 八十岁叫什么之年| 孕妇dha什么时候开始吃| 宝宝眼屎多是什么原因| 非你莫属是什么意思| 左肺下叶纤维灶是什么意思| 法大大是什么| 无聊干什么| 脑梗都有什么症状| 嗓子痒痒老想咳嗽是什么原因| 肚子疼拉肚子吃什么药| 九秩是什么意思| 立春之后是什么节气| 七月七日是什么节日| 鼓风机是干什么用的| 拔罐挂什么科| 仔细的什么| 金牛座跟什么星座最配| 康复治疗技术学什么| 糖类抗原125偏高说明什么| 糖类抗原153偏高是什么原因| 多饮多尿可能是什么病| npv是什么病毒| 祖籍是什么意思| 四大皆空是指什么| 猩红热是什么| 办护照需要什么证件| 吃什么水果可以护肝| 6.25什么星座| 汽车抖动是什么原因| 剁椒鱼头属于什么菜系| 七月七日是什么生肖| 什么能美白皮肤而且效果快| 风调雨顺的下联是什么| 肝实质弥漫性回声改变什么意思| 天麻泡水喝有什么功效| 左手食指麻木是什么原因引起的| 贡米是什么米| 咽喉肿痛吃什么药好| 潸然泪下是什么意思| 1902年属什么生肖| 多囊卵巢综合症吃什么药| 吃什么补充维生素b6| 甲状腺结节是什么意思| 狗生小狗前有什么征兆| 孕妇吃猕猴桃对胎儿有什么好处| 掌心有痣代表什么| 左耳朵痒代表什么预兆| 屎特别臭是什么原因| praal00是什么型号| 老年人总睡觉是什么原因| 排卵什么意思| 今天晚上吃什么| 坐月子是什么意思| 骨龄是什么意思| 转网是什么意思| 晨僵是什么症状| 城五行属什么| 奶奶的哥哥叫什么| 烂脚丫用什么药能治除根| 腿疼去医院挂什么科| 日月同辉是什么意思| 色拉油是什么| 胃胀吃什么药好| 十二指肠胃溃疡吃什么药| 婴儿增强免疫力吃什么| 白天尿少晚上尿多什么原因| 五花八门什么意思| 猫是什么| 胸膜炎吃什么药| 鳄龟吃什么食物| 点字五行属什么| 五险一金什么时候开始交| 什么馅的饺子好吃| 脸上长痣是什么原因造成的| 什么的水流| 肝郁有什么症状| 两边太阳胀痛什么原因引起的| 头晕呕吐是什么原因| 晒背什么时候最佳时间| 电解质是什么意思| abc是什么药| 常打嗝是什么原因| 什么是安全期| 霏字五行属什么| 儿童查微量元素挂什么科| 梦见自己鼻子流血是什么预兆| 复方甘草酸苷片治什么病| 十月一日是什么日子| 扁尖是什么| 粉玫瑰代表什么意思| 福字挂在家里什么位置最合适| 上不下要念什么| 做健身教练有什么要求| 什么克木| 唾液有臭味是什么原因| 炖肉放山楂起什么作用| 肝硬化有什么症状| 和谐的意思是什么| 桂圆有什么功效| 立事牙疼吃什么药| 颐养天年是什么意思| 尿道疼是什么原因| 小便无力吃什么药| 鬼节会开什么生肖| 书中自有颜如玉什么意思| 孕妇喝可乐对胎儿有什么影响| 甜瓜是什么瓜| 覆盆子是什么| 肉馅可以做什么美食| 4月9日什么星座| 梦到砍树是什么意思| coat是什么意思中文| 低血糖挂什么科| 胆囊结石吃什么药| 什么是强迫症有哪些表现| 雌激素是什么意思| 支原体抗体阳性是什么意思| 两个人背靠背是什么牌子| dsa检查是什么意思| 心思重是什么意思| lesportsac什么牌子| 什么的摇动| 孕妇贫血吃什么| 儿童上火了吃什么降火最快| 婴儿反复发烧是什么原因| 胎盘位于子宫后壁是什么意思| 肝功能不全是什么意思| 命硬的人有什么特征| 璨字五行属什么| 乳牙是什么| 尿结石是什么症状表现| 一产二产三产分别包括什么| 田野是什么意思| 无语是什么意思| 南瓜与什么食物相克| 喝柠檬水有什么好处和坏处| 爸爸的爸爸叫什么儿歌| 人山人海是什么生肖| 百度

基于主成分分析(PCA)的数据降维

一、概述

百度   “如果是公务活动,实在想订,可以找我们上级(主管单位)问问,他们如果愿意安排,我们可以再想想办法。

??主成分分析(Principal Component Analysis,PCA)是一种用于数据降维的方法,其核心目标是在尽可能保留原始数据信息的前提下,将高维数据映射到低维空间。该算法基于方差最大化理论,通过寻找数据的主要变化方向(即主成分),将原始数据投影到这些方向上,从而实现降维。

二、算法过程

1.数据中心化

??指将数据的每个特征减去其均值,使得数据的均值为 0。这样做的目的是将数据的分布中心移到原点,便于后续计算协方差矩阵等操作,因为协方差矩阵的计算对于数据的中心位置比较敏感,中心化后可以更好地反映数据的内在结构和相关性。

值得说明的是,在某些情况下,特别是当不同特征的量纲差异较大或者数据的分布比较复杂时,除了数据中心化外,还会进行数据标准化。数据标准化是指将数据的每个特征减去对应特征列的均值再除以标准差,这样可以进一步消除不同特征在尺度上的差异,使得不同特征在后续的分析中具有相同的重要性,避免因特征尺度不同而导致的结果偏差。

2. 计算协方差矩阵

??对中心化后的数据矩阵计算协方差,协方差矩阵描述了数据特征之间的相关性。
????总体协方差矩阵计算公式为 \(Cov=\frac{1}{n}X_{c}^{T}X_c\)
????样本协方差矩阵计算公式为 \(S=\frac{1}{n-1}X_{c}^{T}X_{c}\)

??其中\(n\)是样本数量。实际计算中通常使用样本协方差,其中的\(\frac{1}{n-1}\)是总体协方差的无偏估计。

3. 计算协方差矩阵的特征值和特征向量

??通过求解协方差矩阵\(S\)的特征方程 \(\left| S-\lambda I \right|=0\) ,得到特征值\(\lambda_i\)和对应的特征向量\(v_i\)。特征值反映了数据在对应特征向量方向上的方差大小,特征值越大,说明数据在该方向上的变化程度越大,包含的信息越多。

4. 选择主成分

??将特征值按照从大到小的顺序排列,对应的特征向量也随之重新排序。选择前 \(k\) 个最大的特征值及其对应的特征向量,这些特征向量构成了新的低维空间的基向量。\(k\) 的选择通常基于一个阈值,例如保留能够解释原始数据方差累计百分比达到一定比例(如 80%、90% 等)的主成分。

5.数据投影

??将原始数据投影到由选定的 \(k\) 个特征向量构成的低维空间中,得到降维后的数据。投影的计算公式为

\[Y=X_cW \]

??其中,\(X_c\)是中心化后的数据矩阵,\(W\)是由前\(k\)个特征向量组成的投影矩阵,\(Y\) 是降维后的数据矩阵。?

三、示例

??现有一组二维数据 \(X= \begin{bmatrix} 1 & 2 \\ 2 & 3 \\ 3 & 4 \\ 4 & 5 \\ 5 & 6 \end{bmatrix}\) ,下面使用PCA方法进行降维,将其从二维降至一维。

1.数据标准化

??首先,计算每列的均值:
????第一列均值:\(\bar x_1=\frac{1+2+3+4+5}{5}=3\)
????第二列均值:\(\bar x_2=\frac{2+3+4+5+6}{5}=4\)
??然后,对矩阵\(X\)进行中心化,得到矩阵\(X_c\)

????\(X_c=\)\(\begin{bmatrix} 1-3 & 2-4 \\ 2-3 & 3-4 \\ 3-3 & 4-4 \\ 4-3 & 5-4 \\ 5-3 & 6-4 \end{bmatrix}\)\(=\)\(\begin{bmatrix} -2 & -2 \\ -1 & -1 \\ 0 & 0 \\ 1 & 1 \\ 2 & 2 \end{bmatrix}\)

2. 计算协方差矩阵

??协方差矩阵\(S\)的计算公式为\(S=\frac{1}{n-1}X_{c}^{T}X_{c}\),其中\(n\)是样本数量。

????\(X_c^TX_c=\)\(\begin{bmatrix} -2 & -1 &0 & 1 & 2 \\ -2 & -1 &0 & 1 & 2 \end{bmatrix}\)\(\begin{bmatrix} -2 & -2 \\ -1 & -1 \\ 0 & 0 \\ 1 & 1 \\ 2 & 2 \end{bmatrix}\)\(=\)\(\begin{bmatrix} 10 & 10 \\ 10 & 10 \end{bmatrix}\)

??则协方差矩阵 \(S\)

????\(S=\frac{1}{5-1}\)\(\begin{bmatrix} 10 & 10 \\ 10 & 10 \end{bmatrix}\)\(=\)\(\begin{bmatrix} 2.5 & 2.5 \\ 2.5 & 2.5 \end{bmatrix}\)

3. 计算协方差矩阵的特征值和特征向量

??对于矩阵 \(S\),其特征方程为 \(\left| S-\lambda I \right|=0\) ,其中 \(I\) 是单位矩阵。

????\(\begin{vmatrix} 2.5-\lambda & 2.5 \\ 2.5 & 2.5-\lambda \end{vmatrix}\)\(=\)\({(2.5-\lambda)}^{2}-2.5^2\)\(=\)\(0\)

??展开可得 \(\lambda^2-5\lambda=0\) ,解得特征值为 \(\lambda_1=5\)\(\lambda_2=0\)

求特征向量:
??对于 \(\lambda_1=5\) 求解 \((S-5I)v_1=0\)

????\(\begin{bmatrix} 2.5-5 & 2.5 \\ 2.5 & 2.5-5 \end{bmatrix}\)\(\begin{bmatrix} v_{11} \\ v_{12} \end{bmatrix}\)\(=\)\(\begin{bmatrix} -2.5 & 2.5 \\ 2.5 & -2.5 \end{bmatrix}\)\(\begin{bmatrix} v_{11} \\ v_{12} \end{bmatrix}\)\(=\)\(\begin{bmatrix} 0 \\ 0 \end{bmatrix}\)

\(v_{11}=1\) ,则 \(v_{12}=1\) ,单位化后得到特征向量 \(v_1= \begin{bmatrix} \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} \end{bmatrix}\)

??对于 \(\lambda_2=0\) ,求解 \((S-0I)v_2=0\)

????\(\begin{bmatrix} 2.5 & 2.5 \\ 2.5 & 2.5 \end{bmatrix}\)\(\begin{bmatrix} v_{21} \\ v_{22} \end{bmatrix}\)\(=\)\(\begin{bmatrix} 0 \\ 0 \end{bmatrix}\)

\(v_{21}=1\) ,则 \(v_{22}=-1\) ,单位化后得到特征向量 \(v_2= \begin{bmatrix} \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} \end{bmatrix}\)

4. 选择主成分

??按照特征值从大到小排序,选择前 \(k\) 个特征值对应的特征向量作为主成分。这里我们选择最大特征值 \(\lambda_1=5\)

??对应的特征向量 \(v_1= \begin{bmatrix} \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} \end{bmatrix}\) 作为主成分。

5. 数据投影

??将中心化后的数据 \(X_c\) 投影到主成分上,得到降维后的数据

????\(Y=X_cv_1=\)\(\begin{bmatrix} -2 & -2 \\ -1 & -1 \\ 0 & 0 \\ 1 & 1 \\ 2 & 2 \end{bmatrix}\)\(\begin{bmatrix} \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} \end{bmatrix}\)\(=\)\(\begin{bmatrix} -2\sqrt{2} \\ -\sqrt{2} \\ 0 \\ \sqrt{2} \\ 2\sqrt{2} \end{bmatrix}\)

四、Python实现

scikit-learn实现:

import numpy as np
from sklearn.decomposition import PCA

# 数据
data = np.array([[1, 2],
                 [2, 3],
                 [3, 4],
                 [4, 5],
                 [5, 6]])

# 创建PCA对象,指定降维后的维度为1
pca = PCA(n_components=1)

# 使用PCA对数据进行降维
reduced_data = pca.fit_transform(data)

# 降维后的数据
print("降维后的数据:")
print(reduced_data)



函数实现:

import numpy as np

def pca(X, n_components):
    # 数据中心化
    X_mean = np.mean(X, axis=0)
    X_centered = X - X_mean

    # 计算协方差矩阵
    cov_matrix = np.cov(X_centered, rowvar=False)

    # 计算协方差矩阵的特征值和特征向量
    eigenvalues, eigenvectors = np.linalg.eig(cov_matrix)

    # 对特征值进行排序,获取排序后的索引
    sorted_indices = np.argsort(eigenvalues)[::-1]

    # 选择前n_components个最大特征值对应的特征向量
    top_eigenvectors = eigenvectors[:, sorted_indices[:n_components]]

    # 将数据投影到选定的特征向量上
    X_reduced = np.dot(X_centered, top_eigenvectors)

    return X_reduced

# 数据
X = np.array([[1,2],
              [2,3],
              [3,4],
              [4,5],
              [5,6]])

# 降至1维
n_components = 1
X_reduced = pca(X, n_components)

# 降维后的数据
print("降维后的数据:")
print(X_reduced)



End.



下载

posted @ 2025-08-04 19:16  归去_来兮  阅读(323)  评论(0)    收藏  举报
腿肿脚肿是什么病的前兆 书卷气是什么意思 op什么意思 为什么科比叫黑曼巴 胃胀不消化吃什么药
秋天开什么花 男士长脸适合什么发型 海参和辽参有什么区别 忧心忡忡是什么意思 狒狒是什么意思
喝什么水去火 过敏性紫癜用什么药 牙龈起泡是什么原因 40min是什么意思 补气血吃什么最好最快
吊客是什么意思 心态崩了什么意思 头发长不长是什么原因怎么办 什么杯子不能装水 少将属于什么级别
米诺地尔有什么副作用hcv8jop4ns1r.cn 咀嚼什么意思hcv9jop3ns3r.cn 屏蔽一个人意味着什么hcv8jop7ns0r.cn 大便溏稀吃什么药hcv7jop9ns1r.cn 黑五是什么hcv9jop3ns5r.cn
兆上面是什么单位hcv7jop6ns1r.cn 有黄痰是什么原因hcv9jop1ns4r.cn 后期是什么意思啊hcv8jop7ns4r.cn 鬼代表什么数字0735v.com 离是什么生肖hcv7jop6ns2r.cn
八月初六是什么星座1949doufunao.com 木薯粉是什么inbungee.com 取保候审是什么意思还会判刑吗hcv9jop1ns0r.cn 咳嗽喉咙痛吃什么药hcv9jop2ns2r.cn 什么是邮箱地址hcv7jop9ns2r.cn
舌头裂缝是什么原因hcv9jop6ns5r.cn 为老不尊是什么意思jasonfriends.com 什么血型会导致不孕hcv8jop3ns1r.cn 新生儿贫血是什么原因造成的hcv8jop7ns7r.cn 仰望是什么意思hcv8jop9ns6r.cn
百度