【www.shanpow.com--数学试题】
一:[等价矩阵]等价矩阵和相似矩阵的关系_数学_考研论坛(kaoyan.com)
等价矩阵和相似矩阵的关系:问:等价矩阵一定相似,还是相似矩阵一定等价 ?一些回答: 个人认为。等价不一定相似。因为等价矩阵是矩阵通过初等变换过来的。比如A=E通过变换初等变换可以变成B=2E。所以A与B等价。但他们的特征值是不同的。所以不相似。但相似一定等价。至于怎么证明我暂时不知道。 矩阵等价的充要条件是他们的秩相等(这里要区别于向量组等价)而相似的充要条件是存在可逆矩阵P,使得p^(-1)AP=B,必要条件是r(A)=r(B),A的特征值和B相同 总的来说相似必合同,合同必等价 个人认为相似可以推出等价,相似是等价的一种特殊情况 等价秩相等 合同正负惯性指数相同 相似特征值相等 所以 相似 推出合同 推出等价 相似必等价,等价未必相似 相似未必合同(只有当A,B均为实对称矩阵时相似才能推出合同),但相似必等价,等价未必相似。若A与B相似,由相似的定义P^(-1)AP=B,此时可令C=P^(-1),Q=P,则C,Q均可逆,即存在可逆矩阵C,Q使CAQ=B,由等价的定义知A与B等价。总结一下关系应该是这样的:对于矩阵A,B,相似和合同一定能推出等价;若A,B均为实对称矩阵则相似能推出合同;若A,B为实对称矩阵,且在正交变换下A与B合同则能推出相似。等价是限制最少的一种关系。
二:[等价矩阵]特征向量...
特征向量
维基百科,自由的百科全书
(重定向自特征向量)
跳转到: 导航, 搜索特征值与特征向量。在A变换的作用下,向量ξ仅仅在尺度上变为原来的λ倍。称ξ是A 的一个特征向量,λ是对应的特征值。图1. 在这个错切变换中,蒙娜丽莎的图像被变形,但是中心的纵轴在变换下保持不变。(注意:角落在右边的图像中被裁掉了。)蓝色的向量,从胸部到肩膀,其方向改变了,但是红色的向量,从胸部到下巴,其方向不变。因此红色向量是该变换的一个特征向量,而蓝色的不是。因为红色向量既没有被拉伸又没有被压缩,其特征值为1。所有沿着垂直线的向量也都是特征向量,它们的特征值相等。它们构成这个特征值的特征空间。
数学上,一个线性变换的一个特征向量(本征向量)是一个非退化向量,其方向在该变换[2]下不变。该向量在该变换下缩放的比例称为其特征值(本征值)。 图1给出了一幅图像的例子。通常一个变换可以由其特征值和特征向量完全表述。一个特征空间是相同特征值的特征向量的集合。
这些概念在纯数学和应用数学的众多领域中都有重要的应用。在线性代数和泛函分析之外,甚至在一些非线性的情况下,这些概念都是十分重要的。
“特征”一词来自德语的eigen,由希尔伯特在1904年首先在这个意义下使用(亥尔姆霍尔兹在更早的时候也在类似意义下使用过这一概念)。eigen一词可翻译为“自身的”,“特定于...的”,“有特征的”或者“个体的”—这强调了特征值对于定义特定的变换有多重要。
目录
[隐藏]
1 定义
2 例子
2.1 线性变换
2.2 其他例子
3 特征值方程
4 谱定理
5 矩阵的特征值和特征向量
5.1 计算矩阵的特征值和特征向量
5.1.1 符号演算
5.1.2 数值计算
5.2 性质
5.2.1 代数重次
5.2.2 一般矩阵分解定理
5.2.3 特征值的一些另外的属性
5.3 共轭特征向量
5.4 广义特征值问题
5.5 系数为环中元素
6 无穷维空间
7 应用
7.1 薛定谔方程
7.2 分子轨道
7.3 因子分析
7.4 特征脸
7.5 惯量张量
7.6 应力张量
7.7 图的特征值
8 备注
9 参考
10 外部连接
[编辑] 定义
参见:特征平面
空间的线性变换—例如平移(移动原点),旋转,反射,拉伸,压缩,或者这些的组合;还有其它的变换—可以通过它们在向量上的作用来可视化。向量可以用从一点指向另一点的箭头来表示。
变换的特征向量是在变换下不变,或者简单的乘以一个缩放因子的非零向量[3]。
一个特征向量的特征值是它所乘的那个缩放因子。
实数 λ 是线性变换 T : V → V 的一个特征值,如果有一个非零向量 x 使得 T(x) = λx。
一个特征空间就是由所有有相同的给定特征值的特征向量组成的向量空间,还包括零向量,虽然它不是一个特征向量。
变换的主特征向量是对应特征值最大的特征向量。
特征值的几何重次是相应特征空间的维数。
有限维向量空间上的一个变换的谱是其所有特征值的集合。
例如,三维空间的旋转的一个“特征向量”是沿着旋转轴的一个向量。相应的“特征值”是1,而相应的“特征空间”包含所有和该轴平行的向量。这是一个一维空间,因而它的几何重次是1。这是(这个旋转)的“谱”当中唯一的实数特征值。
[编辑] 例子
[编辑] 线性变换
如右侧给出的例子,会生成错切变换的矩阵将类似于:
A 的特征向量的集合 被定义乘以 A 导致简单的把 缩放 λ 的那些向量。因此
矩阵在这些向量上的唯一效果是改变它们的长度,并可能反转它们的方向。所以右手端乘以单位矩阵 I,得到
因此
为了使这个方程有非零解,我们要求叫做矩阵 A 的特征多项式的行列式 det(A − λI) 为零。在我们的例子中,可以计算这个行列式为
就获得了矩阵 A 的特征多项式 (1 − λ)2。在这种情况下方程 (1 − λ)2 = 0 的唯一相异解是 λ = 1。这是矩阵 A 的特征值。
已经找到特征值 λ = 1,我们可以通过找到 A − (1)I 的零空间来解出特征向量的空间。换句话说,解出向量 ,它是
的解。
代入我们得到的特征值 λ = 1,
解这个新矩阵方程,我们找到在这个零空间中的向量有如下形式
这里的 c 是任意常量。所有这种形式的向量,就是直上直下的点,是矩阵 A 的特征向量。应用矩阵 A 于这些向量的结果等于乘以它们对应的特征值,这里的情况是 1。
一般的说,2×2 矩阵有两个相异的特征值,因此有两个不同的特征向量。而多数向量的长度和方向二者都会被矩阵所改变,特征向量只改变它们的长度,并不改变它们的方向,除了可能有通过原点的翻转。还有,特征值是不为 1 的某个数是常见情况,所以特征向量将被这个矩阵拉伸、挤压和/或通过原点翻转。
[编辑] 其他例子
随着地球的自转,每个从地心往外指的箭头都在旋转,除了在转轴上的那些箭头。考虑地球在一小时自转后的变换:地心指向地理南极的箭头是这个变换的一个特征向量,但是从地心指向赤道任何一处的箭头不会是一个特征向量。因为指向极点的箭头没有被地球的自转拉伸,它的特征值是1。
另一个例子是,薄金属板关于一个固定点均匀伸展,使得板上每一个点到该固定点的距离翻倍。这个伸展是一个有特征值2的变换。从该固定点到板上任何一点的向量是一个特征向量,而相应的特征空间是所有这些向量的集合。
图2. 一个两端固定的绳子上的驻波可以视为特征向量的一个例子,更精确的讲,它是一个相对于时间流逝的变换的特征函数。随着时间流逝,驻波被缩放,但是它的形状不变。在这个例子中,特征值是依赖于时间的。
但是,三维几何空间不是唯一的向量空间。例如,考虑两端固定的拉紧的绳子,就像弦乐器的振动弦那样(图2.)。振动弦的原子到它们在弦静止时的位置之间的带符号那些距离视为一个空间中的一个向量的分量,那个空间的维数就是弦上原子的个数。
如果考虑绳子随着时间流逝发生的变换,它的特征向量,或者说特征函数(如果将绳子假设为一个连续媒介),就是它的驻波—也就是那些通过空气的传播让人们听到弓弦和吉他的拨动声的振动。驻波对应于弦的特定振动,它们使得弦的形状随着时间变化而伸缩一个因子(特征值)。和弦相关的该向量的每个分量乘上了一个依赖于时间的因子。驻波的振幅(特征值)在考虑到阻尼的情况下逐渐减弱。因此可以将每个特征向量对应于一个寿命,并将特征向量的概念和共振的概念联系起来。
[编辑] 特征值方程
从数学上看,如果向量v与变换满足
则称向量v是变换的一个特征向量,λ是相应的特征值。其中是将变换作用于v得到的向量。
假设是一个线性变换,那么v可以由其所在向量空间的一组基表示为:
其中vi是向量在基向量上的投影(即坐标),这里假设向量空间为n 维。由此,可以直接以坐标向量表示。利用基向量,线性变换也可以用一个简单的矩阵乘法表示。上述的特征值方程可以表示为:
但是,有时候用矩阵形式写下特征值方程是不自然甚或不可能的。例如在向量空间是无穷维的时候,上述的弦的情况就是一例。取决于变换和它所作用的空间的性质,有时将特征值方程表示为一组微分方程更好。若是一个微分算子,其特征向量通常称为该微分算子的特征函数。例如,微分本身是一个线性变换因为(若M和N是可微函数,而a和b是常数)
考虑对于时间t的微分。其特征函数满足如下特征值方程:
,
其中λ是该函数所对应的特征值。这样一个时间的函数,如果λ = 0,它就不变,如果λ为正,它就按比例增长,如果λ是负的,它就按比例衰减。例如,理想化的兔子的总数在兔子更多的地方繁殖更快,从而满足一个正λ的特征值方程。
该特征值方程的解是N = exp(λt),也即指数函数;这样,该函数是微分算子d/dt的特征值为λ的特征函数。若λ是一个负数,我们称N的演变为一个指数衰减;若它是正数,则称指数增长。λ的值可以是一个任意复数。因此d/dt的谱是整个复平面。在这个例子中,算子d/dt作用的空间是单变量可微函数的空间。该空间有无穷维(因为不是每一个可微函数都可以用有限的基函数的线性组合来表达的)。但是,每个特征值λ所对应的特征空间是一维的。它就是所有形为N = N0exp(λt)的函数的集合。N0是任意常数,也就在t=0的初始数量。
[编辑] 谱定理
更多资料:谱定理
谱定理在有限维的情况,将所有可对角化的矩阵作了分类:它显示一个矩阵是可对角化的,当且仅当它是一个正规矩阵。注意这包括自共轭(厄尔米特)的情况。这很有用,因为对角化矩阵T的函数f(T)(譬如波莱尔函数f)的概念是清楚的。在采用更一般的矩阵的函数的时候谱定理的作用就更明显了。例如,若f是解析的,则它的形式幂级数,若用T取代x,可以看作在矩阵的巴拿赫空间中绝对收敛。谱定理也允许方便地定义正算子的唯一的平方根。
谱定理可以推广到希尔伯特空间上的有界正规算子,或者无界自共轭算子的情况。
[编辑] 矩阵的特征值和特征向量
[编辑] 计算矩阵的特征值和特征向量
假设我们想要计算给定矩阵的特征值。若矩阵很小,我们可以用特征多项式进行符号演算。但是,对于大型矩阵这通常是不可行的,在那种情况我们必须采用数值方法。
[编辑] 符号演算
更多资料:矩阵特征值的符号演算
求特征值
描述正方形矩阵的特征值的重要工具是特征多项式:说λ是A的特征值等价于说线性系统 (A – λI) v = 0 (其中I是单位矩阵)有非零解v (一个特征向量),因此等价于行列式:
函数p(λ) = det(A – λI)是λ的多项式,因为行列式定义为一些乘积的和。 这就是A的特征多项式:矩阵的特征值也就是其特征多项式的零点。
一个矩阵A的特征值可以通过求解方程pA(λ) = 0来得到。 若A是一个n×n矩阵,则pA为n次多项式,因而A最多有n个特征值。 反过来,代数基本定理说这个方程刚好有n个根,如果重根也计算在内的话。所有奇数次的多项式必有一个实数根,因此对于奇数n,每个实矩阵至少有一个实特征值。在实矩阵的情形,对于偶数或奇数的n,非实数特征值成共轭对出现。
求特征向量
一旦找到特征值λ,相应的特征值可以通过求解如下方程得到:
没有实特征值的一个矩阵的例子实顺时针90度旋转:
其特征多项式是λ2 + 1,因此其特征值成复共轭对出现:i, -i。相应的特征向量也是非实数的。
[编辑] 数值计算
更多资料:特征值算法
在实践中,大型矩阵的特征值无法通过特征多项式计算。计算该多项式本身相当费资源,而精确的“符号式”的根对于高次的多项式来说很难计算和表达:阿贝尔-鲁菲尼定理显示高次(5次或更高)多项式的根无法用n次方根来简单表达。对于估算多项式的根的有效算法是有的,但特征值中的小误差可以导致特征向量的巨大误差。因此,寻找特征多项式和特征值的一般算法,是迭代法。最简单的方法是幂法:取一个随机向量v,然后计算如下的一系列单位向量
, , , ...
这个序列几乎总是收敛于最大绝对值的特征值所对应的特征向量。这个算法很简单,但是本身不是很有用。但是,象QR算法这样的算法正是以此为基础的。
[编辑] 性质
[编辑] 代数重次
A的一个特征值λ的代数重次是λ作为A的特征多项式的零点的次数;换句话说,若λ是一个该多项式的根,它是因子(t − λ)在特征多项式中在因式分解后中出现的次数。一个n×n矩阵有n个特征值,如果将代数重次计算在内的话,因为其特征多项式次数为n。
一个代数重次1的特征值为“单特征值”。
在关于矩阵理论的条目中,可能会遇到如下的命题:
"一个矩阵A的特征值为4,4,3,3,3,2,2,1,"
表示4的代数重次为二,3的是三,2的是二,而1的是1。这样的风格因为代数重次对于矩阵理论中的很多数学证明很重要而被大量使用。
回想一下,我们定义特征向量的几何重次为相应特征空间的维数,也就是λI − A的零空间。代数重次也可以视为一种维数:它是相应广义特征空间 (第一种意义)的维数,也就是矩阵(λI − A)k对于任何足够大的k的零空间。也就是说,它是“广义特征向量”(第一种意义)的空间,其中一个广义特征向量是任何一个如果 λI − A作用连续作用足够多次就“最终”会变0的向量。任何特征向量是一个广义特征向量,以此任一特征空间被包含于相应的广义特征空间。这给了一个几何重次总是小于代数重次的简单证明。这里的第一种意义不可和下面所说的广义特征值问题混淆。
例如:
它只有一个特征值,也就是λ = 1。其特征多项式是(λ − 1)2,所以这个特征值代数重次为2。但是,相应特征空间是通常称为x轴的数轴,由向量线性撑成,所以几何重次只是1。
广义特征向量可以用于计算一个矩阵的若尔当标准型(参看下面的讨论)。若尔当块通常不是对角化而是幂零的这个事实与特征向量和广义特征向量之间的区别直接相关。
[编辑] 一般矩阵分解定理
如上所述,谱定理表明正方形矩阵可以对角化当且仅当它是正规的。对于更一般的未必正规的矩阵,我们有类似的结果。当然在一般的情况,有些要求必须放松,例如酉等价性或者最终的矩阵的对角性。 所有这些结果在一定程度上利用了特征值和特征向量。下面列出了一些这样的结果:
舒尔三角形式表明任何矩阵酉等价于一个上三角矩阵;
奇异值分解定理, A = UΣV * 其中Σ为对角阵,而U,V为酉矩阵。A = UΣV * 的对角线上的元素非负,而正的项称为A的奇异值。这对非正方形矩阵也成立;
若尔当标准型,其中A = UΛU − 1 其中Λ不是对角阵,但是分块对角阵,而U是酉矩阵。若尔当块的大小和个数由特征值的几何和代数重次决定。若尔当分解是一个基本的结果。从它可以立即得到一个正方形矩阵可以完全用它的特征值包括重次来表述,最多只会相差一个酉等价。这表示数学上特征值在矩阵的研究中有着极端重要的作用。
作为若尔当分解的直接结果,一个矩阵A可以“唯一”地写作A = S + N其中S可以对角化,N是幂零的(也即,对于某个q,Nq=0),而S和N可交换(SN=NS)。
任何可逆矩阵A可以唯一地写作A = SJ,其中S可对角化而J是么幂矩阵 (也即,使得特征多项式是(λ-1)的幂,而S和J可交换)。
[编辑] 特征值的一些另外的属性
谱在相似变换下不变: 矩阵A和P-1AP有相同的特征值,这对任何矩阵A和任何可逆矩阵 P都成立。谱在转置之下也不变:矩阵A和AT有相同的特征值。
因为有限维空间上的线性变换是双射当且仅当它是单射,一个矩阵可逆当且仅当所有特征值都不是0。
若尔当分解的一些更多的结果如下:
一个矩阵是对角矩阵当且仅当代数和几何重次对于所有特征值都相等。特别的有,一个n×n矩阵如果有n不同特征值,则总是可以对角化的。
矩阵作用的向量空间可以视为其广义特征向量所撑成的不变子空间的直和。对角线上的每个块对应于该直和的一个子空间。若一个块是对角化的,其不变子空间是一个特征空间。否则它是一个广义特征空间,如上面所定义;
因为迹,也就是矩阵主对角线元素之和,在酉等价下不变,若尔当标准型说明它等于所有特征值之和;
类似的有,因为三角矩阵的特征值就是主对角线上的项,其行列式等于等于特征值的乘积(按代数重次计算出现次数)。
正规矩阵的一些子类的谱的位置是:
一个埃尔米特矩阵(A = A*)的所有特征值是实数。进一步的有,所有正定矩阵(v*Av > 0 for all vectors v)的所有特征值是正数;
所有斜埃尔米特矩阵(A = −A*)的特征值是纯虚数;
所有酉矩阵(A-1 = A*)的特征值绝对值为1;
假设A是一个m×n矩阵,其中m ≤ n,而B是一个n×m矩阵。则BA有和AB相同的特征值加上n − m个等于0的特征值。
每个矩阵可以被赋予一个算子范数。算子范数是其特征值的模的上确界,因而也是它的谱半径。该范数直接和计算最大模的特征值的幂法直接相关。当一个矩阵是正规的,其算子范数是其特征值的最大模,并且独立于其定义域的范数。
[编辑] 共轭特征向量
一个共轭特征向量或者说共特征向量是一个在变换下成为其共轭乘以一个标量的向量,其中那个标量称为该线性变换的共轭特征值或者说共特征值。共轭特征变量和共轭特征值代表了和常规特征向量和特征值相同的信息和含义,但是在交替坐标系统被使用的时候出现。对应的方程是:
例如,在相干电磁散射理论中,线性变换A代表散射物体施行的作用,而特征向量表示电磁波的极化状态。在光学中,坐标系统按照波的观点定义,称为前向散射对齐 (FSA),从而导致了常规的特征值方程,而在雷达中,坐标系统按照雷达的观点定义,称为后向散射对齐 (BSA),从而给出了共轭特征值方程。
[编辑] 广义特征值问题
一个广义特征值问题(第二种意义)有如下形式
其中A和B为矩阵。其广义特征值(第二种意义)λ 可以通过求解如下方程得到
形如A − λB的矩阵的集合,其中λ是一个复数,称为一个“铅笔”。 若B可逆,则最初的问题可以写作如下形式
也即标准的特征值问题。但是,在很多情况下施行逆操作是不可取的,而广义特征值问题应该如同其原始表述来求解。
如果A和B是实系数的对称矩阵,则特征值为实数。这在上面的第二种等价表述中并不明显,因为矩阵B − 1A未必是对称的。
这里的一个例子是分子轨道应用如下。
[编辑] 系数为环中元素
在方矩阵A,其系数属于一个环的情况,λ称为一个右特征值如果存在一个列向量x使得Ax=λx,或者称为一个左特征值如果存在非零行向量y使得yA=yλ。
若环是可交换的,左特征值和右特征值相等,并简称为特征值。否则,例如当环是四元数集合的时候,它们可能是不同的。
[编辑] 无穷维空间
File:Discrete-continuum.png
图3.原子氯的吸收谱(截面)。细线条理论上对应于哈密顿量的离散谱 (里德博格序列);右边的宽结构对应于连续谱 (电离)。相应的实验结果通过测量X射线被原子气体吸收后的强度作为相关的光子能量的函数而得到,单位用电子伏特(eV)。[1]
若向量空间是无穷维的,特征值的概念可以推广到谱的概念。谱是标量λ的集合,对于这些标量,}-没有定义,也就是说它们使得}-没有有界逆。
很明显,如果λ是T的特征值,λ位于T的谱内。一般来讲,反过来并不成立。在希尔伯特空间或者巴拿赫空间上有一些算子完全没有特征向量。这可以从下面的例子中看到。 在希尔伯特空间(所有标量级数的空间,每个级数使得收敛)上的双向平移没有特征向量却有谱值。
在无穷维空间,有界算子的谱系总是非空的,这对无界自共轭算子也成立。通过检验谱测度,任何有界或无界的自共轭算子的谱可以分解为绝对连续,离散,和孤立部分。指数增长或者衰减是连续谱的例子,而振动弦驻波是离散谱例子。氢原子是两种谱都有出现的例子。氢原子的束缚态对应于谱的离散部分,而离子化状态用连续谱表示。图3用氯原子的例子作了解释。
[编辑] 应用
[编辑] 薛定谔方程
一个变换用微分算子代表的特征值方程的例子是量子力学中的时不变薛定谔方程
HΨE = EΨE
其中H是哈密顿算子,一个二阶微分算子而ΨE是波函数,对应于特征值E的特征函数,该值可以解释为它的能量。
图4. 一个氢原子中的一个电子的束缚态所对应的波函数可以视为氢原子哈密顿算子的一个特征向量,也是角动量算子的一个特征向量。它们对应于可以解释为它们的能量(递增:n=1,2,3,...)和角动量(递增:s, p, d,...)的特征值。这里画出了波函数绝对值的平方。更亮区域对应于位置测度的更高概率密度。每幅图的中心都是原子核,一个质子
但是,在这个情况我们只寻找薛定谔方程的束缚态解,就像在量子化学中常做的那样,我们在平方可积的函数中寻找ΨE。因为这个空间是一个希尔伯特空间,有一个定义良好的标量积,我们可以引入一个基集合,在其中ΨE和H可以表示为一个一维数组和一个矩阵。这使得我们能够用矩阵形式表达薛定谔方程。(图4代表氢原子哈密顿算子的最低能级特征函数。)
狄拉克标记经常在这个上下文中使用,以强调状态的向量和它的表示,函数ΨE之间的区别。在这个情况下,薛定谔方程写作
并称是H的一个本征态(H有时候在入门级课本中写作),H被看作是一个变换(参看可观察量)而不是一个它用微分算子术语进行的特定表示。在上述方程中,理解为通过应用H到得到的一个向量。
[编辑] 分子轨道
在量子力学中,特别是在原子物理和分子物理中,在Hartree-Fock理论下,原子轨道和分子轨道可以定义为Fock算子的特征向量。相应的特征值通过Koopmans定理可以解释为电离势能。在这个情况下,特征向量一词可以用于更广泛的意义,因为Fock算子显式地依赖于轨道和它们地特征值。如果需要强调这个特点,可以称它为隐特征值方程。这样地方程通常采用迭代程序求解,在这个情况下称为自洽场方法。在量子化学中,经常会把Hartree-Fock方程通过非正交基集合来表达。这个特定地表达是一个广义特征值问题称为Roothaan方程。
[编辑] 因子分析
在因素分析中,一个协方差矩阵的特征向量对应于因素,而特征值是因素负载。因素分析是一种统计学技术,用于社会科学和市场分析、产品管理、运筹规划和其他处理大量数据的应用科学。其目标是用称为因素的少量的不可观测随机变量来解释在一些可观测随机变量中的变化。可观测随机变量用因素的线性组合来建模,再加上“残差项。
图5. 特征脸是特征变量的例子
[编辑] 特征脸
在图像处理中,脸部图像的处理可以看作分量为每个像素的辉度的向量。该向量空间的维数是像素的个数。一个标准化面部图形的一个大型数据集合的协方差矩阵的特征向量称为特征脸。它们对于将任何面部图像表达为它们的线性组合非常有用。特征脸提供了一种用于识别目的的数据压缩的方式。在这个应用中,一般只取最大那些特征值所对应的特征脸。
[编辑] 惯量张量
在力学中,转动惯量的特征向量定义了刚体的主轴。转动惯量是决定刚体围绕质心转动的关键数据。
[编辑] 应力张量
在固体力学中,应力张量是对称的,因而可以分解为对角张量,其特征值位于对角线上,而特征向量可以作为基。因为它是对角阵,在这个定向中,应力张量没有剪切分量;它只有主分量。
[编辑] 图的特征值
在谱系图论中,一个图的特征值定义为图的邻接矩阵A的特征值,或者(更多的是)图的拉普拉斯算子矩阵I − T − 1 / 2AT − 1 / 2,其中T是对角阵表示每个顶点的度数,在T − 1 / 2中,0用于取代0 − 1 / 2。图的主特征向量用于测量其顶点的中心度。Google的PageRank算法就是一个例子。www图的修正邻接矩阵的主特征向量的分量给出了页面评分。
[编辑] 备注
^ T. W Gorczyca, Auger Decay of the Photoexcited Inner Shell Rydberg Series in Neon, Chlorine, and Argon, 第18次X射线和内壳层进程国际会议的摘要,芝加哥,1999年8月23-27日。
^ 在这个上下文,只考虑从一个向量空间到自身的线性变换。
^ 因为所有线性变换保持零向量不变,它不作为一个特征向量。
[编辑] 参考
Roger A. Horn and Charles R. Johnson, Matrix Analysis, Cambridge University Press (1985). ISBN 0-521-30586-1 (hardback), ISBN 0-521-38632-2 (平装).
John B. Fraleigh and Raymond A. Beauregard, Linear Algebra (3rd edition), Addison-Wesley Publishing Company (1995). ISBN 0-201-83999-7 (国际版).
Claude Cohen-Tannoudji, Quantum Mechanics, Wiley (1977). ISBN 0-471-16432-1. (Chapter II. The mathematical tools of quantum mechanics.)
三:[等价矩阵]三維旋轉矩陣實用算法
三維旋轉矩陣實用算法
2011-03-02 20:54:12| 分类: 實用算法 | 标签: |字号大中小 订阅
3D数学 ---- 矩阵和线性变换
一般来说,方阵能描述任意线性变换。线性变换保留了直线和平行线,但原点没有移动。线性变换保留直线的同时,其他的几何性质如长度、角度、面积和体 积可能被变换改变了。从非技术意义上说,线性变换可能“拉伸”坐标系,但不会“弯曲”或“卷折”坐标系。
矩阵是怎样变换向量的
向量在几何上能被解释成一系列与轴平行的位移,一般来说,任意向量v都能写成“扩展”形式:
另一种略有差别的形式为:
注意右边的单位向量就是x,y,z轴,这里只是将概念数学化,向量的每个坐标都表明了平行于相应坐标轴的有向位移。
让我们将上面的向量和重写一遍,这次分别将p、q、r定 义为指向+x,+y和+z方向的单位向量,如下所示:
v = xp + yq + zr
现在,向量v就被表示成向量p,q,r的 线性变换了,向量p,q,r称作基向量。这里 基向量是笛卡尔坐标轴,但事实上,一个坐标系能用任意3个基向量定义,当然这三个基向量要线性无关(也就是不在同一平面上)。以p、q、r为 行构建一个3 x 3矩阵M,可得到如下矩阵:
用一个向量乘以该矩阵,得到:
如果把矩阵的行解释为坐标系的基向量,那么乘以该矩阵就相当于执行了一次坐标转换,如果aM=b, 我们就可以说,M将a转换到b。
从这点看,术语“转换”和“乘法”是等价的。
坦率地说,矩阵并不神秘,它只是用一种紧凑的方式来表达坐标转换所需的数**算。进一步,用线性代数操作矩阵,是一种进行简单转换或导出更复杂转换 的简便方法。
矩阵的形式:
基向量[1, 0, 0], [0, 1, 0], [0, 0, 1]乘以任意矩阵M:
用基向量[1, 0, 0]乘以M时,结果是M的第1行。其他两行也有同样 的结果,这是一个关键的发现:矩阵的每一行都能解释为转换后的基向量。
这个强有力的概念有两条重要性质:
1、有了一种简单的方法来形象化解释矩阵所代表的变换。
2、有了反向建立矩阵的可能 ---- 给出一个期望的变换(如旋转、缩放等),能够构造一个矩阵代表此变换。我们所要做的一切就是计算基向量的变换,然后将变换后的基向量填入矩阵。
首先来看看2D例子,一个2 x 2矩阵:
这个矩阵代表的变换是什么?首先,从矩阵中抽出基向量p和q:
p = [2 1]
q = [-1 2]
图7.1以“原”基向量(x轴,y轴)为参考,在笛卡尔平面中展示了这些向量。
、
如图7.1所示,x基向量变换至上面的p向量,y基向量变换至q向量。所以 2D中想象矩阵的方法就是想象由行向量构成的“L”形状。这个例子中,能够很清楚的看到,M代表的部分变换是逆时针旋 转26度。
当然,所有向量都被线性变换所影响,不只是基向量,从“L”形状能够得到变换最直观的印象,把基向量构成的整个2D平行四边形画完整有助于进一步看 到变换对其他向量的影响,如图7.2所示:
平行四边形称作“偏转盒”,在盒子中画一个物体有助于理解,如图 7.3 所示:
很明显,矩阵M不仅旋转坐标系,还会拉伸它。
这种技术也能应用到3D转换中。2D中有两个基向量,构成"L"型;3D中有三个基向量,它们形成一个”三脚架“。首先,让我们展示出一个转换前的 物品。图7.4展示了一个茶壶,一个立方体。基向量在”单位“向量处。
(为了不使图形混乱,没有标出z轴基向量[0, 0, 1],它被茶壶和立方体挡住了。)
现在,考虑以下3D变换矩阵:
从矩阵的行中抽出基向量,能想象出该矩阵所代表的变换。变换后的基向量、立方体、茶壶如图7.5所示:
这个变换包含z轴顺时针旋转45度和不规则缩放,使得茶壶比以前”高“。注意,变换并没有影响到z轴,因为矩阵的第三行是[0, 0 , 1]。
我们可以通过让比例因子k按比例放大或缩小来缩放物体。如果在各方向应用同比例的缩放,并且沿原点“膨胀”物体,那么就是均匀缩放。均匀缩放可以保 持物体的角度和比例不变。如果长度增加或减小因子k,则面积增加或减小k^2。在3D中,体积将增加或减小 k^3。
如果需要“挤压”或"拉伸"物体,在不同的方向应用不同的因子即可,这称作非均匀缩放。非均匀缩放时,物体角度将发生变化。视各方向缩放因子的不 同,长度、面积、体积的变化因子也各不相同。
如果|k|<1,物体将“变短”;如果|k|>1,物体将“变长”,如果k = 0,就是正交投影,如果k < 0就是镜像。
应用非均匀缩放的效果类似于切变,事实上,非均匀缩放和切变和很难区分的。
沿坐标轴的缩放
最简单的缩放方法是沿着每个坐标轴应用单独的缩放因子,缩放是沿着垂直的轴(2D中)或平面(3D中)进行的。如果每个轴的缩放因子相同,就是均匀 缩放,否则是非均匀缩放。
2D中有两个不同的缩放因子,Kx和Ky,图8.13展示了应用不同缩放因子后的情况。
凭直觉就可知道,基向量p,q由相应的缩放因子单独影响:
p" = Kxp = Kx [1 0] = [Kx 0]
q" = Kyq = Ky [0 1] = [0 Ky]
用基向量构造矩阵,结果如公式8.6所示:
对于3D,需要增加第三个缩放因子Kz,3D缩放矩阵如公式8.7所示:
沿任意方向缩放
我们可以不依赖于坐标系而沿任意方向进行缩放,设n为平行于缩放方向的单位向量,k为缩放因子,缩放沿穿过原点 并平行于n的直线(2D中)或平面(3D中)进行。
我们需要推导出一个表达式,给定向量v,可以通过v,n和 k来计算v"。为了做到这一点,将v分解为两个分量,v|| 和v⊥,分别平行于n和垂直于n,并满足v =v|| + v⊥。v||是v在n上 的投影,由 (v . n)n 可以得到 v||。 因为v⊥垂直于n,它不会被缩放操作影响。因此,v" = v||" + v⊥,剩下的问题就是怎样得到v||"。 由于v||平行于缩放方向,v||"可以由公式kv|| 得出,如图8.14所示:
总结已知向量并进行代换,得到:
既然我们知道了怎样对任意向量进行缩放,当然也就可以计算缩放后的基向量。这里只详细列出2D中的一个基向量的求法,其余的基向量依次类推。我们只 给出其结果(注意下面采用列向量形式只是为了使等式的形式好看一些。)
通过基向量构造矩阵,得到以单位向量n为缩放方向,k为因子的缩放矩阵,如公式8.8所示:
3D中,基向量为:
以单位向量n为缩放方向,k为因子的3D缩放矩阵如公式8.9所示:
一般来说,投影意味着降维操作,有一种投影方法是在某个方向上用0作为缩放因子。这种情况下,所有点都被拉平至垂直的轴(2D)或平面(3D)上。 这种类型的投影称作正交投影(或者平行投影),因为从原来的点到投影点的直线相互平行。
向坐标轴或平面投影
最简单的投影方式是向坐标轴(2D)或平面(3D)投影,如图8.15所示:
向坐标轴或平面投影在实际变换中不常发生,大多数情况是向低维的变换赋值,且要抛弃维数时。例如,将3D点赋值给2D点,抛弃z分量,只复制x和 y。
通过使垂直方向上的缩放因子为零,就能向坐标轴或平面投影。考虑到完整性,下面列出这些变换矩阵,见公式8.10 - 8.14。
向任意直线或平面投影
也能向任意直线或平面投影,像往常一样,由于不考虑平移,这些直线或平面必须通过原点。投影由垂直于直线或平面的单位向量n定 义。
通过使该方向的缩放因子为0能够导出向任意方向投影的矩阵,2D中的情况如公式8.15所示:
记住这里n垂直于投影直线,而不是平行。3D中,向垂直于n的平面投影的矩 阵如公式8.16所示:
镜像
镜像(也叫做反射)是一种变换,其作用是将物体沿直线(2D中)或平面(3D中)“翻折”,图8.16展示了镜像的效果。
使缩放因子为-1能够很容易地实现镜像变换,设n为2D单位向量,公式8.17所示的矩阵将沿通过原点且垂直于n的 反射轴来进行镜像变换。
3D中,用反射平面代替直线。公式8.18中的矩阵将沿通过原点且垂直于n的平面来进行镜像变换:
注意一个物体只能“镜像”一次,如果再次镜像(当沿不同的轴或平面的时候),物体将翻回“正面”(用一张纸来想象),这和在原位置旋转物体的效果一 样。
切变
切变是一种坐标系“扭曲”变换,非均匀地拉伸它。切变的时候角度会发生变化,但令人惊奇的是面积和体积却保持不变。基本思想是将某一坐标的乘积加到 另一个上。例如,2D中将y乘以某个因子然后加到x上,得到 x" = x + sy,如图8.17所示:
实现这个切变变换的矩阵为:
变换的组合
设想世界中有一个任意方向、任意位置的物体,我们要把它渲染到任意方向、任意位置的摄像机中。为了做到这一点,必须将物体的所有顶点从物体坐标系变 换到世界坐标系,接着再从世界坐标系变换到摄像机坐标系。其中的数学变换总结如下:
矩阵乘法满足结合律,所以我们能用一个矩阵直接从物体坐标系变换到摄像机坐标系:
这样就能在渲染的循环外先将所有矩阵组合起来,使循环内作矩阵乘法的时候只需要和一个矩阵相乘即可(物体有很多顶点,省一次矩阵乘法就会提高不少效 率),如下:
所以矩阵组合从代数角度看是利用了矩阵乘法的结合律。矩阵的行向量就是变换后的基向量,这在多个变换的情况下也是成立的。考虑矩阵乘法AB, 结果中的每一行都是A中相应的行与矩阵B相乘的结果。换言之,设a1, a2, a3为A的行,矩阵乘法能够写为:
这使得结论更加清晰,AB结果中的行向量确实是对A的基向量进行B变 换的结果。
变换分类
变换的类别并不是互斥的,也不存在一定的“次序”或“层次”使得某一类比另一类多或少一些限制。
当讨论一般意义上的变换时,我们将使用类似的术语:映射或函数。在最一般的意义上,映射就是一种简单的规则,接受输入,产生输出。我们把从a到b的F映 射记作F(a) = b。
线性变换
在数学上,如果满足下式,那么映射F(a)就是线性的:
F(a + b) = F(a) + F(b) 以及 F(ka) = kF(a)
如果映射F保持了基本运算:加法和数量乘,那么就可以称该映射为线性的。在这种情况下,将两个向量相加然后再进行变换得到的结果和先分别进行变换再 将变换后的向量相加得到的结果相同。同样,将一个向量数量乘再进行变换和先进行变换再数量乘的结果也是一样的。
这个线性变换的定义有两条重要的引理:
(1) 映射F(a) = aM,当M为 任意方阵时,说映是一个线性变换,这是因为:
F(a + b) = (a + b)M = aM + bM = F(a) + F(b)
和
F(ka) = (ka)M = k(aM) = kF(a)
(2) 零向量的任意线性变换的结果仍然是零向量。(如果F(0) = a,a ≠ 0。那么F不可能是线性变换。因为F(k0) = a,但F(k0) ≠ kF(0)), 因此线性变换不会导致平移(原点位置上不会变化)。
在某些文献中,线性变换的定义是平行线变换后仍然是平行线。大多数情况下它是对的,但有一个小小的例外:投影(当一条直线投影后变成一个点,能认为 这个点 平行于什么?)除了这点理论上的例外,这种定义是正确的。线性变换可能造成“拉伸”,但直线不会”弯折“,所以平行线仍然保持平行。
仿射变换
仿射变换是指线性变换后接着平移。因此仿射变换的集合是线性变换的超集,任何线性变换都是仿射变换,但不是所有仿射变换都是线性变换。
任何具有形式 v" = vM + b 的 变换都是仿射变换。
可逆变换
如果存在一个逆变换可以”撤销“原变换,那么该变换是可逆的。换句话说,如果存在逆变换G,使得G(F(a)) = a,对于任意a,映射F(a) 是可逆的。
存在非仿射变换的可逆变换,但暂不考虑它们。现在,我们集中精力于检测一个仿射变换是否可逆。一个仿射变换就是一个线性变换加上平移,显然,可以用 相反的量”撤销“平移部分,所以问题变为一个线性变换是否可逆。
显然,除了投影以外,其他变换都能”撤销“。当物体被投影时,某一维有用的信息被抛弃了,而这些信息时不可能恢复的。因此,所有基本变换除了投影都 是可逆的。
因为任意线性变换都能表达为矩阵,所以求逆变换等价于求矩阵的逆。如果矩阵是奇异的,则变换不可逆;可逆矩阵的行列式不为0。
等角变换
如果变换前后两向量夹角的大小和方向都不改变,该变换是等角的。只有平移,旋转和均匀缩放是等角变换。等角变换将会保持比例不变,镜像并不是等角变 换,因为尽管两向量夹角的大小不变,但夹角的方向改变了。所有等角变换都是仿射和可逆的。
正交变换
术语“正交”用来描述具有某种性质的矩阵。正交变换的基本思想是轴保持互相垂直,而且不进行缩放变换。
平移、旋转和镜像是仅有的正交变换。长度、角度、面积和体积都保持不变。(尽管如此,但因为镜像变换被认为是正交变换,所以一定要密切注意角度、面 积和体积的准确定义)。
正交矩阵的行列式为1或者负1,所有正交矩阵都是仿射和可逆的。
刚体变换
刚体变换只改变物体的位置和方向,不包括形状。所有长度、角度、面积和体积都不变。平移和旋转是仅有的刚体变换,镜像并不被认为是刚体变换。刚体变 换也被称作正规变换,所有刚体变换都是正交、等角、可逆和仿射的,某些刚体变换旋转矩阵的行列式为1。
为了您的安全,请只打开来源可靠的网址