联合分布函数


数字歇后语 2019-09-06 17:26:27 数字歇后语
[摘要]联合分布函数篇(1):随机过程的数字特征 联合分布函数和概率密度|互相关函数|互协方差函数2 2 2 随机过程的数字特征 两随机过程的联合分布函数和数字特征 令: ,为两个随机过程; 一、联合分布函数和概率密度:维随机向量的联合分布函数定义为:若存在:则称为和的维联合概率密度。  若对于任意

【www.shanpow.com--数字歇后语】

联合分布函数篇(1):随机过程的数字特征 联合分布函数和概率密度|互相关函数|互协方差函数

2.2.2 随机过程的数字特征
两随机过程的联合分布函数和数字特征
令: ,为两个随机过程;
一、联合分布函数和概率密度:
  维随机向量的联合分布函数定义为:

若存在:
则称为和的维联合概率密度。  若对于任意(整数),以及有:
(2.2-1)
则称和相互独立。
  式(2.2-1)可简写为:
和相互独立的条件除式(2.2-1)外,还可用概率密度表示,可简写为:
(2.2-2)
  式(2.2-1)和式(2.2-2)都是和相互独立的充分和必要条件。
二、两个随机过程的数字特征
  互相关函数:
  互协方差函数:
  若对于任意,,有:,则称:和不相关。不难证明,相互独立的, 必定不相关;反之,不一定。对于正态随机过程,不相关和独立是等价的。

联合分布函数篇(2):随机过程的数字特征 自相关函数|自协方差函数

2.2.2 随机过程的数字特征
自相关函数
自相关函数的定义为:
自协方差函数
自相关函数的定义为:
归一化协方差函数—相关系数:

若(或),则称和不相关。    
:
  1 数学期望和方差描述了随机过程在各个孤立时刻的特征,但没有反映随机过程不同时刻之间的内在联系。
  2 自相关函数和自协方差函数是用来衡量同一随机过程在任意两个时刻上的随机变量的相关程度。
 

联合分布函数篇(3):干货|通俗讲解高斯过程回归


作者:火星十一郎
首发:机器学习算法与自然语言处理(yizhennotes)
通俗讲解高斯过程回归网上讲高斯过程回归的文章很少,且往往从高斯过程讲起,我比较不以为然:高斯过程回归(GPR), 终究是个离散的事情,用连续的高斯过程( GP) 来阐述,简直是杀鸡用牛刀。
所以我们这次直接从离散的问题搞起,然后把高斯过程逆推出来。
这篇博客有两个彩蛋,一个是揭示了高斯过程回归和Ridge回归的联系,另一个是介绍了贝叶斯优化具体是怎么搞的。
后者其实值得单独写一篇博客,我在这里做一个简单介绍。
先说一说高斯回归过程的Intuition
假设有一个未知的函数f  : R–> R 
在训练集中,我们有3个点 x_1, x_2, x_3,   以及这3个点对应的结果,f1,f2,f3. (如图) 这三个返回值可以有噪声,也可以没有。我们先假设没有。
so far so good. 没什么惊讶的事情。
高斯过程回归的关键假设是:
给定一些 X的值,我们对Y建模,并假设对应的这些Y值服从联合正态分布!
(更正式的定义后面会说到)
换言之,对于上面的例子,我们的假设是:
一般来说,这个联合正态分布的均值向量不用操心,假设成0就蛮好。(讲到后面你就知道为什么了)
所以关键是,这个模型的协方差矩阵K 从哪儿来。
为了解答这个问题,我们进行了另一个重要假设:
如果两个x 比较相似(eg, 离得比较近),那么对应的y值的相关性也就较高。换言之,协方差矩阵是 X 的函数。(而不是y的函数)
具体而言,对于上面的例子,由于x3和x2离得比较近,所以我们假设 f3和f2 的correlation 要比 f3和f1的correlation 高。  
话句话说,我们可以假设协方差矩阵的每个元素为对应的两个x值的一个相似性度量:
那么问题来了,这个相似性怎么算?如何保证这个相似性度量所产生的矩阵是一个合法的协方差矩阵? 
好,现在不要往下看了,你自己想3分钟。你也能想出来的。 提示:合法的协方差矩阵就是 (symmetric) Positive Semi-definite Matrix (。。。。。。。。。。。。思考中) 好了时间到。
答案: Kernel functions !
矩阵A正定是指,对任意的X≠0恒有X^TAX>0。矩阵A半正定是指,对任意的X≠0恒有X^TAX≥0。
判定A是半正定矩阵的充要条件是:A的所有顺序主子式大于或等于零。
如果你了解SVM的话,就会接触过一个著名的Mercer Theorem,(当然如果你了解泛函分析的话也会接触过 ),这个M定理是在说:一个矩阵是Positive Semi-definite Matrix当且仅当该矩阵是一个Mercer Kernel .
所以我们在svm里用过的任何Kernel都能拿过来用!
举个栗子,在高斯过程回归里,一种非常常见的Kernel就是SVM里面著名的高斯核(但是为了让命名不是那么混淆,文献中一般把这个Kernel称作 squared exponential kernel.
具体而言就是
好了,现在可以做回归分析了:
如果我们现在又有了一个新的点 x*
这个新的点对应的f* 怎么求?(如下图)
根据假设,我们假设 f* 和 训练集里的  f1, f2, f3 同属于一个 (4维的)联合正态分布!
也就是说,不仅 f1,f2,f3属于 一个3 维的联合正态分布(参数可以算出来),而且 f* 和 f1,f2,f3属于(另一个)4维的联合正态分布,用数学的语言来表达就是:
首先我们来看一看,这个4 x 4 的 矩阵能不能算出来:
黄色的大K,是依据训练集的3维联合分布算出来的,绿色的K*, 是测试点x* 分别和每一个训练集的x 求出来的。
所以整个联合分布我们都知道了。
接下来的事情就好办了,我们既然已经知道(f,f*)的联合分布P(f, f*)的所有参数, 如何求p(f*) ?
好消息是这个联合分布是正态的,我们直接用公式就能搞出来下面的结果(using the marginalization  property):
不难求出f* 隶属于一个1维的正态分布, 参数是:
所以这是一种贝叶斯方法,和OLS回归不同,这个方法给出了预测值所隶属的整个(后验)概率分布的。
再强调一下,我们得到的是f* 的整个分布!不是一个点估计,而是整个分布啊同志们。
In addition, 不仅可以得到  f*这一个点的分布,我们对这个未知的 函数 也可以进行推断!换言之,如果把一个函数想成一个变量,那么高斯过程回归可以求出这个函数的分布来。
(distribution over functions)不幸的是,我们的计算机只能存储离散的数据,怎么表示一个连续的函数呢?
好办,我们对一个区间里面均匀地硬造出来1万个测试点x*, 然后求出这些测试点和训练集所对应的y(一个巨高维的向量)的联合分布,然后在这个巨高维的联合分布里采样一次,就得到了函数的(近似的)一个样本。
比如训练集就三个点,测试集1万个x,图中的每一个红点就分别是这些点f* 的均值,(当点很多的时候,就可以假设是一个“连续”的函数了)而蓝色的线代表一个或两个标准差的bound.
我们如果从这个分布中采样10次,就可以得到10个巨高维的向量,也就是从这个后验概率中sample出来的10个函数的sample.  plot出来长这个样子:
含有已知数据(训练集)的地方,这些函数都离的很近(variance很低),没有数据的时候,这个spread就比较大。
也许你会问:我为毛要搞出来函数的分布?
我为毛要关心这个variance. 在很多问题中,我们不仅仅需要知道预测值的点估计,而且要知道这个估计有多少信心在里面(这也是贝叶斯方法的好处之一)
举个例子:Multiple Bandit Problem假设 我们已经有了几个油井,每个油井的价值不一样,我们在这个二维平面上,利用高斯过程回归,对每一个地理位置估计一个该位置对应的出油量。
而开发每一口井是有成本的,在预算有限的情况下,如果想尽可能少地花钱,我们就需要定义一个效益函数,同高斯过程回归的预测结果相结合,来指导我们下一次在哪儿打井。
这个效益函数往往是 预测值 和  方差 的一个函数。以上这个例子,就是高斯过程回归在贝叶斯优化中的一个典型应用。有时间专门写一篇。
好了,现在终于可以讲一讲高斯过程了。
高斯过程是在函数上的正态分布。(Gaussian distribution over functions)具体而言就是 我们具体用的时候,模型假设是酱紫的:
我们观察到一个训练集 D 给定一个测试集 X*  ( X* 是一个 N* x D 的矩阵, D是每一个点的维度)我们希望得到 一个 N* 维的预测向量 f*. 高斯过程回归的模型假设是 然后根据贝叶斯回归的方法,我们可以求出来 f*的后验概率: This is it. 要啥有啥了。
下面着重说一下有噪声情况下的结果,以及此情况下和Ridge Regression的神秘联系。
当观测点有噪声时候,即, y = f(x) + noise, where noise ~N(0, sigma^2)
我们有 发现没,唯一区别就是 K 变成 了 Ky,也就是多加了一个sigma。
这个很像是一种regularization. 确实如此。
好了,下面就说说这个 GPR的  insight,这个模型到底想干什么
如果只有一个测试点,那么输出的f* 就是隶属于一个1维的正态分布了,具体而言: 再看,我们回想一下Ridge Regression (下图中的argmax应该为argmin) 我们仔细观察一下上面那个蓝色的框框 所以说,ridge回归是一种最最最最简单的高斯过程回归,核函数就是简单的点积!
而高斯过程的核函数可以有很多,除了上面提到的squared exponential, 有整整一本书都在讲各种kernel和对应的随机过程
所以高斯过程是一个非常包罗万象的根基,类似于小无相功。
 高斯过程回归(GPR)和贝叶斯线性回归类似,区别在于高斯过程回归中用核函数代替了贝叶斯线性回归中的基函数(其实也是核函数,线性核)。
来看看多维高斯分布的一些重要性质,第一个性质为两个相互独立的多维高斯分布A和B的和也是一个多维高斯分布C,且C的均值和方差都为A和B均值方差的和。
第二个性质为:两个多维高斯分布之和构成的分布C而言,在已知一部分观察值C1的条件下,另一部分观察值C2的概率分布是一个多维高斯分布,且可以用A和B中对应的信息来表示。
如下: 由贝叶斯线性回归和高斯过程回归的对比可知,贝叶斯线性回归是高斯过程回归中的一个子集,只是它用的是线性核而已,通过两者的公式就可以看出它们之间的关系:
上面是贝叶斯线性回归,下面是高斯过程回归。
简单例子:
假设现在已经观察到了6个样本点,x为样本点特征(一维的),y为样本输出值。
现在新来了一个样本点,要求是用高斯回归过程来预测新来样本点的输出值。这些样本点显示如下;
其中前面6个点是已知输出值的训练样本,其值为:
第7个点是需要预测的样本,红色的垂直条形线表示观察输出值的误差,绿色的垂直条形线为用高斯过程回归的误差。
用GPR解该问题的流程大概如下(对应前面讲的一些基础知识):
1. 选择适当的u(均值函数)和k(核函数),以及噪声变量σ,其中核函数的选择尤其重要,因为它体现了需处理问题的先验知识,应根据不同的应用而选择不同的核。
2. 计算出训练样本的核矩阵(6*6),如下: 5. 通过前面m和D的公式,求得m=0.95,D=0.21.
6. 画出最终结果如下:
这个例子来源于论文Gaussian Processes for Regression A Quick Introduction中。
它的核函数等参数选择和基础知识部分的不同,但这里主要是对GPR的应用有个简单的宏观上的理解,让大脑对GPR应用有个初步的印象,否则有了那么多的公式推导但不会应用又有什么用呢?
参考:
http://www.cnblogs.com/tornadomeet/archive/2013/06/14/3135380.htmlhttp://dataunion.org/17089.html
http://www.cnblogs.com/tornadomeet/archive/2013/06/15/3137239.html
下一篇:走近比特币:一个故事看懂“区块链”
机器人小妹公众号,专注人工智能、机器人、物联网等领域,传播行业资讯、技术等知识,为产业生态发展而努力,本平台现有社群38个,欢迎各位找资源对接(投资、渠道、推广)近期整合行业内资源凡事人工智能、机器人相关产品和周边产品都可在本公众号做宣传,头条为技术性文章,次条为产品商业项目宣传,欢迎各位大牛投技术稿;
可加微信:qingxiangjs

本文来源:https://www.shanpow.com/xhy/442699/

《联合分布函数.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式

相关阅读
  • 1-49数字对应五行_对应关系你要了解 1-49数字对应五行_对应关系你要了解
  • 遇见你的时候所有星星都落到我头上吉他谱 遇见你的时候所有星星都落到我头上吉他谱
  • 2020抗击疫情防控心得体会范本 2020抗击疫情防控心得体会范本
  • 芒种歌曲简谱 芒种歌曲简谱
  • 陈雪燃《无名之辈》钢琴谱 陈雪燃《无名之辈》钢琴谱
  • 2020抗击疫情先进事迹精选心得体会感悟5篇 2020抗击疫情先进事迹精选心得体会感悟5篇
  • 微信报名接龙数字如何排列对齐传递 微信报名接龙数字如何排列对齐传递
  • 表白1到10的数字含义_数字表白暗语1到10 表白1到10的数字含义_数字表白暗语1到10
为您推荐
  • cvv2是什么意思_cvv2是什么
    cvv2是什么意思_cvv2是什么
    什么是信用卡CVV2码?大家创业网精心为大家整理了cvv2是什么,希望对你有帮助。cvv2是什么CVV2是打印在 Visa Master Card 卡签名区的一个数字。它位于信用卡号后的3位数字。我们
  • 股票神奇数字
    股票神奇数字
    一:[股票神奇数字]股票神奇数字我们今天来继续分享学习笔记哈。。 我有个360图书馆,里边放着自己喜欢的宝藏, 我们可以学习和分享,但是不可以标明为自己原创。。 【股票神奇数字】1、在波段的高位股价尾数出现(6, 7 ,8 ,9,0,)是高抛信号,反过来在波段低位是买入信号。 2、 尾数
  • 我的幸运数字是多少
    我的幸运数字是多少
    我的幸运数字是多少篇(1):幸运数字查询,吉祥数字查询每个人都有自己的幸运数字,你知道你的幸运数字是多少吗,幸运数字也叫吉利数字,吉祥数字,用这个数字对自己八字和运势有利,如幸运数字的车号,楼层号,房号,手机号,幸运数字的那一天都是对自己有利的,那么你的幸运数字是什么,今天起名网教你如何手把手查询自
  • 属鸡的今年运气如何
    属鸡的今年运气如何
    第一篇属鸡的今年运气如何:属鸡的人2018年运程,属鸡的今年多大,属鸡的女人,属鸡人出生月的命运,2018属鸡的运程,酉鸡五行分析酉属金本命佛不动尊菩萨吉祥颜色金、啡、啡黄、黄大凶颜色绿、红、蓝、灰幸运数字5、7、8大凶数字1、3、9幸运花剑兰、凤仙花、鸡冠花吉祥方位西、西南、东北方戌
  • ico代币
    ico代币
    一:[ico代币]ICO所谓ICO,全称Initial Coin Offering,意思是“数字货币首次公开募资”,概念拷贝自股票市场的IPO。不同的是,IPO是企业为了发展而向公众筹集资金,ICO是企业为了发展而向公众筹集虚拟货币,将发行的标的物由IPO的证券变成了数字加密货币。ICO发行团队在进
  • 男性右下腹部隐痛的原因
    男性右下腹部隐痛的原因
    (1) [男性右下腹部隐痛的原因]男人右下腹部隐痛,千万别大意,可能是得了这种病!偷偷看:很多没有性常识和性经验的女生都会有疑问,那就是女生第一次是不是都会流血,没有出血就代表不是第一次吗?长按二维码加我了解更多,回复数字193了解详情。腹痛是一种常见的复杂疾病,右下腹指的是与肚脐眼相平的右腹
  • 监控分几种
    监控分几种
    监控分几种篇(1):监控摄像机有哪几种类型目前安防市场上主流的监控摄像机大致分为模拟和数字两大类一、模拟 按照传感器分为:CCD和CMOS两种。 按照是否带红外灯分为:红外相机和非红外相机。 按照分辨率分为:420线,480线,540线,600线,700线,目前700线是主流。  按照外型分为:枪机
  • 穷了一辈子
    穷了一辈子
    穷了一辈子篇一:人生中 注定穷一辈子的四种人摘要【人生中 注定穷一辈子的四种人】赚钱是为了更好地生活,有的人,只知道赚,却不懂得花、不懂得享受。这样的人,金钱对他而言只是一个数字,而没有转换成其他的价值,享受的价值、快乐的价值、给予的价值。拥有再多的钱都不算富有,注定只是赚钱的工具,而成不了钱的主
  • 国家隐瞒的超能力者
    国家隐瞒的超能力者
    国家隐瞒的超能力者篇1:超能力者!!国家不公布的资料这个世界的确有异能者,也有许多难一想像的事,这取决于个人的认知,其实这个世界不像我们看见的那么简单. 每年世界上发现的超能力者都多到近一万 这是一个恐怖的数字 因为证实了超能力者是随着社会进步发达和世界人口的变化取决的,其中一部分异能者具备超强的
  • 小瘪三
    小瘪三
    第一篇小瘪三:牛X,小瘪三竟稀里糊涂混成了皇帝从古至今,在大天朝出现的正统皇帝加起来粗略一算应该总共有611位,如果加上三国时期五代十六国西夏金辽以及少数民族临时政权那些乱七八糟的野鸡皇帝,那数字可就没法算了。这些皇帝有起兵造反上位的,有当太子继位的,也有搞政变阴谋得来的,当然了,还有是被楞推上去当