第三章_贝叶斯估计.ppt
《第三章_贝叶斯估计.ppt》由会员分享,可在线阅读,更多相关《第三章_贝叶斯估计.ppt(50页珍藏版)》请在一课资料网上搜索。
1、1 第三章贝叶斯估计 3 1贝叶斯推断方法一 统计推断中可用的三种信息 美籍波兰统计学家耐 E L Lehmann1894 1981 高度概括了在统计推断中可用的三种信息 1 总体信息 即总体分布或所属分布族给我们的信息 譬如 总体是指数分布 或 总体是正态分布 在统计推断中都发挥重要作用 只要有总体信息 就要想方设法在统计推断中使用 2 样本信息 即样本提供我们的信息 这是任一种统计推断中都需要 2 3 先验信息 即在抽样之前有关统计推断的一些信息 譬如 在估计某产品的不合格率时 假如工厂保存了过去抽检这种产品质量的资料 这些资料 包括历史数据 有时估计该产品的不合格率是有好处的 这些资料所
2、提供的信息就是一种先验信息 又如某工程师根据自己多年积累的经验对正在设计的某种彩电的平均寿命所提供的估计也是一种先验信息 由于这种信息是在 试验之前 就已有的 故称为先验信息 以前所讨论的点估计只使用前两种信息 没有使用先验信息 假如能把收集到的先验信息也利用起来 那对我们进行统计推断是有好处的 只用前两种信息的统计学称为经典统计学 三种信息都用的统计学称为贝叶斯统计学 本节将简要介绍贝叶斯统计学中的点估计方法 3 二 贝叶斯公式的密度函数形式 贝叶斯统计学的基础是著名的贝叶斯公式 它是英国学者贝叶斯 T R Bayes1702 1761 在他死后二年发表的一篇论文 论归纳推理的一种方法 中提
3、出的 经过二百年的研究与应用 贝叶斯的统计思想得到很大的发展 形成一个统计学派 贝叶斯学派 为了纪念他 英国历史最悠久的统计杂志 Biometrika 在1958年又全文刊登贝叶斯的这篇论文 初等概率论中的贝叶斯公式是用事件的概率形式给出的 可在贝叶斯统计学中应用更多的是贝叶斯公式的密度函数形式 下面结合贝叶斯统计学的基本观点来引出其密度函数形式 贝叶斯统计学的基本观点可以用下面三个观点归纳出来 4 假设 随机变量X有一个密度函数p x 其中 是一个参数 不同的 对应不同的密度函数 故从贝叶斯观点看 p x 在给定 后是个条件密度函数 因此记为p x 更恰当一些 这个条件密度能提供我们的有关的
4、 信息就是总体信息 假设 当给定 后 从总体p x 中随机抽取一个样本X1 Xn 该样本中含有 的有关信息 这种信息就是样本信息 假设 我们对参数 已经积累了很多资料 经过分析 整理和加工 可以获得一些有关 的有用信息 这种信息就是先验信息 参数 不是永远固定在一个值上 而是一个事先不能确定的量 5 从贝叶斯观点来看 未知参数 是一个随机变量 描述这个随机变量的分布可从先验信息中归纳出来 这个分布称为先验分布 其密度函数用 表示 1先验分布定义3 1将总体中的未知参数 看成一取值于 的随机变量 它有一概率分布 记为 称为参数 的先验分布 2后验分布在贝叶斯统计学中 把以上的三种信息归纳起来的最
5、好形式是在总体分布基础上获得的样本X1 Xn 和参数的联合密度函数 6 在这个联合密度函数中 当样本给定之后 未知的仅是参数 了 我们关心的是样本给定后 的条件密度函数 依据密度的计算公式 容易获得这个条件密度函数 这就是贝叶斯公式的密度函数形式 称为 的后验密度函数 或后验分布 而 7 是样本的边际分布 或称样本的无条件分布 它的积分区域就是参数 的取值范围 随具体情况而定 前面的分析总结如下 人们根据先验信息对参数 已有一个认识 这个认识就是先验分布 通过试验 获得样本 从而对 的先验分布进行调整 调整的方法就是使用上面的贝叶斯公式 调整的结果就是后验分布 后验分布是三种信息的综合 获得后
6、验分布使人们对 的认识又前进一步 可看出 获得样本的的效果是把我们对 的认识由 调整到 所以对 的统计推断就应建立在后验分布的基础上 8 例1设事件A的概率为 即 为了估计而作n次独立观察 其中事件A出现次数为X 则有X服从二项分布即 如果此时我们对事件A的发生没有任何了解 对的大小也没有任何信息 在这种情况下 贝叶斯建议用区间 0 1 上的均匀分布作为的先验分布 因为它在 0 1 上每一点都是机会均等的 这个建议被后人称为贝叶斯假设 9 此式在定义域上与二项分布有区别 再计算X的边际密度为 样本X与参数的联合分布为 即 10 拉普拉斯计算过这个概率 研究男婴的诞生比例是否大于0 5 如抽了2
7、51527个男婴 女婴241945个 贝叶斯统计学首先要想方设法先去寻求 的先验分布 先验分布的确定大致可分以下几步 第一步 选一个适应面较广的分布族作先验分布族 使它在数学处理上方便一些 这里我们选用 分布族 11 注 作为 的先验分布族是恰当的 从以下几方面考虑 1参数 是废品率 它仅在 0 1 上取值 因此 必需用区间 0 1 上的一个分布去拟合先验信息 分布正是这样一个分布 2 分布含有两个参数a与b 不同的a与b就对应不同的先验分布 因此这种分布的适应面较大 12 3样本X的分布为二项分布b n 时 假如 的先验分布为 分布 则用贝叶斯估计算得的后验分布仍然是 分布 只是其中的参数不
8、同 这样的先验分布 分布 称为参数 的共轭先验分布 选择共轭先验分布在处理数学问题上带来不少方便 4国内外不少人使用 分布获得成功 第二步 根据先验信息在先验分布族中选一个分布作为先验分布 使它与先验信息符合较好 利用 的先验信息去确定 分布中的两个参数a与b 从文献来看 确定a与b的方法很多 例如 如果能从先验信息中较为准确地算得 先验平均和先验方差 则可令其分别等于 分布的期望与方差最后解出a与b 13 如果从先验信息获得则可解得a 3 b 12这意味着 的先验分布是参数a 3 b 12的 分布 假如我们能从先验信息中较为准确地把握 的两个分位数 如确定 确定的10 分位数 0 1和50
9、的中位数 0 5 那可以通过如下两个方程来确定a与b 14 假如的信息较为丰富 譬如对此产品经常进行抽样检查 每次都对废品率作出一个估计 把这些估计值看作的一些观察值 再经过整理 可用一个分布去拟合它 假如关于的信息较少 甚至没有什么有用的先验信息 那可以用区间 0 1 上的均匀分布 a b 1情况 用均匀分布意味着我们对的各种取值是 同等对待的 是 机会均等的 15 贝叶斯本人认为 当你对参数 的认识除了在有限区间 c d 之外 其它毫无所知时 就可用区间 c d 上的均匀分布作为 的先验分布 这个看法被后人称之为 贝叶斯假设 确定了先验分布后 就可计算出后验分布 过程如下 x 0 1 n
10、0 1 于是X的边际分布为 16 最后在给出X x的条件下 的后验密度为 显然这个后验分布仍然是 分布 它的两个参数分别是a x和b n x 我们选后验期望作为的贝叶斯估计 则 的贝叶斯估计为 与前面的极大似然估计是不同的 17 如果用 0 1 上的均匀作为 的先验分布 则 的贝叶斯估计为 计算如下 后验分布为 18 三 常用的一些共轭先验分布 对于一些常用的指数分布族 如果仅对其中的参数 感兴趣 下表列出了它们的共轭先验分布及后验期望 19 EX1设 是一批产品的不合格率 已知它不是0 1就是0 2 且其先验分布为 0 1 0 7 0 2 0 3假如从这批产品中随机取8个进行检查 发现有2个
11、不合格 求 的后验分布 解 20 EX2设一卷磁带上的缺陷数服从泊松分布P 其中 可取1 0和1 5中的一个 又设 的先验分布为 1 0 0 4 1 5 0 6假如检查一卷磁带发现了3个缺陷 求 的后验分布 21 四 贝叶斯推断 估计 条件方法 由于未知参数的后验分布是集三种信息 总体 样本和先验 于一身 它包含了所有可供利用的信息 故有关的参数估计和假设检验等统计推断都按一定方式从后验分布提取信息 其提取方法与经典统计推断相比要简单明确得多 基于后验分布的统计推断就意味着只考虑已出现的数据 样本观察值 而认为未出现的数据与推断无关 这一重要的观点被称为 条件观点 基于这种观点提出的统计方法被



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 贝叶斯 估计
