山西自考会计专业概率论与数理统计复习资料7

山西自考网 发布时间:2012年06月05日

下面内容公式和符号显示不全,请下载原版word文档 

    [点击下载该文件:第七章 参数估计.doc]

 

第七章 参数估计

内容介绍

  本章主要内容是参数的点估计、估计量的评价标准以及参数的区间估计等.

   内容讲解

   引 言:
  本章将讨论统计推断,所谓统计推断就是由样本来推断总体. 当总体的某个参数未知时,用样本来对它进行估计,就是参数估计. 至于参数,目前没有准确的定义,只有一些具体的参数,本书指出三类参数:
  ①分布中含有的未知参数θ;
  ②θ的函数;
 
  ③分布的各种特证数。
§ 7.1 点估计
  1.点估计定义:设x1,x2,…xn是总体X的一个样本,θ是它的未知参数,用一个关于x1,x2,…xn的统计量 的取值作为θ的估计值,称 为θ的点估计.
 
  2.点估计的两种常用方法
  (1)替换原理和矩法估计
  ① 替换原理:替换原理常指如下两句话:一是:用样本矩替换总体矩;二是:用样本矩的函数替换相应的总体矩的函数.
  ② 矩估计的方法:根据替换原理,用样本矩或样本矩的函数对总体的矩或矩的函数进行估计。例如:
  用样本均值 估计总体均值E(X),即 ;
  用样本二阶中心矩 估计总体方差,即 ;
  用事件A的频率估计事件A的概率等.
  例题1. P146
  【例7-1】对某型号的20辆汽车记录其每5L汽油的行驶里程(km),观测数据如下:
  29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7
  28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9
  【答疑编号12070101】
 
  (2)概率函数p(x;θ)已知时未知参数的矩法估计
 
  设总体具有已知的概率函数p(x;θ1,…,θk),(θ1,…,θk) 是未知参数或参数向量,x1,…,xn是样本,假定总体的k阶原点矩μk存在,则对所有的j(0<j<k),μj都存在。
 
  (3)若假设θ1,…,θk能够表示成μ1,…,μk的函数θj=θj(μ1,…,μk),则可给出诸θj的矩法估计。
 
 
  例题2. P146
  【例7-2】设总体为指数分布,其密度函数为
 
 
 
  【答疑编号12070102】
  这说明矩估计可能是不惟一的,这是矩法估计的一个缺点,此时通常应该尽量采用低阶矩给出未知参数的估计。
  例题3. P147
  【例7-3】设x1,…,xn是来自服从区间(0,θ)上的均匀分布U(0,θ)的样本,θ>0为未知参数。求θ的矩估计 。
  【答疑编号12070103】
 
  矩估计法处理三类问题:第一,直接估计参数,第二,通过总体分布已知,但还有未知参数的情况下,对未知参数进行估计的时候,是要通过总体所服从的分布,找到未知参数和X之间的关系,然后对X进行估计,代进去对未知参数进行估计。第三,未知参数的函数的估计。
  小概率原理:小概率事件,在一次试验中,几乎不可能发生。在一次事件中就发生的事件,我们认为它是大概率事件。
  (4)极大似然估计
  设总体的概率函数为p(x,θ), ,其中θ是一个未知参数或未知参数向量, 是参数θ的取值范围,x1,x2,…xn是该总体的样本,将样本联合概率函数记为 ,简记为 ,
  
  则称 为样本的似然函数. 如果存在统计量 使得
   ,
  则称 为θ的极大似然估计.
  例题4. P147
  【例7-4】设有外形完全相同的两个箱子,甲箱中有99个白球和1个黑球,乙箱中有99个黑球和一个白球。现随机地抽取一箱,并从中随机抽取一球,结果取得白球,问这球是从哪一个箱子中取出的?
  【答疑编号12070104】
  解:不管是哪一个箱子,从箱子中任取一球都有两个可能的结果:A表示取出白球,B表示取出黑球。如果我们取出的是甲箱,则A发生的概率为0.99,而如果取出的是乙箱,则a发生的概率为0.01。现在一次试验中结果A发生了,人们的第一印象就是:“此白球(A)最像从甲箱取出的”,或者说,应该认为试验条件对事件A出现有利,从而可以推断这球是从甲箱中取出的。这个推断很符合人们的经验事实,这里“最像”就是“极大似然”之意。
  例题5. P147
  【例7-5】设产品分为合格品与不合格品两类,我们用一个随机变量X来表示某个产品是否合格,X=0表示合格品,X=1表示不合格品,则X服从二点分布B(1,p),其中p是未知的不合格品率。
  【答疑编号12070105】
 
 
 
 
 
  总结计算方法:

  ① 构造似然函数;② 求似然函数的对数. 由于似然函数是以乘积形式构成,对数函数 是 的单调增加函数,则似然函数的对数与其有相同的极值点,所以在求导数之前先求似然函数的对数;③ 用导数求似然函数对数的极值,得极大似然估计值.
 
  例题6. P148
  【例7-6】设一个试验有三种可能结束,其发生的概率分别为
  p1=θ2,p2=2θ(1-θ),p3=(1-θ)θ2。
  现做了n次试验,观测到三种结果发生的次数分别为n1,n2,n3(n1+n2+n3=n),求似然函数。
  【答疑编号12070106】
 
 
  例题7. P149
  【例7-7】对正态总体N(μ,σ2),θ=(μ,σ2)是二维参数,设有样本x1,…xn,求似然函数。
  【答疑编号12070107】
 
 
  例题8. P149
  【例7-8】(1)设总体X服从泊松分布p(λ),求λ的极大似然估计;
  【答疑编号12070108】
 
 
 
  (2)设总体X服从指数分布E(λ),求λ的极大似然估计。
  【答疑编号12070109】
 
 
  例题9. P150
  【例7-9】设x1,x2,…xn是总体的样本,已知总体的密度函数为
  
  试分别求出θ的矩估计 和极大似然估计 .
  【答疑编号12070110】
 
 
 
  例题10. P150
  【例7-10】设x1,…,xn是来自均匀总体U(0,θ)的样本,试求θ的极大似然估计。
 
 
  类似地,当总体X~U(a,b)时,参数a、b的极大似然估计为

   

  【答疑编号12070111】
  极大似然估计的一个简单而有用的性质:若 是θ的极大似然估计,则对任一θ的函数g(θ), 它的极大似然估计为 ,这就是极大似然估计的不变性。
 
  例题11 P151
  【例7-11】设x1,x2,…xn是来正态总体N(μ,σ2)的样本,求标准差σ和概率P{X≤3}的最大似然估计。
  【答疑编号12070112】
 
 
§ 7. 2 点估计的评价标准
  
  1.相合性
  (1)定义:设 为未知参数, 是θ的一个估计量,n是样本容量,若对任何ε>0,有
    ,
  则称 为参数θ的相合估计.
 
  解释:相合性被认为是对估计的一项最基本的要求. 但是,由于此性质需要有n→∞的极限过程,所以,相合性适合的大样本估计的评价。
 
  例题1. P152
  【例7-12】设x1,x2,…是来自正态总体N(μ,σ2)的样本,则由大数定律及相合性定义知:
   是μ的相合估计;
   是σ2的相合估计;
   也是σ2的相合估计。
  证明: 是μ的相合估计。
  【答疑编号12070201】
 
  (2)相合性判定定理:设 是θ的一个估计量,若

    , ,

   则称 为参数θ的相合估计.
 
  例题2. P152
  【例7-13】设x1, …,xn是来自均匀总体u(0,θ)的样本,证明θ的极大似然估计是相合估计。
  【答疑编号12070202】
 
  为了使用定理判断,我们下面求它的数学期望和方差。
 
  2.无偏性
   对于小样本,无偏性是一个常用的评价标准。
  (1)定义:设 是θ的一个估计,θ的参数空间为 ,若对任意 ,有
   ,
  则称 为θ的无偏估计;否则称为有偏估计.
  解释:无偏估计表示估计值与被估计量之间没有系统偏差.
 
  例题3. P153
  【例7-14】对任一总体而方,样本均值是总体均值的无偏估计。当总体k阶矩存在时,样本k阶原点矩ak是总体k阶原点矩μk的无偏估计。但对k阶中心矩则不一样,例如,二阶样本中心矩 就不是部体方差σ2的无偏估计。
  证明: , 
  【答疑编号12070203】
 
  (2)几个有用的结论

  ① 是 的无偏估计;
  ② ,即 是σ2的渐进无偏估计;
  ③s2是σ2的无偏估计;
  ④ 若 为θ的无偏估计,一般地,除gθ是θ的线性函数外, 不是gθ的无偏估计.
  所以,无偏性没有不变性。
  3.有效性
  (1)定义:设 , 是θ的两个无偏估计,如果对任意的 有
   ,
  且至少有一个 使上式的不等号严格成立,则称 比 有效.
  (2)解释:这是在无偏估计中选择更好的估计的评价标准。
  例题15. P154
  【例7-15】设x1,…,xn是取自某总体的样本,记总体均值为μ,总体方差为σ2,则 , 都是μ的无偏估计,
  【答疑编号12070204】
  
  
 
  
  而 ,所以 比 有效。
§ 7. 3 参数的区间估计

  点估价的两点不足:① 很难准确;② 没有用数量表示的可信度。为此,引入区间估计。
  1.置信区间的概念
  (1)引例
  【例7-17】设某种绝缘子抗扭强度X服从正态分布N(μ,σ2),其中未知,σ2已知(σ=45公斤•米),试对总体均值μ作区间估计.
  分析:首先,通过抽样来估计μ,所以,从总体X抽取容量为n的样本x1,x2,…,xn,可得样本均值 ,已知 是μ的无偏估计,且 ~ ,可以在 的基础上对μ作区间估计.
  【答疑编号12070301】
 
  其次,也是最重要的是,要选择一个合适的统计量作为估计函数. 为了对μ作估计,要求估计函数应该:① 含有待估计参数μ,② 无论μ为何值,估计函数的分布已知,以便通过查该分布的计算表求所需数值.
  再次,为了克服点估计的可信程度无法度量的不足,需要设定一个可信概率,记为1-α(0<α<1),称为置信度,依此概率进行估计.
 
  解:从总体X抽取容量为n的样本x1,x2,…,xn,可得样本均值 ~ ,从而得到合适的估计函数为
   ~ ;
 
  因为 是μ的无偏估计及标准正态分布概率密度函数的对称性,又置信度为1-α(0<α<1),所以,查表求满足
  
  或
  
  的 ,即标准正态分布的上 分位点.
 
  将不等式 转化为 ,即为
   ,
  因此有
   .
  所得区间 即为所求的估计区间,由于区间长度随置信度1-α变化而变换,所以称之为置信区间.
 
  小结:步骤:① 选取合适的估计函数;② 根据置信度查表求上 分位点;③ 根据样本及相应的置信区间公式,求出置信区间.
  (2)置信区间的定义:设θ为总体的未知参数, , 是由样本x1,x2,…,xn给出的两个统计量,若对于给定的概率1-α(0<α<1),有
   ,
  则随机区间[ ]称为参数θ的置信度为1-α的置信区间, 称为置信下限, 称为置信上限.
  (3)解释:参数θ落入区间[ ]的概率为1-α.
 
  (4)置信度与精度的关系
  ① 在样本容量固定的条件下,置信度增大,将引起置信区间长度增大,使区间估计的精度降低;置信度减小,将引起置信区间长度减小,使区间估计的精度提高;
  ② 在置信度固定不变的条件下,样本容量增大,将引起置信区间长度减小,区间估计的精度提高;反之,精度降低.
  2.单正态总体参数的置信区间
  设总体X~N(μ,σ2),x1,x2,…,xn为其样本.
  (1)σ已知时,μ的置信度为1-α的区间估计
   由引例得此置信区间为
    .
 
  【例7-18】某车间生产滚珠,从长期实践知道,滚珠直径X服从正态分布。从某天产品里随机抽取6个,测得直径为(单位:毫米):
  14.6, 15.1, 14.9, 14.8, 15.2, 15.1.
  若总体方差σ2=0.06,求总体均值μ的置信区间(σ=0.05,σ=0.01)
  【答疑编号12070302】
 
 
  【例7-19】用天平称量某物体的质量9次,得平均值为 ,已知天平称量结果为正态分布,其标准差为0.1g。试求该物体质量的0.95置信区间。
  【答疑编号12070303】
 
  解:此外1-α=0.95,α=0.05,查表知u0.025=1.96,于是该物体的体质量μ的0.95置信区间为
   =15.4±0.0653,
  从而该物体质量的0.95置信区间为[15.3347,15.4653]。
  【例7-20】设总体为正态分布N(μ,1),为得到μ的置信水平为0.95的置信区间长度不超过1.2,样本容量应为多大?
  【答疑编号12070304】
 
  (2)σ未知时,μ的置信度为1-α的区间估计
  选择统计量 ~ ,得到μ的置信度为1-α的置信区间为
   ,
  其中 ,是σ2的无偏估计.
 
 
  【例7-21】假设轮胎的寿命服从正态分布。为估计某种轮胎的平均寿命,现随机地抽12只轮胎试用,测得它们的寿命(单位:万千米)如下:
  4.68 4.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70
  试求平均寿命的0.95置信区间。
  【答疑编号12070305】
 
  3.μ未知,σ2的置信区间
  根据样本方差s2的无偏估计及定理6-4(2)的结论,有估计函数
   ~ .
 
  又根据给定的置信度1-α、 分布密度函数的特点以及置信区间为等尾区间的要求,查 分布表求出 分布的两个分位点 和 ,满足
   ,
  由此得σ2的置信度为1-α的置信区间为
   .
 
 
  【例7-22】某厂生产的零件质量服从正态分布N(μ,σ2),现从该有利于生产的零件中抽取9个,测得其质量为(单位:g)
  45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6
  试求总体标准差σ的0.95置信区间。
  【答疑编号12070306】
  解:由数据可算得s2=0.0325,(n-1)s2=8×0.0325=0.26,这里α=0.05,查表知 (8)=2.1797, (8)=17.5345,代入(7.3.1)可得σ2的0.95置信区间为
  

  本章小结:

  一、内容
  
   

  二、试题选讲
  1. 设总体X~N(1,σ2),x1,x2,…,xn是来自该总体的样本, ,则 =_____________.
  【答疑编号12070307】
  答案:1
 
  2.设总体X具有区间[0,θ]上的均匀分布(θ>0),x1,x2,…,xn是来自该总体的样本,则 的矩估计 =____________.
  【答疑编号12070308】
  答案:
 
  3.设总体X的概率密度为   ,x1,x2,…,xn是总体X的一个样本,则未知 的矩估计 =_____________.
  【答疑编号12070309】
  答案:
 
 
  4.设总体X服从参数λ的泊松分布,其中λ为未知参数,X1,X2,…,Xn为来自该总体的一个样本,则参数λ的矩估计量为_________________.
  【答疑编号12070310】
  答案:
  
 
  5.设总体X服从[0,2θ]上的均匀分布(θ>0),x1,x2,…,xn是来自该总体的样本, 为样本均值,则θ的矩估计 =( ).
  A.2  B.  C. /2 D.1/2 
  【答疑编号12070311】
  答案:B
 
  6.设总体X~N(μ,σ2),x1,x2,x3为来自总体X的样本,则当α=______时, 是未知参数μ的无偏估计.
  【答疑编号12070312】
  答案:1/4
 
  7.用传统工艺加工某种水果罐头,每瓶维生素C的含量为随机变量X(单位:mg),设X~N(μ,σ2),其中μ,σ2均未知。现抽查16瓶罐头进行测试,测得维生素C的平均含量为20.80mg,样本标准差为1.60mg,试求μ的置信度95%的置信区间.
  (附: , )
  【答疑编号12070313】
  答案:
 
  8.一台自动车床加工的零件长度X(单位:cm)服从正态分布N(μ, σ2),从该车床加工的零件中随机抽取4个,测得样本方差s2= ,试求:总体方差σ2的置信度为95%的置信区间.
  (附: , , , )
  【答疑编号12070314】
  答案: =[0.0428,1.8518]