山西自考会计专业概率论与数理统计复习资料8

山西自考网 发布时间:2012年06月05日

下面内容公式和符号显示不全,请下载原版word文档 

    [点击下载该文件:第八章 假设检验.doc]

 

第八章 假设检验
内容介绍

  本章主要介绍统计假设检验的基本思想和概念以及参数的假设检验,并简单介绍非参数的统计假设检验的一些方法.

  内容讲解
§ 8.1 假设检验的基本思想和概念

  1.引例
  例题1. P167 例8-1 味精厂用一台包装机包装味精,已知袋装味精的重量(单位:公斤)X~N(μ,0.0152),机器正常时,其均值μ=0.5公斤. 某日开工后随机抽取9袋袋装味精,其净重分别为
  0.497, 0.506, o.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512,
  问这台包装机工作是否正常?
  【答疑编号12080101】
  分析:从上述数据可知,9袋味精没有一袋与包装上标明的0.5公斤相同,这是一种普遍现象.造成这种差异不外乎有两种原因:一是偶然因素造成的差异称为随机误差,属于正常误差;二是由于条件因素造成的误差,称为条件误差,属于不正常的误差。为了检验包装机是否正常,在数理统计中给出了假设检验的方法。
  解:已知袋装味精重X~N(μ,0.0152),假设现在包装机工作正常,提出如下假设:
  H0:μ=μ0=0.5,H1:μ≠μ0,
  这是两个对立的假设,让我们通过抽样进行检验,从中选取其一,作出决策.
  从总体中抽取容量为n的样本,其均值为 是μ的一个无偏估计.
 
  易知,当 很小时,认定H0为真,反之, 很大时,我们有理由怀疑H0为真而拒绝H0,接受H1.
 
  如何求出 大、小的临界值?下面讨论之. 
  为了确定临界值,给定一个小数α(0<α<1).由于H0为真时, ~ ,
  与区间估计类似,考虑
   ,
 
  查表可得临界值 .显然,事件
  
  是一个小概率事件,在一次试验中几乎不可能发生. 我们只需计算 的值,与临界值 比较大小,若 ,说明上述小概率事件没有发生,我们接受H0,反之说明,小概率事件居然发生了,与“小概率事件在一次试验中几乎不可能发生”相矛盾,于是拒绝H0,接受H1,认为这台包装机工作不正常.
  2.统计假设检验中的一些基本概念
  (1)参数检验与非参数检验
  如果需要检验的量仅仅涉及总体分布的未知参数,则称之为参数检验. 这是本章讲解的主要内容;如果涉及分布函数形式等时,则称之为非参数检验.
  (2)原假设与备择假设
  引例中的假设H0,即正常情况下放弃H0是小概率事件,则称H0为原假设或零假设;
  与之相对立的是假设H1,称之为备择假设. 两个假设有且仅有一个为真.
  (3)检验统计量
  引例中的  ,称为检验统计量. 对样本数据进行加工并用来判断是否接受原假设的统计量称为检验统计量. 检验统计量应满足:①必须与统计假设有关;②当H0为真时,检验统计量的分布是已知的.
  (4)显著水平
  假设检验的基本理论根据是小概率原理,即小概率事件在一次试验中几乎不可能发生,根据这一原理,如果小概率事件不发生,则接受原假设,否则拒绝原假设。那么,确定多大范围算作小概率呢?选择一个小数α(0<α<1)作为标准,通常取0.05,0.01等,称之为显著水平,所以,假设检验问题要规定一个显著水平α.
  (5)接受域与拒绝域
  应用检验统计量及其分布和显著水平,可以求出小概率事件发生和不发生的临界值,即引例中的 .此数值将统计量可能取值划分为两部分,一部分是原假设成立的取值范围,称为接受域;另一部分是使小概率事件发生的统计量取值范围,即拒绝原假设的范围,称为拒绝域,本书用W表示. 
  3.假设检验中的两类错误
  (1)数理统计的任务本来是用样本来推断总体,即用局部来推断整体,当然有可能犯错误.假设检验是在一定的概率(显著水平)下确定拒绝域的,同样会犯错误.可能犯的错误可分为两类:
  第一类错误是:在H0为真的情况下,样本值落入拒绝域W,因而拒绝H0.这种错误也称为“拒真”错误,犯这类错误的概率是α.
  第二类错误是:在H0为不真的情况下,样本值落入接受域,因而接受H0.这种错误也称为“取伪”错误,犯这类错误的概率是β.
 
  (2)如何减小犯错误的可能?
  ①犯两类错误的概率是相互关联的.当样本容量n固定时,犯一类错误的概率的减小将导致犯另一类错误的概率增加.
  ②要同时降低犯两类错误的概率,只有增大样本容量n.
  在实际使用中,只能采取折中方案.一般地,先控制α值,再尽可能减少β值,并把这一检验方法称为显著性水平为α的显著性检验,简称水平为α的检验.
  4.假设检验的基本步骤
  (1)提出假设:根据实际问题提出原假设H0和备择假设H1,要求H0与H1有且仅有一个为真.
  (2)选统计量:选择适当的检验统计量,并在原假设H0成立的条件下确定该检验统计量的分布.
  (3)求拒绝域:根据给定的显著水平α,查检验统计量的分布表,求出对应于α的临界值,从而得到对原假设H0的拒绝域W.
  (4)作出决策:计算样本的统计量的值,若落入拒绝域W,则认为H0不真,拒绝H0,接受备择假设H1;否则,接受H0.
§ 8.2 总体均值的假设检验

  1.u检验(在其他书上也称Z检验)
  (1)单正态总体,方差已知,均值的检验
  设x1,x2,…,xn为正态总体N(μ,σ2)的一个样本,σ2已知,欲检验假设
  H0:μ=μ0,H1:μ≠μ0,
  其中,μ0为已知数.
  由引例,可选择统计量 ,并且,在H0成立的条件下,u~N(0,1).当给定的显著水平为α时,查标准正态分布表求得临界值 ,从而得到拒绝域
   . 
  由样本观察值计算统计量u的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.
 
 
  (2)双正态总体,方差已知,均值差的检验
  设总体X~ ,Y~ ,其中 , 已知,又x1,x2,…,xm和y1,y2 ,…,yn分别为X和Y的样本,且相互独立.欲检验
  H0:μ1=μ2,H1:μ1≠μ2.
  检验H0:μ1=μ2等价于H0:μ1-μ2=0,而 是μ1-μ2的无偏估计量,且当H0已知时,有
   ~ .
 
  当给定的显著水平为α时,查标准正态分布表求得临界值 ,从而得到拒绝域
   . 
  由样本观察值计算统计量u的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.
  2.t检验
  (1)单正态总体,方差未知,均值的检验
  设x1,x2,…,xn为正态总体N(μ,σ2)的一个样本,σ2未知,欲检验假设
  H0:μ=μ0,H1:μ≠μ0.
  其中,μ0为已知数.
  由于σ2未知,不能应用u检验. 但是,由点估计知,s2是σ2的无偏估计,考虑用s2代替σ2,构造新的检验统计量
   .
 
  由§6.3定理可知,当H0为真时,t~t(n-1). 
  当给定的显著水平为α时,查t分布表求得临界值 ,从而得到拒绝域
   . 
  由样本观察值计算统计量t的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0. 
 
  例题2. P172 
  【例8-2】车辆厂生产的螺杆直径服从正态分布N(μ,σ2),现从抽取5枝,测得直径(单位:毫米)为:22.3,21.5,22.0,21.8,21.4.如果σ2未知,试问直径均值μ=21是否成立?(α=0.05)
  【答疑编号12080102】
 
  (2)双正态总体,方差未知,均值差的检验
  设总体X~ ,Y~ ,x1,x2,…,xm和y1,y1 ,…,yn分别为X和Y的样本,且相互独立.
  ① 方差未知,但 . 欲检验
  H0:μ1=μ2,H1:μ1≠μ2.
  由§6.3定理的讨论可知,当H0为真时,构造如下检验统计量
   ~ .
  
  当给定的显著水平为α时,查t分布表求得临界值 ,从而得到拒绝域
   . 
  由样本观察值计算统计量t的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.
  例题3. P172 
  【例8-3】在漂白工艺中考察温度对针织品断裂强度的影响,现在700C与800C下分别作8次和6次试验,测得各自的断裂强度X和Y的观测值。经计算得 , , , 。根据以往的经验,可认为X和Y均服从正态分布,且方差相等,在给定α=0.10时,问700C与800C对断断裂强度有无显著差异。
  【答疑编号12080103】
  解:由题设,可假定X~N(μ1,σ2),Y~N(μ2,σ2)。于是若作统计假设为两个温度下的断裂强度无显著性差异,即相当于作假设
  H0:μ1=μ2,H1:μ1≠μ2.
  取(8.2.5)式定义的检验统计量t,由α=0.10,查t分布临界值表得
   ,
  取(8.2.5)式算出t的观测值t=2.0737。由于
   ,
  (2)方差未知, ,但m=n(配对问题).欲检验
  H0:μ1=μ2,H1:μ1≠μ2.
  令 Zi=Xi-Yi,i=1,2,…,n,
  由正态分布的可加性,Zi也服从正态分布总体的样本,则有
  E(Zi)=E(Xi-Yi)=μ1-μ2=d, ,
  上式中所设的d,σ2均未知,但所设的假设等价于下述假设:
  H0:d=0,H1:d≠0.
  可构造检验统计量
   ,
  其中 , .在H0为真时,t~t(n-1).
  当给定的显著水平为α时,查t分布表求得临界值 ,从而得到拒绝域
   . 
  由样本观察值计算统计量t的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.
  例题4. P173 
  【例8-4】有两台仪器A,B,用来测量某矿石的含铁量,为鉴定它们的测量结果有无显著的差异,挑选了8件试块(它们的成分、含勿量、均匀性等均各不相同),现在分别用这两台仪器对每一试块测量一次,得到8对观测值如表8-2所示。
  【答疑编号12080104】
  表8-2
A 49 52.2 55 60.2 63.4 76.6 86.5 48.7
B 49.3 49 51.4 57 61.1 68.8 79.3 50.1
  问能否认为这两台仪器的测量结果有显著性差异(α=0.05,假定A,B两种仪器的测量结果X,Y分别服从同方差的正态分布)?
  解:由题意X~N(μ1,σ2),Y~N(μ2,σ2),要检验假设: H0:μ1=μ2,H1:μ1≠μ2.
  下面有两种解法:
  解法1:作配对情况处理结论。
  视两种测量结果之差为来自一个正态总体,记Z=X-Y,得8对数据之差如表8-3所示。
  表8-3
Z -0.3 3.2 3.6 3.2 2.3 7.8 7.2 -1.4
  原检验问题化为:
  H0:d=0,H1:d≠0。
  由表8-3可求得:
   , ,
   。
  由于2.83>2.365,因而否定H0,即认为这两种仪器的测量结果有显著差异。
  解法2:作不配对处理结论。
  视表8-2的两行结果分别来自两个正态总体,类似例8-3的解法,算得
   , ,
   , 。
  这时,可算得检验统计量观测值t为
   
  由α=0.05,查表可得临界值 。由于0.516<2.145,因而不否定H0,即认为这两台仪器的测量结果差异不显著。
  两种解法结论各不相同,究竟哪一种正确?仔细分析不难发现,配对解法消除了试块不同对数据分析的干扰,因为一对数据与另一对之间的差异是各种因素,如材料成分、铁的含量、均匀性等因素引起的,而同一对中两个数据的差异则可看成是仅由这两台仪器性能差异所引起的。因而这也表明不能将仪器A对8个试块的测量结果(表8-2中第一行)看成一个样本,也不能将第二行看成另一个样本,即不配对解法是错误的。

§ 8.3 正态总体方差的假设检验
  
  1. 检验
  单正态总体,均值未知,方差的检验
  设x1,x2,…,xn为正态总体N(μ,σ2)的一个样本,μ未知,欲检验假设
  HO: ,H1: ,
  其中, 为已知数.
  由点估计知,s2是σ2的无偏估计,即当HO为真时,s2应该在σ2附近波动,则 应该在1附近波动;如果 的值与1相比过大或过小,都应否定HO,因此构造检验统计量
   .
  由§6.3定理可知,当HO为真时, ~ .
  当给定的显著水平为α时,查 分布表求得临界值 与 ,从而得
  拒绝域
   . 
  由样本观察值计算统计量 的观察值,若此数值落入拒绝域W内,则作出拒绝HO的决策,否则,接受HO. 
 
  2.F检验
  双正态总体,均值未知,方差是否相等的检验
  设总体X~ ,Y~ ,x1,x2,…,xm和y,y2,…,yn分别为X和Y的样本,且相互独立. 
  欲检验假设
   : , : .
  由于 和 分别为 和 的无偏估计,当HO为真时,由§6.3定理的推论6-4可得
  到检验统计量,当HO为真时
   .
  当给定的显著水平为α时,查F分布表求得临界值 与 ,
  从而得拒绝域
   . 
  由样本观察值计算统计量F的观察值,若此数值落入拒绝域W内,则作出拒绝HO的决策,否则,接受HO.
  【例8-7】设甲、乙两台机床加工同一种轴,从这两台机床加工的轴中分别的取若干根,测得数据如下
  m=8, , ;
  n=7, , .
  假定各台机床加工轴的直径X,Y分别服从正态分布,试比较甲、乙两台机床加工轴的精度有无显著差异(取α=0.05)。
  【答疑编号12080201】
  解:按题意,本题是要检验两正态总体的方差 , 是否相等,即要检验统计假设
  H0: ,H1: 。
  对给定的α=0.05,查附表5可得
   , ,
  于是
      ,
  而
  
  因而 ,故认为两正态总体之方差无显著差异。
  3.参数的区间估计与假设检验(双边)的关系
  以单正态总体,方差已知,均值的区间估计为例加以说明:
  从总体X~N(μ,σ2)抽取容量为n的样本x1,x2,…,xn,σ2已知.
 
  对假设检验问题HO:μ=μ0的水平为α的假设检验的拒绝域为
   ,
  或改写为
   ,
  其中
   .
 
  由此可知,这个检验的非拒绝域为
   ,
  即
   .
  如果把上式中的μ0改为μ,即得单正态总体,方差已知,均值μ的置信度为1-α的置信区间
   .
 
  反之,若 是μ的置信水平为1-α的置信区间,则当
   
  时,自然认为μ≠μ0,这恰好与假设检验问题中HO:μ=μ0的显著水平为α的完全一致. 
  但是,应该指出,区间估计与假设检验在概念上是不同的.
 
 

§ 8.4 单边检验

  上节所讲的假设检验只是一种检验,称之为双边检验. 在实际问题中,还有另一类检验问题,比如,汽车轮胎的寿命,灯泡的寿命等,总体的均值越大越好,此时,需要的假设检验是
  HO:μ≤μ0,H1:μ>μ0,
  其中μ0是已知数.
  类似地,如果只关心总体的均值是否变小,就需要检验假设
  HO:μ≥μO,H1:μ<μO。
  这些,不同于上节的双边检验,称为单边检验.
  下面,讨论单边检验问题.
  (1)单正态总体,方差已知,均值μ的单边检验
  设x1,x2,…,xn为正态总体X~N(μ,σ2)的一个样本,σ2已知,欲检验假设
  HO:μ≤μO,H1:μ>μO,
  其中,μO为已知数.
  由于 是μ的无偏估计,故当HO为真时, 不应过大,若u过大,应拒绝HO,
  即 ,uα待定.
  根据前面讲过的内容知, ~ ,故待定数值,即临界值uα应满足
   ,
  其中,α为显著水平,O<α<1. 显然,uα是标准正态分布的上α分位点,通过查标
  准正态分布表求得,从而得到拒绝域
  W=( ,+∞).
  类似地,对于单边假设检验问题:
  H0:μ≤μ0,H1:μ>μ0,
  仍取 为检验统计量,得到拒绝域为
  W=(-∞, ). 
 
 
  (2)对于单正态总体,方差未知的情况。
  设x1,x2,…,xn为正态总体X~N(μ,σ2)的一个样本,σ2未知,欲检验假设
  H0: ,H1: 及
  H0: ,H1: , 
  其中, 为已知数.仍选择检验统计量 ~ ,分别得到拒绝域
   及 .
  (3)两个正态总体方差未知的情况。
  显著水平α下的各种假设检验见表8-4.
  【例8-8】用某种农药施入农田中防治病虫害,经三个月后土壤中如有5ppm以上的浓度时,认为仍有残效。现在一大田施药区随机取10个土样进行分析,其浓度为:4.8,3.2,2.0 6.0,5.4,7.6,2.1,2.5,3.1,3.5 (单位:ppm)。问该农药经三个月后是否仍有残效(土壤残余农药浓度服从正态分布,α=0.05)?
  【答疑编号12080202】
  解:
 
 
  【例8-9】某类钢板每块的重量X服从正态分布,其一项质量指标是钢板重量的方差不得超过0.016kg2。现从某天生产的钢板中随机抽取25块,得其样本方差s2=0.025kjg2,问该天生产的钢板重量的方差是否满足要求?
  【答疑编号12080203】
  解:这是一个关于正态总体方差的单侧检验问题。原假设为H0:σ2≤0.016,备择假设为H1:σ2>0.016,此处n=25。若取α=0.05,则查表知 ,现计算可得
  
  由此,在显著性水平 0.05下,我们拒绝原假设,认为该天生产的钢板重量不符合要求。
  【例8-10】有一批枪弹,其初速度r~N(μ,σ2),其中μ=950m/s,σ=10m/s。经过较长时间储存后,现取出9发枪弹试射,测其初速度,得样本值如下(单位:m/s):914,920,910,934,953,945,912,924,940。问这批枪弹在显著性水平α=0.05下,其初速度是否起了变化(假定σ没有变化)?
  【答疑编号12080204】
  解:由题设,要检验的假设为H0:μ=950,H1:μ<950,因为枪弹储存后初速度不可能增加,所以是(左侧)单边检验问题,由n=9,易另算出
   
  查表知
  -uα=-u0.05=-1.65
  所以
  U=-6.6<-1.65=-
  故应拒绝H0而接受H1:μ<950,即诊断这批枪弹经过较长时间储存后初速度已经变小了。
  
  本章小结

  一、内容
  
  
  

  二、试题选讲
  1. 设总体X服从正态分布N(μ,1),x1,x2,…,xn为来自该总体的样本, 为样本均值,s为样本标准差,欲检验假设H0:μ=μ0,H1:μ≠μ0,则检验用的统计量是( ).
  【答疑编号12080205】
  A.  B.  C.  D.
  答案:B
 
 
  2.(710)设总体X~N(μ,σ2),X1,X2,…,Xn为来自该总体的样本, 为样本均值,S2为样本方差,欲检验假设H0:μ=μ0,H1:μ≠μ0,则检验用的统计量是( ).
  A.  B.  C.  D.
  【答疑编号12080206】
  答案:C