• 网志分类
  • » 查看所有日志 (553)
    » 杂记 (108)
    » VC (33)
    » 工控 (7)
    » FPGA (88)
    » Matlab (196)
    » 数值计算 (18)
    » 其他学习 (51)
    » 个人简介 (10)
    » 私人空间 (18)
    » 四方朋友 (11)
    » MATLAB好书推荐 (7)
    » 被遗忘的角落 (6)
  • 站内搜索
  • 友情链接
  • » 我的歪酷 非非共享界
    » 爸妈网
    » 醒醒
    » 圈圈
    » 一溜烟儿
    » 亚丁小屋
    » EDA专业论坛
    » 哈工大萝卜驿站
    » 王茜英语在线翻译
    » 仿真论坛MATLAB板
    » 研学之路-混沌序列建模
    » mathworks的文件交换站
    » MATLAB M-Files DataBase
    » mathtools.net
    » Kernel Machines
    » MATLAB ToolBox
    » Boosting Research
    » Chih-Jen Lin's Libsvm
    » Support vector machine
    » mathworks/support/product/
    » http://www.sciencedirect.com

    订阅 RSS

    歪酷博客

    0808949

    « 上一篇: 数据的统计特征与分布 下一篇: 抽样的检测基础 »
    山城棒棒儿军 @ 2004-05-22 14:06




      在一组条件完全相同的重复试验中,个别的测量值可能会出现异常。如测量值过大或过小,这些过大或过小的测量数据是不正常的,或称为可疑的。对于这些可疑数据应该用数理统计的方法判别其真伪,并决定取舍。常用的方法有拉依达法、肖维纳特(Chavenet)法。格拉布斯(Grubbs)法等。

    一、拉依达法

      当试验次数较多时,可简单地用3倍标准偏差(3S)作为确定可疑数据取舍的标准。当某一测量数据(xi)与其测量结果的算术平均值(x-‘)之差大于3倍标准偏差时,用公式表示为:

                   ︳xi -x-‘︳>3S

      则该测量数据应舍弃。

      这是美国混凝土标准中所采用的方法,由于该方法是以3倍标准偏差作为判别标准,所以亦称3倍标准偏差法,简称3S法。

      取3S的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在 x-‘一3S与x-‘ 十3S之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃。

      另外,当测量值与平均值之差大于2倍标准偏差(即 ︳xi -x-‘︳> 2S)时,则该测量值应保留,但需存疑。如发现生产(施工)、试验过程屯有可疑的变异时,该测量值则应予舍弃。

      拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如n<10)在一组测量值中即使混有异常值,也无法舍弃。

    二、肖维纳特法

      进行n次试验,其测量值服从正态分布,以概率1/(2n)设定一判别范围(一knS,knS),当偏差(测量值xi与其算术平均值x-‘之差)超出该范围时,就意味着该测量值xi是可疑的,应予舍弃。判别范围由下式确定:

      肖维纳特法可疑数据舍弃的标准为:

               ︳xi一 x-‘︳/S≥kn

    三、格拉布斯法

       格拉布斯法假定测量结果服从正态分布,根据顺序统计量来确定可疑数据的取舍。

       进行n次重复试验,试验结果为x1、x2、…、xi、…、xn ,而且xi服从正态分布。

       为了检验 (i=1,2,…,n)中是否有可疑值,可将 按其值由小到大顺序重新排列,根据顺序统计原则,给出标准化顺序统计量g:

            当最小值x(1)可疑时,则: g=( x-‘一x(1) )/S

            当最大值x(n)可疑时,则: g=( x(n) 一 x-‘ )/S

      根据格拉布斯统计量的分布,在指定的显著性水平β(一般β=0.05)下,求得判别可疑值的临界值g0( β,n) ,格拉布斯法的判别标准为:

            g≥g0( β,n)

      利用格拉布斯法每次只能舍弃一个可疑值,若有两个以上的可疑数据,应该一个一个数据的舍弃,舍弃第一个数据后,试验次数由n变为n一1,以此为基础再判别第二个可疑数据。




    评论 / 个人网页 / 扔小纸条
    *昵称

    已经注册过? 请登录

    Email
    网址
    *评论