(1) 選取樣本數據:某小區A在一個月內有n個寬帶類裝機任務,n=10,每個任務計算得出任務施工時長如下:58、45、68、60、74、100、65、55、77、62。
(2) 按序排列數據:將樣本數據按從小到大的順序進行排列,得到45、55、58、60、62、65、68、74、77、100。異常值應定位在前、末端數據。
(3) 平均值x與標準方差s計算:s:x-=66.4;標準差s=14.99。
(4) 偏離值計算:計算平均值與最小值、最大值的差。平均值與最小值之差為66.4-45=21.5;最大值與平均值之差為100-66.4=33.6。
(5) 圈定首個可疑數據:最大值與平均值之差33.6大于平均值與最小值之差21.5,因此可認定最大值100是可疑值。
(6) 計算殘差與標準差Gi值:Gi=(xi-x- )/s;其中i是可疑值的排列序,本樣本數據為10號,xi-x-為殘差值,即:可疑數據與平均值之差,值為33.6;因此G10 = (33.6)/14.99=2.241。將計算值Gi與格拉布斯表給出的臨界值GP(n)比較,如果計算的Gi值大于表中的臨界值GP(n),則能判斷該測量數據是異常值,可以剔除。臨界值GP(n)與兩個參數有關:檢出水平α (與置信概率P有關)和測量次數n (與自由度f有關)。
(7) 定檢出水平α:由于平均處理時長本身存在諸多因素影響,要求不嚴格,故可以將α設置得大一些,假定為α=0.10,即P=0.90;通常定α=0.05,P=0.95。
(8) 匹配格拉布斯表獲得臨界值:根據選定的P值(此處為0.95)和測量次數n(此處為10),查格拉布斯表,橫豎相交的臨界值G95(10)=2.176。
(9) 比較計算值Gi和臨界值G95(10):Gi=2.241,G95(10)=2.176,Gi>G95(10)。
(10) 異常值判定:因為Gi>G95(10),可以判斷測量值14.0為異常值,將它從10個測量數據中剔除。
(11) 重復計算:將剩余的9個數據再按以上步驟計算,如果計算的Gi>G95(9),仍為異常值則剔除,繼續對剩余的8個數據計算;如果Gi<G95(9),不是異常值,則不剔除,計算結束