Excel如何發(fā)現(xiàn)偏差值
Excel如何發(fā)現(xiàn)偏差值
收集的數(shù)據(jù)中,經(jīng)常出現(xiàn)比其他數(shù)據(jù)極端大或極端小的數(shù)值,即“偏差值”。以下是學(xué)習(xí)啦小編為您帶來的關(guān)于如何發(fā)現(xiàn)偏差值,希望對您有所幫助。
如何發(fā)現(xiàn)偏差值
偏差值又叫異常值、離群值、特殊值等.在數(shù)據(jù)挖掘中,發(fā)現(xiàn)偏差值并分析其產(chǎn)生的原因或理由非常重要。發(fā)現(xiàn)偏差值后需要將其排除,但同時也能從中發(fā)現(xiàn)到目前為止未能確認(rèn)的有效信息或特征。偏差值也許是含有寶藏的原礦石,其中隱藏了發(fā)現(xiàn)新結(jié)果的可能性。發(fā)現(xiàn)偏差值后,請一定找出原因,這也是Excel數(shù)據(jù)分析的一個很好的經(jīng)驗。
從大量數(shù)據(jù)中發(fā)現(xiàn)偏差值的方法之一是建立數(shù)據(jù)分布圖,從視覺上判斷偏差值,然后雙擊數(shù)據(jù)(點)。如下圖所示,彈出“數(shù)據(jù)點格式”。在“數(shù)據(jù)標(biāo)志”中選擇“值”,則圖表中顯示數(shù)據(jù)(點)名稱(數(shù)據(jù)標(biāo)簽)。
其他參考資料:異常值outlier:一組測定值中與平均值的偏差超過兩倍標(biāo)準(zhǔn)差的測定值。與平均值的偏差超過三倍標(biāo)準(zhǔn)差的測定值,稱為高度異常的異常值。在處理數(shù)據(jù)時,應(yīng)剔除高度異常的異常值。異常值是否剔除,視具體情況而定。在統(tǒng)計檢驗時,指定為檢出異常值的顯著性水平α=0.05,稱為檢出水平;指定為檢出高度異常的異常值的顯著性水平α=0.01,稱為舍棄水平,又稱剔除水平(reject level)。
猜你喜歡:
1.怎樣在excel兩個表格中找到相同數(shù)據(jù)