Kryterium Chauveneta

Wykres przedstawiający Kryterium Chauveneta

Kryterium Chauveneta – heurystyczny warunek pozwalający na stwierdzenie, czy dana obserwacja z wykres próby statystycznej jest tzw. obserwacją odstającą, która powstała na skutek błędu pomiaru. Obserwację taką należy odrzucić przed dalszymi analizami statystycznymi.

Przykład zastosowania

Wykonując jakiś pomiar powtarzamy go kilka razy, aby otrzymać dokładniejszy wynik. Im więcej pomiarów, tym dokładniejszy wynik. Jednak może się zdarzyć, że przy którejś z kolei próbie coś zakłóciło nam pomiar, przez co znacznie różni się od pozostałych wyników. W takiej sytuacji powstaje pytanie, czy pomiar ten należy brać pod uwagę, czy nie. Aby znaleźć odpowiedź na to pytanie, należy skorzystać z kryterium Chauveneta. (Przy założeniu, że pomiar wielkości x ma rozkład normalny).

Uwagi

  • Kryterium nie jest dobre przy małej liczności próby N.
  • Kryterium nie jest dobre gdy istnieje więcej niż jedna obserwacja odstająca.
  • Stosowanie tego kryterium jest słuszne pod warunkiem, że podejrzany wynik jest przejawem jakiegoś błędu, a nie odzwierciedleniem jakiegoś istotnego efektu.

Definicja

Zakładając, że wyniki pomiarów podlegają rozkładowi normalnemu o wartości oczekiwanej x ¯ {\displaystyle {\overline {x}}} i odchyleniu standardowym σ x , {\displaystyle \sigma _{x},} prawdopodobieństwo wystąpienia wyniku o wartości | x ¯ x p o d | > k σ x {\displaystyle |{\overline {x}}-x_{pod}|>k\sigma _{x}} wynosi P . {\displaystyle P.} Według kryterium Chauveneta iloczyn liczby podejrzanych wyników n {\displaystyle n} i prawdopodobieństwa P {\displaystyle P} musi być mniejszy od 0 , 5. {\displaystyle 0{,}5.}

n p o d = n P < 1 2 . {\displaystyle n_{pod}=nP<{\frac {1}{2}}.}

Objaśnienie

Załóżmy, że dla pomiarów x 1 , x 2 , x 3 , , x n {\displaystyle x_{1},x_{2},x_{3},\dots ,x_{n}} jeden z nich znacznie różni się od pozostałych (np. x 9 {\displaystyle x_{9}} albo x 26 {\displaystyle x_{26}} ). Podejrzany pomiar oznaczmy ogólnie jako x p o d . {\displaystyle x_{pod}.}

Następnie należy obliczyć statystykę (liczba odchyleń standardowych) k {\displaystyle k} dla podejrzanej wartości x p o d {\displaystyle x_{pod}} i z tablicy funkcji błędu znaleźć prawdopodobieństwo P {\displaystyle P} wystąpienia wyniku poza k σ {\displaystyle k\sigma } (niektóre tablice przedstawiają prawdopodobieństwo P wystąpienia wyniku w t σ {\displaystyle t\sigma } ).

k = | x ¯ x p o d | σ x , {\displaystyle k={\frac {|{\overline {x}}-x_{pod}|}{\sigma _{x}}},}

gdzie:

k {\displaystyle k} – liczba odchyleń standardowych, o którą wynik x p o d {\displaystyle x_{pod}} (podejrzany) różni się od wartości średniej x ¯ , {\displaystyle {\overline {x}},}
x p o d {\displaystyle x_{pod}} – wartość podejrzana,
x ¯ {\displaystyle {\overline {x}}} – średnia arytmetyczna,
σ x {\displaystyle \sigma _{x}} – odchylenie standardowe (estymator największej wiarygodności).

jeżeli n p o d = n P < 1 2 {\displaystyle n_{pod}=nP<{\frac {1}{2}}} to pomiar można odrzucić.

Przykład

Treść doświadczenia: Długość ściany pewnego budynku została zmierzona 5 razy w wyniku czego otrzymano wyniki:
x i {\displaystyle x_{i}} wartość pomiaru
x 1 {\displaystyle x_{1}} 5,24
x 2 {\displaystyle x_{2}} 5,31
x 3 {\displaystyle x_{3}} 5,40
x 4 {\displaystyle x_{4}} 5,45
x 5 = x p o d {\displaystyle x_{5}=x_{pod}} 5,93

Piąty pomiar wyraźnie różni się od pozostałych. Powstają wątpliwości, czy wynik ten nie wpłynie negatywnie na ostateczny wynik pomiaru. Dlatego stosując kryterium Chauveneta możemy sprawdzić, czy dany pomiar odrzucić czy trzeba zostawić.

Zadanie: Za pomocą kryterium Chauveneta sprawdzimy, czy pomiar piąty można odrzucić czy nie.

Dane:

N = 5 (liczba wykonanych pomiarów)
x p o d {\displaystyle x_{pod}} = 5,93 m
x i {\displaystyle x_{i}} – wartość danego pomiaru
k {\displaystyle k} – liczba odchyleń standardowych
n {\displaystyle n} – liczba podejrzanych wyników

Obliczenia:

  1. Obliczamy średnią arytmetyczną:
    x ¯ = 1 N i = 1 N x i x ¯ = 5 , 24 + 5 , 31 + 5 , 40 + 5 , 45 + 5 , 93 5 = 5,466 {\displaystyle {\overline {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i}\Rightarrow {\overline {x}}={\frac {5{,}24+5{,}31+5{,}40+5{,}45+5{,}93}{5}}=5{,}466} [m].
  2. Obliczamy odchylenie standardowe (Estymator największej wiarygodności):
    σ x = 1 N 1 i = 1 N ( x i x ¯ ) 2 σ x = 0,271 7167642969. {\displaystyle \sigma _{x}={\sqrt {{\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}}\Rightarrow \sigma _{x}=0{,}2717167642969.}
  3. Obliczamy wyznacznik k : {\displaystyle k{:}}
    k = | x ¯ x p o d | σ x k = 1,707 660553. {\displaystyle k={\frac {|{\overline {x}}-x_{pod}|}{\sigma _{x}}}\Rightarrow k=1{,}707660553.}
  4. Odczytujemy prawdopodobieństwo z tablic: W tym punkcie należy skorzystać z odpowiednich tablic[1] i odczytać konkretną wartość prawdopodobieństwa P [ % ] {\displaystyle P[\%]} dla wartości k {\displaystyle k} obliczonej w poprzednim punkcie.
  5. Obliczenie wyznacznika n p o d : {\displaystyle n_{pod}{:}}
    • n p o d = n ( 1 P 100 ) {\displaystyle n_{pod}=n\left(1-{\frac {P}{100}}\right)} – jeżeli tablica przedstawia prawdopodobieństwo P wystąpienia wyniku w k σ , {\displaystyle k\sigma ,}
    • n p o d = n P {\displaystyle n_{pod}=nP} – jeżeli tablica przedstawia prawdopodobieństwo P wystąpienia wyniku poza k σ , {\displaystyle k\sigma ,}
  6. Jeżeli n p o d < 0 , 5 {\displaystyle n_{pod}<0{,}5} to sprawdzany pomiar należy odrzucić.

Zobacz też

Przypisy

  1. Taylor JohnT.J. R. Taylor JohnT.J., Wstęp do analizy błędu pomiarowego, 1999 .

Bibliografia

  • Witold Suchecki, Metody opracowania wyników pomiarowych, Politechnika Warszawska.
  • Andrzej Bluszcz, Estymatory średniej i dyspersji, Politechnika Śląska.