27_BB. Jak na małej próbie można zweryfikować rozkład normalny całej populacji?

Ostatnio dowiedzieliśmy się jak przy licznym zbiorze danych można sprawdzić normalność rozkładu stosując zwykły histogram. W jaki sposób sprawdzić czy rozkład całej populacji ma charakterystykę rozkładu normalnego, jeżeli dysponujemy nieliczną próbką całej populacji?

Problem konieczności pracy na małej ilości danych jest problemem powszechnym w pracy Black Belta Six Sigma. Bardzo często prosi się specjalistów o pomiary statystyk niedawno uruchomionych procesów lub analizę zjawiska, które właśnie powstało. W takich wypadkach danych jest bardzo mało. Brak umiejętności weryfikacji rozkładu normalnego całej populacji może skutecznie ograniczyć możliwości oceny zjawiska. Przede wszystkim w takiej sytuacji nie jesteśmy w stanie określić, czy proces jest stabilny statystycznie, nie jesteśmy w stanie określić wstępnych limitów kontrolnych na kartach kontrolnych.

W jaki sposób na małej próbie można zweryfikować rozkład normalny całej populacji?

Danych jest zbyt mało, aby można było zweryfikować normalność rozkładu używając histogramu.

 Zebranie danych 

Poniższa metoda opiera się na nielicznej próbie zebranej w sposób losowanej. Losowość doboru próbek jest kluczem prawidłowego przeprowadzenia tego testu. Do analizy mamy 12 losowo wybranych pomiarów z populacji liczącej 400 elementów.

 Uporządkowanie danych 

Należy posortować dane rosnąco i przypisać im numery porządkowe.

 Określenie prawdopodobieństwa dla uporządkowanych pomiarów 

Na małej próbie można zweryfikować rozkład normalny całej populacji, jeżeli dane są ułożone w kolejności i przypisane jest do nich prawdopodobieństwo. Teoretycznie, jeżeli mamy losowo wybrane pomiary powinny one być równomiernie rozrzucone na krzywej rozkładu normalnego. Mało prawdopodobne jest, aby wylosowane wartości reprezentowały tylko część rozkładu.

 Obliczenie parametru z 

Parametr z oznacza liczbę odchyleń standardowych od średniej rozkładu. Parametr z obliczamy wg. wzoru omówionego w poprzednich wpisach.

 Utworzenie wykresu punktowego wartości z 

Wykres można utworzyć w Excelu. Należy skorzystać z możliwości poprowadzenia linii trendu dla wartości z. Jeżeli punkty tworzą linie prostą, mamy do czynienia z rozkładem normalnym.

W ten sposób na małej próbie można zweryfikować rozkład normalny całej populacji.

Dodatkowo można również obliczyć wartości prawdopodobieństwa dla parametrów z używając w Excelu formuły =1-ROZKŁAD.NORMALNY.S(z).