19_BB. Generowanie sztucznego rozkładu normalnego za pomocą Excela cd.

Rozkład normalny ma pochodzenie naturalne. Danych o takim rozkładzie występują powszechnie w naturze. Dane ciągłe o charakterystyce rozkładu normalnego można znaleźć w bazach przedsiębiorstw, w statystykach szpitali, w pomiarach stanu rzek, w pomiarach wzrostu roślin. Większość danych pochodzenia naturalnego ma charakterystyki rozkładu normalnego.

 Jeżeli dane z naturalnego źródła nie maja rozkładu normalnego, możemy podejrzewać, że statystyka populacji nie znajduje się w równowadze statystycznej lub że stabilne dane były poddane manipulacjom, były celowo zniekształcane. Powodem nienormalności rozkładu danych naturalnych może być też błąd statystyka. Przed przystąpienia do analizy zbioru trzeba najpierw zastanowić się czy nie mamy zbioru składającego się z „jabłek i gruszek”. 

Bardzo trudno sztucznie wytworzyć dane o rozkładzie normalnym stosując proste algorytmy. Krzywa rozkładu normalnego tym lepiej oddaje prawdopodobieństwo zdarzeń czym populacja jest większa. Małe zbiory danych mogą nie zachowywać cech rozkładu normalnego, mimo że cała populacja, z której pochodzą ma typowy rozkład normalny.

Korzystając z funkcji Excela po raz kolejny postanowiłem sztucznie wytworzyć populacje o rozkładzie normalnym.

Generowanie sztucznego rozkładu normalnego za pomocą Excela prawie mi się udało.  Wygenerowaną populację liczącą 1740 elementów nazwałem: „Military representative company”.

Wizualnie histogram wzrostu żołnierzy kompanii reprezentacyjnej był zbliżony do rozkładu normalnego. Spora część ekspertów Six Sigma uważa, że w przypadku dużej próby wizualne dopasowanie rozkładu populacji histogramu wystarczy do uznania, że populacja ma rozkład zbliżony do rozkładu normalnego.

Niestety test normalności Anderson-Daring, który będziemy bliżej omawiali w dalszej części kursu, pokazał, że rozkład populacji ma odchylenia od rozkładu normalnego, że uzyskany rozkład jest tylko zbliżony do rozkładu normalnego.

Najczęstszym problemem przy wadliwych rozkładach normalnych jest prawdopodobieństwo przy ogonach krzywej rozkładu.

Poniżej widać problem odejścia punktów populacji od rozkładu normalnego przy ogonach. Generowanie sztucznego rozkładu normalnego za pomocom Excela mimo dzwonowatego kształtu histogramu znowu się nie udało.