17_BB. Definicje rozkładu normalnego

W polskiej Wikipedii możemy znaleźć definicje rozkładu normalnego:

„Rozkład normalny, rozkład Gaussa (w literaturze francuskiej zwany rozkładem Laplace’a-Gaussa) – jeden z najważniejszych Przyczyną jego znaczenia jest częstość występowania w naturze. Jeśli jakaś wielkość jest sumą lub średnią bardzo wielu drobnych losowych czynników, to niezależnie od rozkładu każdego z tych czynników jej rozkład będzie zbliżony do normalnego (centralne twierdzenie graniczne) – dlatego można go bardzo często zaobserwować w danychBardziej czytelną definicje rozkładu normalnego można znaleźć w amerykańskiej Wikipedii:

"W teorii prawdopodobieństwa i statystykach, rozkład normalny lub rozkład Gaussa jest ciągłym rozkładem prawdopodobieństwa, który opisuje dane skupiające się wokół średniej [..]. Wykres powiązanej funkcji gęstości prawdopodobieństwa ma kształt dzwonu, z maksimum w średniej, oraz jest znany jako funkcja Gaussa lub krzywa dzwonowa. "

Rozkład normalny posiada kilka interesujących cech, o których warto wiedzieć.

Wskazują na nie definicje rozkładu normalnego.

  • Kształt rozkładu jest określony przez średnią, μ (lub X) i odchylenie standardowe σ.
  • Standaryzowany rozkład normalny ma średnią x=0 i odchylenie s=1.
  • Najwyższy punkt na krzywej jest średnią wartością próby.
  • Rozkład jest symetryczny względem średniej.
  • W miarę oddalania się od średniej punkty pojawiają się coraz rzadziej.
  • Większość powierzchni pod krzywą (99,7%) leży między -3σ a + 3σ średniej.

Nazwa Six Sigma pochodzi właśnie z Rozkładu Normalnego. Oznacza ona, że błędy procesu pojawiają się w 0,3% obszaru pod krzywą.

Dlaczego rozkład normalny jest nazywany rozkładem gęstości prawdopodobieństwa

Na osi x rozkładu znajduje się skala badanej cechy. Mogą to być dane ciągłe takie jak: wzrost, waga, czas itd. Definicja rozkładu normalnego mówi, że rozkład jest najwyższy w miejscu, gdzie znajduje się średnia dla zbioru wartości, dla zbioru danych. Oznacza to, że odcinek poprowadzony pomiędzy krzywą rozkładu a osią x jest w tym miejscu najdłuższy. Prawdopodobieństwo natrafienia na wartość zbliżoną do wartości średniej w rozkładzie normalnym jest w tym miejscu najwyższe.

Czym bardziej wyniki pomiarów oddalają się od średniej, tym prawdopodobieństwo ich pojawienia spada. Wraz z oddalaniem się od średniej rozkładu ogony rozkładu opadają coraz niżej. Czym niższy odcinek pomiędzy krzywą a osią x, tym niższe jest prawdopodobieństwo pojawienia się zdarzenia.

Jeżeli zebralibyśmy całe pole rozkładu pod krzywą wynosiłaby ono 1 lub 100%. Oznacza to, że rozkład normalny opisuje prawdopodobieństwo pojawienia się wszystkich możliwych wartości badanej cechy.

Dzisiaj poznaliśmy definicje rozkładu normalnego. W następnym wpisie spróbuje sztucznie stworzyć populacje o rozkładzie normalnym.