Kategorie szkoleń | Egzaminy | Kontakt
  • 1
  • 2
  • 8.1K

Dlaczego mamy dwie funkcje odchylenia: w próbie i populacji? Dlaczego podobnie rzecz ma się z wariancją? Wreszcie, dlaczego nie mamy dwóch funkcji w przypadku średniej? Czy odchylenie jest jakąś inną, specyficzną miarą?

Uczestnik szkolenia
  • Zapytał
  • @ Uczestnik szkolenia | 21.08.2014
Zaloguj się aby zadać pytanie
Pokrewne

Odpowiedź (1)

  • 2

Odpowiem na przykładzie wariancji: Odchylenie standardowe to pierwiastek kwadratowy z wariancji.

Na początek parę wzorów:

 

 

Wzór pierwszy liczy wariancję  w populacji, a drugi w próbie. W obu przypadkach obliczamy sumę kwadratów różnic pomiędzy każdą wartością a wartością średnią i dzielimy ją przez liczebność (odpowiednio populacji lub próby). Z punktu widzenia Excela to jest to samo. Realizuje to funkcja WARIANCJA.POP lub w starszych wersjach WARIANCJA.POPUL (Excel 2010 i 2013 obsługuje też starsze funkcje jako tzw. funkcje zgodności).

 

Wzór (2) używany jest czasem do estymacji wariancji populacji na podstawie próby. Niestety ma to pewną wadę. Suma kwadratów odchyleń zwiększy się, gdy zamiast wartości średniej użyjemy innej liczby. Gdybyśmy licząc wariancje na podstawie próby, użyli wartość średniej populacji (greckie mi) w miejsce średniej próby, wariancja populacji estymowana wzorem (2) byłaby tak samo często za duża jak za mała. A tak jest ze statystycznego punktu widzenia niedoszacowana. Używa się zatem n-1 (liczbę stopni swobody) w miejsce liczebności próby n, tak jak we wzorze (3). Jest na to jakieś uzasadnienie teoretyczne, choć w pewnej książce do statystyki dla studentów nauk społecznych określono sympatycznie ten zabieg jako "zgadbliżenie". Wartości wg wzoru (3) liczy funkcja WARIANCJA.PRÓBKI lub w starszych wersjach WARIANCJA. Wartość wariancji populacji wyliczona tymi funkcjami jest zawsze większa, niż tymi wspomnianymi powyżej. 

Przy dużej próbie różnica w wyniku obu funkcji jest praktycznie nieistotna.

Porównanie wariancji policzonej formułami z tej policzonej funkcjami pokazuje przykład poniżej:


Zakres zielony nazwałem populacja, pomarańczowy próbka. Nie objaśniam użytych formuł tablicowych - pytanie jest ze statystyki, a one są tu pomocniczo. Postaram się dodać link/linki do postów z przykładowymi formułami tablicowymi, zawierających przykłady, jak je tworzyć i analizować (są takie na Quorum).

Jeżeli chodzi o odchylenie standardowe, sprawa wygląda podobnie. Pomoc Excela zawiera uproszczone wersję używanych przez funkcje wzorów. W przypadku średniej arytmetycznej, średnia średnich z prób losowych zbliża się do średniej populacji (przy nieskończonej ilości prób).

Załączam plik z przykładem.

I na zakończenie jeszcze ciekawostka (przykład jest też zawarty w załączonym pliku).

Wzór (4) zastępował kiedyś (2) przy liczeniu wariancji  ołówkiem albo z kalkulatorem. Ułatwia on znacznie sprawę, gdy chcemy zwiększyć liczebność próby. Kiedyś zauważyłem, że w niektórych wypadkach (arkusz ciekawostka w załączonym pliku) wartości policzone formułami minimalnie odbiegają od wyników wspomnianych powyżej funkcji. Wynika to z zaokrągleń. Można to sprawdzić korzystając z "ręcznego" wzoru (4).

Pozdrawiam.

 

 

 

Załączniki

  • xlsx

    wariancja.xlsx ( 45K )
  • Odpowiedział
  • @ | 05.09.2014
  • TRENER ALTKOM AKADEMII