Spis treści
Wprowadzenie
1	Przedmiot i podstawowe pojęcia statystyki
	1.1	Przedmiot statystyki
	1.2	Podstawowe pojęcia statystyczne
	1.3	Organizacja statystyki w Polsce
2	Badania statystyczne
	2.1	Rodzaje badań statystycznych
	2.2	Organizacja badań statystycznych
3	Opisowa analiza struktury zjawisk masowych
	3.1	Miary średnie
	3.2	Miary zmienności	
	3.3	Miary asymetrii
	3.4	Miary koncentracji
	3.5	Zadania do samodzielnego rozwiązania
4	Elementy rachunku prawdopodobieństwa
	4.1	Zdarzenia losowe, algebra zdarzeń
	4.2	Definicja i własności prawdopodobieństwa
	4.3	Zdarzenia niezależne, prawdopodobieństwo warunkowe
	4.4	Schemat Bernoulliego
	4.5	Zadania do samodzielnego rozwiązania
5	Zmienna losowa jednowymiarowa i jej rozkłady
	5.1	Pojęcie zmiennej losowej
	5.2	Dystrybuanta zmiennej losowej
	5.3	Rozkład zmiennej losowej skokowej
	5.4	Rozkład zmiennej losowej ciągłej
	5.5	Ważniejsze rozkłady zmiennych losowych
		5.5.1	Rozkład zero-jedynkowy (dwupunktowy)
		5.5.2	Rozkład Bernoulliego (dwumianowy)
		5.5.3	Rozkład Poissona	
		5.5.4	Rozkład równomierny (jednostajny, prostokątny)
		5.5.5	Rozkład normalny
	5.6	Zadania do samodzielnego rozwiązania
6	Rozkłady z próby
	6.1	Rozkład średniej arytmetycznej
	6.2	Rozkład chi2
	6.3	Rozkład t-Studenta
	6.4	Rozkład F Fischera-Snedecora
	6.5	Zadania do samodzielnego rozwiązania
7	Estymacja nieznanych parametrów populacji
	7.1	Estymacja punktowa
	7.2	Estymacja przedziałowa
		7.2.1	Przedział ufności  dla  średniej populacji generalnej
		7.2.2	Przedział ufności dla różnicy dwóch średnich
		7.2.3	Przedział ufności dla wariancji i odchylenia standardowego
	7.3	Zagadnienia minimalnej liczebności próby
	7.4	Zadania do samodzielnego rozwiązania
8	Hipotezy statystyczne
	8.1	Hipotezy o średniej populacji generalnej
	8.2	Hipotezy o równości średnich dwóch populacji generalnych
	8.3	Hipotezy o równości dwóch wariancji
	8.4	Hipoteza o zgodności rozkładu empirycznego z rozkładem teoretycznym określonym przez hipotezę
	8.5	Hipotezy o zgodności rozkładów kilku populacji
	8.6	Zadania do samodzielnego rozwiązania
9	Analiza regresji
	9.1	Estymacja parametrów liniowej funkcji regresji
	9.2	Testy istotności dla współczynnika regresji
	9.3	Estymacja oraz testy istotności współczynnika korelacji
	9.4	Zadania do samodzielnego rozwiązania
10	Indeksy statystyczne
	10.1	Indeksy indywidualne
	10.2	Indeksy agregatowe
	10.3	Zadania do samodzielnego rozwiązania
Tablice statystyczne
	TABLICA 1.  Rozkład dwumianowy (Bernoulliego)
	TABLICA 2. Rozkład Poissona
	TABLICA 3.  Dystrybuanta rozkładu normalnego standaryzowanego
	TABLICA 4. Rozkład chi2
	TABLICA 5.  Rozkład t-Studenta
	TABLICA 6. Rozkład F Fishera-Snedecora
	TABLICA 7.  Wartości krytyczne współczynnika korelacji prostej i wielokrotnej
	TABLICA 8.  Rozkład Kołmogorowa – Smirnowa
	TABLICA 9.  Wartości krytyczne testu Dunnetta
	TABLICA 10.  Wartości krytyczne testu Duncana
	TABLICA 11.  Wartości krytyczne studentyzowanego rozstępu
Literatura

DYSTRYBUCJA

 

Wprowadzenie

  „Statystyka jest bardziej sposobem myślenia lub wnioskowania

niż pęczkiem recept na młócenie danych w celu odsłonięcia odpowiedzi”

C.R.Rao

 Spis treści

             W obecnej rzeczywistości statystyka traktowana jest jako nauka, a  jej metody znajdują coraz szersze zastosowanie w wielu dziedzinach wiedzy. Przechodzenie od niezbyt precyzyjnych i trudno sprawdzalnych opisów werbalnych do ujęć ilościowych obserwujemy w naukach nie tylko przyrodniczych, ale także humanistycznych i społecznych. Wykorzystywanie do analizy złożonych problemów otaczającej nas rzeczywistości metod ilościowych, a wśród nich metod ściśle statystycznych, jest doniosły usprawnieniem. Metody te zwielokrotniają bowiem siłę poznawczą rozpatrywanej dyscypliny naukowej, pozwalając na wygodne, ścisłe i jednoznaczne oddawanie myśli za pomocą liczb. Językiem statystyki nie porównywalnie dokładniej niż słowami opisać możemy różnorodne zjawiska masowe.

            Zawarte w niniejszej pracy deterministyczne (opis statystyczny) i stochastyczne (wnioskowanie statystyczne) metody analizy statystycznej dotyczą struktury, współzależności i dynamiki zjawisk masowych. Są one podawane od podstaw. W konstrukcji rozdziałów celowo pominięto wiele definicji, twierdzeń i ich dowodów, ograniczając się do komentarzy wprowadzających, bądź też do podawania wzorów w formie gotowych algorytmów służących rozwiązaniu danego problemu. Struktura każdego z omawianych rozdziałów jest stała i zawiera trzy podstawowe części. W pierwszej podawane jest krótkie wprowadzenie teoretyczne obejmujące podstawowe pojęcia, twierdzenia i wzory, które umożliwiają rozwiązywanie zadań bez pomocy dodatkowej literatury. W drugiej – przykładowe zadania wraz z rozwiązaniami, natomiast w trzeciej, zadania do samodzielnego rozwiązania wraz z odpowiedziami. We wszystkich przypadkach podano sposób wykorzystania najbardziej popularnego pakietu arkusza kalkulacyjnego Excel do rozwiązywania omawianych problemów.  Dlaczego Excel ? Kadra dydaktyczna i młodzież z mniejszych ośrodków i obszarów wiejskich i nie tylko, tak naprawdę nie ma dostępu do specjalistycznego oprogramowania statystycznego – bariera cenowa. Pakiet Excel w wersji Office Standard dla nauczycieli i studentów oraz Office Small Bussines OEM jest aktualnie, relatywnie najtańszą propozycją na rynku.

W konstrukcji rozdziałów każdorazowo szczególną uwagę zwrócono na formułowanie odpowiedzi na trzy podstawowe pytania, a mianowicie:

Zakres tematyczny i struktura podręcznika są tak skonstruowane by odpowiadały celowi „promocji niezbędnych europejskich wymiarów szkolnictwa wyższego, szczególnie pod względem rozwoju zawodowego, współpracy międzyinstytucjonalnej, programów dotyczących mobilności oraz zintegrowanych programów nauczania, szkolenia i badań, zawartemu we ”Wspólnej Deklaracji Europejskich Ministrów Edukacji,  zebranych w Bolonii,  w dniu 19 czerwca 1999”.

Wszystkie dane użyte w rozwiązywanych przykładach oraz podane w zadaniach do samodzielnego rozwiązywania są dostępne do pobrania z witryny www.parlinski.pl/dane.

W podręczniku zamieszczono tablice statystyczne oraz umieszczono obszerną bibliografię. Pozwoli ona na pogłębienie znajomości prezentowanych zagadnień oraz na rozszerzenie wiedzy w zakresie tematów pominiętych.

Oddając do rąk czytelników ten podręcznik, autorzy mają nadzieję, że przedstawiony w nim zakres przedmiotowy i sposób ujęcia rozpatrywanych zagadnień sprawi, iż książka ta będzie przydatna dla studentów kierunków ekonomiczno – społecznych takich jak: finanse i bankowość, ekonomia, zarządzanie i marketing, socjologia, administracja oraz szerokiemu gronu praktyków prowadzących analizy statystyczne.

 
Powrót

 

8.3   Hipotezy o równości dwóch wariancji

 

          Jak pamiętamy, zarówno przy wyznaczaniu przedziału ufności jak i weryfikowaniu hipotezy o równości średnich dwóch populacji generalnych, zakładaliśmy, że wariancje analizowanej cechy o rozkładzie normalnym w obu populacjach są jednakowe. W tym rozdziale zajmiemy się sprawdzaniem tego założenia.

      Niech s12 oraz s22 będą niezależnymi średnimi kwadratami z populacji o rozkładach normalnych . Jeżeli prawdziwa jest  hipoteza H0: s12= s22 to statystyka:

                                                                                                                                  (8.4)

gdzie:

ma rozkład F Fishera-Snedecora z liczbami stopni swobody u=n1-1 i v=n2-1, gdzie u jest liczbą stopni swobody dla wariancji w liczniku, a v liczbą stopni swobody dla wariancji w mianowniku.

 

         Procedura weryfikacji hipotezy o równości wariancji w populacjach generalnych przebiega następująco:

1.      wyznaczamy wartość empiryczną statystyki F Fishera-Snedecora (tak, aby była większa od jedności) wg wzoru (8.4);

2.      dla ustalonego poziomu istotności a odczytujemy z tablic (tablica 6) wartość krytyczną Fa,u,v , otrzymując w ten sposób obszar krytyczny dla hipotezy;

3.      wnioskowanie: jeżeli Fobl  > Fa,u,v   to H0: s12= s22 odrzucamy  na  poziomie istotności a; wariancje w badanych populacjach różnią się istotnie. Jeżeli warunek powyższy nie jest spełniony, to nie mamy podstaw do odrzucenia hipotezy zerowej; wyniki naszego eksperymentu nie przeczą  hipotezie,  że wariancje  w badanych populacjach są sobie równe.

 

Na rysunku obok przedstawiono wykres funkcji gęstości rozkładu F dla ustalonej pary liczb stopni swobody. Zaznaczony został obszar krytyczny oraz dopuszczalny dla hipotezy o równości dwóch wariancji przy poziomie istotności a.

Przykład 8.4

Sprawdzić na poziomie istotności a=0,05 hipotezę, że dwie gminy: A i B charakteryzuje podobne zróżnicowanie obszarowe gospodarstw. W celu weryfikacji tej hipotezy wybrano losowo w gminie A 12 gospodarstw, a w gminie B 9 gospodarstw.. Dla obu gmin wyznaczono wartości wariancji wielkości powierzchni jaka przypada na gospodarstwo i otrzymano następujące wielkości: gmina A – 7,9 ha2, gmina B - 19,8 ha2.

Rozwiązanie:

1) formułujemy hipotezę zerową: H0: s12 = s22, wobec hipotezy alternatywnej: H0: s12 s22

2) ze wzoru 8.4 wyznaczamy wartość empiryczną statystyki F Fishera-Snedecora. Do licznika wstawiamy wariancję większą (gmina B), a zatem:

 

3) z tablic rozkładu F Fishera-Snedecora (tablica 6) dla a=0,05 oraz dla stopni swobody: u= 9-1=8, v=12-1=11, odczytujemy F0,05,8,11=2,95

4) ponieważ F < F0,05,8,11 nie ma podstaw do odrzucenia hipotezy H0, zatem przyjmujemy, że w obu gminach zróżnicowanie obszarowe gospodarstw jest w przybliżeniu równe.

          Do testowania hipotez o równości wariancji dwóch populacji generalnych można także wykorzystywać arkusz kalkulacyjny Excel. Do tego celu służy zawarta w menu Narzędzia opcja Analiza danych z narzędziem: Test F: z dwiema próbami dla wariancji. Schemat testowania hipotez o równości wariancji dwóch populacji generalnych za pomocą arkusza kalkulacyjnego Excel podany jest na  rysunkach w przykładzie 8.5.

Przykład 8.5

W przykładzie 8.3 do weryfikacji hipotezy, że w okresie 8 ostatnich miesięcy w miejscowości M było tyle samo bezrobotnych kobiet co mężczyzn (hipotezy o równości średnich dwóch populacji generalnych), przyjęliśmy założenie o równości wariancji tych populacji. Korzystając z danych przykładu 7.3 sprawdzić, czy przyjęte założenie o równości wariancji było słuszne.

Rozwiązanie przykładu:

Formułujemy hipotezę zerową: H0:s12=s22, wobec hipotezy alternatywnej: H0:s12s22

 

 

 

 

Ponieważ Fobl=1,02 < F0,05,7,7=3,78, tym samym nie mamy podstaw do odrzucenia hipotezy H0:s12=s22. Oznacza to jednocześnie, że przyjęte w przykładzie 8.3 założenie o równości wariancji, wymagane do testowania hipotezy o równości średnich generalnych było słuszne.

 

   
 
Powrót

 

DYSTRYBUCJA

ul. Nowoursynowska 166, 02-787 WARSZAWA
tel. (22) 593 55 20, (22) 593 55 27; fax (22) 593 55 21
e-mail: wydawnictwo@sggw.pl

Powrót