rpis6, UCZELNIA, Materiałoznawstwo itp, STUDIA PRACE ŚCIĄGI SKRYPTY
[ Pobierz całość w formacie PDF ]
Laboratorium RPiS Testowanie hipotez parametrycznych 1 Poj¦cia wst¦pne Hipotez¡ statystyczn¡ nazywamy ka»de przypuszczenie dotycz¡ce nieznanych warto±ci parametrów rozkªadu bad¹ nieznanego typu rozkªadu. Ka»da hipoteza wymaga sprawdzenia, które nazywamy werykacj¡, a metody sªu»¡ce do sprawdzenia hipotezy nosz¡ nazw¦ testów statystycznych. Hipoteza statystyczna dotycz¡ca jedynie nieznanych parametrów rozkªadu nazywana jest hipotez¡ para- metryczn¡, a test sªu»¡cy do zwerykowania hipotezy parametrycznej nosi nazw¦ testu parametrycznego. Hipoteza statystyczna dotycz¡ca postaci funkcyjnej rozkªadu zmiennej losowej, bez orzekania o warto- ±ciach parametrów tego rozkªadu, nosi nazw¦ hipotezy nieparametrycznej, a test sªu»¡cy do werykacji hipo- tezy nieparametrycznej nosi nazw¦ testu nieparametrycznego b¡d¹ testu zgodno±ci. Je»eli werykuje si¦ tylko jedn¡ hipotez¦ (b¦dziemy j¡ nazywa¢ hipotez¡ zerow¡ i oznacza¢ H 0 ), przy czym nie stawia si¦ jednocze±nie innych hipotez, to taki test nazywa si¦ testem istotno±ci. Je»eli hipoteza werykowana wyznacza caªkowicie nieznany rozkªad, to nazywamy j¡ hipotez¡ prost¡. Hipotez¦, która nie wyznacza caªkowicie rozkªadu (np. nie precyzuje warto±ci wszystkich nieznanych para- metrów) nazywamy hipotez¡ zªo»on¡. Zauwa»my, »e badaj¡c caª¡ populacj¦, mo»emy z caª¡ pewno±ci¡ stwierdzi¢, czy hipoteza H 0 jest praw- dziwa czy faªszywa. Maj¡c jednak tylko wyniki badania próby musimy si¦ liczy¢ z ryzykiem popeªnienia bª¦du polegaj¡cego na odrzuceniu badanej hipotezy mimo, »e jest ona prawdziwa. Ustalone krytyczne praw- dopodobie«stwo (mo»e by¢ ró»ne w ró»nych zagadnieniach) odrzucenia werykowanej hipotezy H 0 , gdy jest ona prawdziwa, nazywamy poziomem istotno±ci i oznaczamy zwykle przez . Umownie przyjmuje si¦ zwy- kle jeden z nast¦puj¡cych poziomów istotno±ci: 0:001, 0:01, 0:02, 0:05, chocia» mo»na te» przyjmowa¢ inne warto±ci uzasadnione technicznie lub ekonomicznie. 2 Ogólne zasady werykacji hipotez parametrycznych Oznaczmy hipotez¦ zerow¡ H 0 mówi¡c¡, »e warto±¢ nieznanego parametru q rozkªadu cech X, zbiorowo±ci generalnej wynosi q 0 przez H 0 (q = q 0 . Przypu±¢my, »e oprócz sprawdzanej warto±ci q 0 nieznanego parametru q mog¡ by¢ prawdziwe inne jego warto±ci q 1 , q 2 ,. Wówczas hipotezy H 0 (q = q 0 ), H 1 (q = q 1 ), H 2 (q = q 2 , cdots nazywamy hipotezami dopuszczalnymi. W odró»«ieniu od hipotezy zerowej H 0 (q = q 0 ) ka»d¡ z pozo- staªych hipotez dopuszczalnych nazywamy hipotez¡ alternatywn¡. Hipotez¦ zerow¡ H 0 (q = q 0 ) sprawdzamy na podstawie Nelementowej próby (x 1 ; x 2 ;; x N ), b¦d¡cej realizacj¡ Nwymiarowej zmiennej losowej (X 1 ; X 2 ;; X N ). Tworzymy pewn¡ statystyk¦ zwan¡ statystyk¡ testow¡ Q = f(X 1 ; X 2 ;; X N ); (1) stanowi¡c¡ estymator nieznanego parametru q, przy czym warto±¢ tego estymatora otrzymana z próby (x 1 ; x 2 ;; x N ) wynosi q. Statystyka ta przeksztaªca wielowymiarow¡ przestrze« próby w jednowymiarow¡ przestrze« statystyki . Przestrze« statystyki mo»na podzieli¢ na dwa dopeªniaj¡ce si¦ obszary 0 i 1 , przy czym obszar 0 jest zbiorem warto±ci q bliskich warto±ci q 0 , natomiast 1 jest obszarem warto±ci q odlegªych od warto±ci q 0 i nazywany jest obszarem krytycznym. Mo»na okre±li¢ obszar krytyczny 1 odpowiadaj¡cy poziomowi istotno±ci poprzez »¡danie, aby zachodziªa równo±¢ P ( Q2 1 jH 0 ) = ; (2) tzn. »¡damy, aby pradopodobie«stwo znajdowania si¦ estymatora Q wewn¡trz obszaru 1 pod warunkiem, »e hipoteza H 0 jest prawdziwa, byªo równe . Przypu±¢my, »e zaobserwowana warto±¢ estymatora Q nale»y do zbioru krytycznego 1 wtedy hipo- tez¦ zerow¡ H 0 odrzucamy i przyjmujemy alternatywn¡ hipotez¦ H 1 . W przypadku odrzucenia hipotezy H 0 popeªniamy bª¡d, je»eli jest ona prawdziwa. Bª¡d ten nazywa si¦ bª¦dem pierwszego rodzaju, a jego prawdopodobie«stwo wynosi i jest oczywi±cie równe = P ( Q2 1 jH 0 ): (3) 1 Laboratorium RPiS Testowanie hipotez parametrycznych Istnieje równie» mo»liwo±¢ bª¦dnej decyzji w drugim kierunku, tzn. mo»emy przyj¡¢ hipotez¦ H 0 , gdy ta nie jest prawdziwa, tj. gdy prawdziwa jest hipoteza H 1 . Taki bª¡d nazywamy bª¦dem drugiego rodzaju. Prawdopodobie«stwo wyst¦powania tego bª¦du oznaczymy przez , przy czym = P ( Q =2 1 jH 1 ) = P ( Q2 0 jH 1 ): (4) Bª¡d drugiego rodzaju zale»y oczywi±cie od konkretnej hipotezy alternatywnej H 1 . Zauwa»my, »e w przypadku, je»eli q 0 i q 1 nie s¡ jedynymi dopuszczalnymi warto±ciami nieznanego pa- ramteru, to istnieje problem znalezienia prawdopodobie«stwa odrzucenia hipotezy H 0 na korzy±¢ hipotezy alternatynej H w zale»no±ci od parametru q, który mo»e mie¢ warto±¢ ró»n¡ od q 0 jak i od q 1 . Prawdopo- dobie«stwo takie nazywamy moc¡ testu i b¦dzie oznaczane jako M( 1 ; H) M( 1 ; H) = P ( Q2 1 jH): (5) Prawdopodobie«stwo to jest funkcj¡ obszaru krytycznego 1 i parametru hipotezy alternatywnej. Bior¡c pod uwag¦ okre±lenie wielko±ci i otrzymuje si¦ w szczególno±ci M( 1 ; H 0 ) = ; M( 1 ; H 1 ) = 1: (6) Mo»na te» okre±li¢ funkcj¦ b¦d¡c¡ w ±cisªym zwi¡zku z moc¡ testu, tj. funkcj¦ operacyjnocharakterystyczn¡ zwan¡ te» funkcj¡ OC lub charakterystyk¡ testu L( 1 ; H) = 1M( 0 ; H): (7) Funkcja ta okre±la prawdopodobie«stwo odwrotne, czyli prawdopodobie«stwo akceptacji (zwrot akceptacja nale»y rozumie¢ jako brak podstaw do odrzucenia ) hipotezy zerowej. W szczególno±ci zachodz¡ zwi¡zki L( 1 ; H 0 ) = 1; L( 1 ; H 1 ) = : (8) Idealny byªby test, dla którego funkcja OC speªniaªaby nast¦puj¡ce zwi¡zki L( 1 ; H 0 ) = 1; L( 1 ; H) = 0 gdy H 6= H 0 : (9) 3 Testy parametryczne oparte na zaªo»eniu normalno±ci W zastosowaniach technicznych wa»n¡ rol¦ odgrywaj¡ zminne losowe o rozkªadzie normalnym. Z tego te» powodu cz¦sto stosuje si¦ testy parametryczne, oparte na zaªo»eniu rozkªadu normalnego. Najcz¦±ciej testuje si¦ nast¦puj¡ce hipotezy: 1. m przyjmuje pewn¡ warto±¢, jest znane, 2. m przyjmuje pewn¡ warto±¢, nie jest znane ale staªe, 3. w dwu populacjach m 1 = m 2 , 1 i 2 s¡ znane, 4. w dwu populacjach m 1 = m 2 , 1 i 2 s¡ staªe i równe, ale nieznane, 5. w dwu populacjach m 1 = m 2 , 1 i 2 s¡ staªe ale nieznane, 6. test równo±ci wariancji. W wielu przypadkach wymagane jest dalsze rozbicie klasykacji, zale»nie od przyj¦tego obszaru krytycznego 1 , w szczególno±ci, od tego, czy obszar krytyczny jest jednym przedziaªem (test jednostronny), czy te» skªada si¦ z dwóch przedziaªów (test dwustronny). Ponadto prócz wy»ej wymienionych testów klasycznych istniej¡ obszerne grupy testów specjalnych. Poni»ej przedstawione zostan¡ niektóre testy klasyczne. 2 Laboratorium RPiS Testowanie hipotez parametrycznych 3.1 Hipoteza o ±redniej, nieznane Przyjmijmy, »e cecha X populacji generalnej ma rozkªad normalny o g¦sto±ci N(m; ), przy czym nieznana jest warto±¢ . Zwerykujmy hipotez¦ H 0 (m = m 0 ) wobec hipotezy alternatywnej H 1 (m = m 1 ). Z takim problemem mamy do czynienia w przypadku, gdy jedynym ¹ródªem informacji jest próbka. Hipotez¦ H 0 mo»na zwerykowa¢ za pomoc¡ statystyki t-Studenta na poziomie istotno±ci . Statystyka xm 0 S p t = N1; (10) gdzie 1 N X 1 N X N x) 2 ; x = x k ; S 2 = (x k k=1 k=1 jak wiadomo ma rozkªad t-Studenta o N1 stopniach swobody. Wyznaczamy z próby warto±¢ tej statystyki (10) (jej realizacj¦) i je»eli warto±¢ ta speªnia relacj¦jtj> t , gdzie t czyni zado±¢ równo±ci P (t < t < t ) = 1; (11) to odrzucamy hipotez¦ H 0 i przyjmujemy hipotez¦ H 1 . Zbiór krytyczny skªada si¦ z tych punktów przestrzeni prób, dla których t obliczone z zale»no±ci (10) speªnia relacj¦jtj> t . 3.1.1 Test istotno±ci Podany zostanie teraz tok post¦powania w przypadku parametrycznych testów istotno±ci. Testem istotno±ci jak wiadomo, nazywamy taki test, w którym werykuje si¦ tylko jedn¡ hipotez¦ H 0 (q = q 0 ), przy czym nie stawia si¦ jednocze±nie innych hipotez. Z badanej populacji losujemy N-elementow¡ próbe charakteryzowan¡ N-wymiarow¡ zmienn¡ losow¡ (X 1 ; X 2 ;; X N ). Tworzy statystyk¦ testow¡ Q = f(X 1 ; X 2 ;; X N ); (12) stanowi¡c¡ estymator nieznanego parametru q. Okre±lamy rozkªad prawdopodobie«stwa statystyki Q i wy- znaczamy dla zadanego poziomu istotno±ci obszar krytyczny 1 z warunku P ( Q2 1 jH 0 ) = P (jQq 0 j> K) = : (13) j > K) = p. Je±li p, to hipotez¦ H 0 odrzucamy, natomiast je±li p > , to nie ma podstaw do odrzucenia hipotezy H 0 . Je±li prawdopodobie«stwo zaobserwowanego zdarzenia jest wi¦ksze od , to mo»na jedynie twierdzi¢, »e przeprowadzone do±wiadczenie nie przeczy hipotezie H 0 . W przypadku, gdy nie ma podstaw do odrzucenia hipotezy H 0 , mo»na zrobi¢ jeden z trzech mo»liwych kroków: 1. odrzuci¢ od razu hipotez¦ na wy»szym poziomie istotno±ci, 2. pobra¢ wi¦ksz¡ próbk¦ i ponowi¢ obliczenia, 3. przyj¡¢ hipotez¦ H 0 , ale na wªasn¡ odpowiedzialno±¢ :-). Rozwa»my przypadek, gdzie jedynym ¹ródªem informacji jest próbka. Z zagadnieniem tym mo»na si¦ spotka¢ w pracy eksperymentalnej, w szczególno±ci, gdy eksperyment wykonuje si¦ jeden raz. Warto±¢ statystyki t- Studenta oblicza si¦ ze wzoru (10). Z tablic rozkªadu t-Studenta wyznaczamy dla N1 stopni swobody warto±¢ t tak¡, »e P (jtj< t ) = 1: (14) Je±li t <t albo t > t to odrzucamy hipotez¦ H 0 (m = m 0 na poziomie istotno±ci . Je±lit < t < t , to nie ma podstaw do odrzucenia hipotezy H 0 na poziomie istotno±ci . Test istotno±ci mo»na zastosowa¢ do ogólniejszego przypadku werykowania hipotezy o równo±ci dwóch ±rednich, przy nieznanych ale jednakowych odchyleniach ±rednich. Przyjmijmy, »e mamy dwie próby o liczeb- no±ciach N 1 i N 2 z dwóch populacji. Oznaczmy przez X 1 cech¦ X w pierwszej populacji i zaªó»my, »e ma ona 3 N Mo»na równie» post¡pi¢ odwrotnie. Dla otrzymanej oceny q z próby obliczy¢ prawdopodobie«stwo P (jQ q 0 Laboratorium RPiS Testowanie hipotez parametrycznych rozkªad normalny o g¦sto±ci N(m 1 ; 1 ). Cech¦ X populacji drugiej oznaczymy przez X 2 i równie» zaªo»ymy, »e ma rozkªad normalny o g¦sto±ci N(m 2 ; 2 ). Zaªó»my równie», »e odchylenie ±rednie w obu populacjach jest jednakowe, 1 = 2 , ale nieznane. Zwerykujemy hipotez¦ H 0 (m 1 = m 2 ) na poziomie . Tworzymy statystyk¦ s T = p x 1 x 2 N 1 N 2 (N 1 + N 2 2) N 1 + N 2 ; (15) N 1 S 1 + N 2 S 2 maj¡c¡ rozkªad t-Studenta o k = N 1 + N 2 2 stopniach swobody. x 1 , x 2 s¡ ±rednimi w odpowiednich próbkach o liczno±ciach N 1 oraz N 2 , a S 1 , S 2 s¡ estymatorami obci¡»onymi wariancji 1 i 2 , odpowiednio. Obliczamy warto±¢ statystyki T na podstawie (15). Dla poziomu istotno±ci odczytuje si¦ z tablic rozkªadu t-Studenta warto±¢ krytyczn¡ t statystyki T dla k = N 1 + N 2 2 stopni swobody. Dalszy ci¡g post¦powania jest taki sam jak poprzednio. 3.2 Werykacja hipotezy o wariancji 2 Dla werykacji hipotezy o wariancji 2 wykorzystujemy rozkªad 2 . Z badanej populacji losujemy prób¦ o liczno±ci N: (x 1 ; x 2 ;; x N ). Je»eli hipoteza H 0 ( = 0 ) jest prawdziwa, to statystyka P N i=1 (x i x) 2 2 N1 = (16) 0 ma rozkªad 2 o (N1) stopniach swobody. W zale»no±ci od postaci hipotezy alternatywnej budujemy nast¦puj¡ce obszary krytyczne testu: a) gdy hipoteza alternatywna przyjmuje posta¢ H 1 : > 0 obszarem krytycznym jest zbiór takich warto±ci 2 N1 , które speªniaj¡ zale»no±¢ 2 N1 > kryt ; (17) gdzie kryt odczytane jest z tablicy rozkªadu 2 dla poziomu istotno±ci i (N1) stopni swobody, b) w przypadku hipotezy alternatywnej H 1 : 6= 0 obszar krytyczny skªada si¦ z takich warto±ci statystyki P N k=1 (x k x) 2 , które speªniaj¡ warunek X (x i x) 2 > 0 kryt ; (18) i=1 lub X (x i x) 2 < 0 0 kryt ; (19) i=1 gdzie kryt odczytywane jest z tablic rozkªadu 2 dla 1 2 oraz (N1) stopni swobody, za± 0 kryt dla 1 3.3 Porównanie wariancji (test F -Snedecora) Zagadnienie porównania wariancji populacji o jednakowych warto±ciach ±rednich jest cz¦sto spotykanym pro- blemem w zastosowaniach technicznych. Przykªadem mo»e by¢ pomiar jednej i tej samej wielko±ci dwoma ró»nymi przyrz¡dami pomiarowymi, pozbawionymi bª¦dów systematycznych. Chcemy sprawdzi¢ np. czy do- kªadno±¢ pomiaru jest taka sama dla obu przyrz¡dów. W celu werykacji hipotezy H 0 ( 1 = 2 ) wyra»aj¡cej równo±¢ wariancji dwu populacji zaªo»ymy, »e rozwa»ane populacje podlegaj¡ rozkªadowi normalnemu. Po- bieramy próbki o liczno±ciach odpowiednio N 1 i N 2 . Tworzymy statystyk¦ F = S 2 1 S 2 2 ; (20) 4 N N 2 oraz (N1) stopni swobody. Laboratorium RPiS Testowanie hipotez parametrycznych maj¡c¡ rozkªad F -Snedecora o parze (N 1 1; N 2 1) stopni swobody, przy czym S 2 i s¡ estymatorami nieobci¡»onymi wariancji i z próbki N i -elementowej (i = 1; 2). Wyznaczamy warto±¢ tej statystyki, bior¡c w liczniku warto±¢ S 2 1 wi¦ksz¡ od warto±ci S 2 2 w mianowniku. Dobieramy obszar krytyczny 1 dla testu, poprzez dobór warto±ci f . Dla ró»nych i ró»nych par (N 1 1) warto±ci f s¡ podane w tablicach. Po obliczeniu warto±ci F odczytujemy z tablicy rozkªadu F -Snedecora dla przyj¦tego poziomu istotno±ci warto±¢ krytyczn¡ f , aby byªa speªniona relacja 1; N 2 P (Ff ) = : (21) Mo»na zauwa»y¢, »e nierówno±¢ Ff okre±la obszar krytyczny testu. Je»eli F < f , to nie ma podstaw do odrzucenia hipotezy H 0 , a je»eli Ff , to hipotez¦ odrzucamy. Je»eli w wyniku zastosowania testu istotno±ci F dla dwu prób o rozkªadzie normalnym N(m 1 ; 1 ) N(m 2 ; 2 ) odpowiednio, stwierdza si¦ istotn¡ ró»nic¦ pomi¦dzy dwiema wariancjami, nie mo»na korzysta¢ z warto±ci statystyki podanej poprzednio. Stosuje si¦ wówczas dla zwerykowania hipotezy H 0 (m 1 = m 2 ) (N 1 = N 2 = N) test t-Studenta istotno±ci oparty na nast¦puj¡cym wzorze t = q x 1 x 2 : (22) NS 1 +NS 2 N(N1) 6= 2 , to dla zwerykowania hipotezy zerowej H 0 (m 1 = m 2 ) korzysta si¦ z przybli»onego testu Cochrana-Coxa obliczaj¡c warto±¢ statystyki x 1 x 2 C = p ; (23) Z 1 + Z 2 gdzie N 1 S 1 N 1 (N 1 N 2 S 2 N 2 (N 2 Z 1 = 1) ; Z 2 = 1) : Warto±¢ krytyczn¡ c oblicza si¦ ze wzoru c = Z 1 t 1 + Z 2 t 2 Z 1 + Z 2 ; (24) gdzie t i s¡ warto±ciami krytycznymi odczytanymi z tablic rozkªadu t-Studenta dla (N i 1) stopni swobody (i = 1; 2). Przykªad 1. Dla zbioru danych X =fx i gzwerykowa¢ hipotez¦ H 0 : m = 0, wobec hipotezy alternatywnej H 1 : m 6= 0. i x i 1 1; 55508 2 0; 342242 3 1; 0849 4 0; 362719 5 1; 42819 6 1; 11659 7 0; 258791 8 1; 05238 9 0; 180204 10 1; 80046 11 1; 09857 12 0; 216113 5 Warto±¢ krytyczn¡ t odczytuje si¦ z tablic rozkªadu t-Studenta dla (N1) stopni swobody. W przypadku, gdy mamy do czynienia z ró»nolicznymi próbami (N 1 6= N 2 ), pochodz¡cymi z dwu po- pulacji o rozkªadzie normalnym N(m 1 ; 1 ), N(m 2 ; 2 ) odpowiednio o ró»nych wariancjach 1 [ Pobierz całość w formacie PDF ] |