SAN, ZUT-Energetyka-inżynier, III Semestr, Statystyka matematyczna, Laboratoria, 6, Sprawozdanie
[ Pobierz całość w formacie PDF ]
© Katedra Dendrometrii, Wydział Leśny AR w Krakowie Lucylla Rutkowska tel.: +12 6625014 Jarosław Socha tel.: +12 6625011 Lucylla Rutkowska Jarosław Socha Statystyczna analiza danych z wykorzystaniem programu STATISTICA™ Rok akademicki 2005/2006 Kraków 2005 ©Lucylla Rutkowska, Jarosław Socha – Katedra Dendrometrii, Wydział Leśny AR w Krakowie SPIS TREŚCI IMPORT DANYCH Z EXCELA DO PROGRAMU STATISTICA ............................................2 Z APISANIE DANYCH W SKOROSZYCIE E XCELA ..................................................................................2 I MPORT DANYCH ...............................................................................................................................2 E DYCJA DANYCH . Z ARZĄDZANIE DANYMI . .......................................................................................3 D ODAWANIE NOWEJ ZMIENNEJ ..........................................................................................................3 S PECYFIKACJA ZMIENNYCH ...............................................................................................................4 K OD BRAKU DANYCH ( B . D .) ..............................................................................................................4 S ELEKCJA PRZYPADKÓW DO ANALIZY STATYSTYCZNEJ LUB WYKRESÓW ..........................................4 S KOROSZYT Z WYNIKAMI ..................................................................................................................5 OBLICZANIE PODSTAWOWYCH CHARAKTERYSTYK STATYSTYCZNYCH ...............6 ANALIZA STATYSTYCZNA – WYBRANE METODY ..............................................................7 B ADANIE NORMALNOŚCI ROZKŁADU ZMIENNEJ ( TEST S HAPIRO -W ILKA ) ..........................................7 T ESTOWANIE RÓŻNIC POMIĘDZY ŚREDNIMI Z DWÓCH PRÓB NIEZALEŻNYCH ( TEST T S TUDENTA DLA ZMIENNYCH NIEZALEŻNYCH ) ............................................................................................................8 T ESTOWANIE RÓŻNIC POMIĘDZY ŚREDNIMI Z DWÓCH PRÓB NIEZALEŻNYCH ( NIEPARAMETRYCZNY TEST U M ANNA -W HITNEYA ).............................................................................................................9 T ESTOWANIE RÓŻNIC POMIĘDZY ŚREDNIMI Z DWÓCH PRÓB ZALEŻNYCH ( TEST T S TUDENTA DLA PRÓB ZALEŻNYCH ) ..........................................................................................................................11 T ESTOWANIE ISTOTNOŚCI RÓŻNIC MIĘDZY PARAMI WYNIKÓW ( TEST ZNAKÓW , TEST KOLEJNOŚCI PAR W ILCOXONA ) ...........................................................................................................................12 T ESTOWANIE ISTOTNOŚCI RÓŻNIC MIĘDZY FRAKCJAMI ( TEST Χ 2 DLA TABEL DWUDZIELCZYCH ) .....13 T ESTOWANIE RÓŻNIC POMIĘDZY ŚREDNIMI Z KILKU PRÓB NIEZALEŻNYCH ( JEDNOCZYNNIKOWA ANALIZA WARIANCJI , TESTY WIELOKROTNYCH PORÓWNAŃ ) ...........................................................16 Moduł Statystyki podstawowe\ prosta ANOVA ........................................................................16 Moduł ANOVA............................................................................................................................20 T ESTOWANIE RÓŻNIC POMIĘDZY ŚREDNIMI Z KILKU PRÓB NIEZALEŻNYCH ( TEST K RUSKALA - W ALLISA )........................................................................................................................................23 K ORELACJA .....................................................................................................................................25 Współczynnik korelacji Pearsona ..............................................................................................25 Współczynnik korelacji rang Spearmana ...................................................................................26 Współczynniki korelacji pomiędzy zmiennymi nominalnymi .....................................................27 R EGRESJA LINIOWA .........................................................................................................................28 Analiza rozkładu reszt regresyjnych ..........................................................................................30 R EGRESJA WIELOKROTNA ...............................................................................................................31 Analiza rozkładu reszt regresyjnych ..........................................................................................35 R EGRESJA NIELINIOWA ....................................................................................................................37 Statystyczna analiza danych w leśnictwie z wykorzystaniem programu STATISTICA™ – elektyw 2005/2006 1 ©Lucylla Rutkowska, Jarosław Socha – Katedra Dendrometrii, Wydział Leśny AR w Krakowie Import danych z Excela do programu Statistica Zapisanie danych w skoroszycie Excela Zanim przystąpisz do importowania danych z arkusza kalkulacyjnego pamiętaj, aby je w odpowiedniej formie zapisać: - Na każdy obiekt (przypadek - w nomenklaturze Statistica) przeznacz jeden wiersz - Na wartości poszczególnych cech (zmiennych) przeznacz osobne kolumny - Jeżeli chcesz uniknąć żmudnego wpisywania nazw zmiennych (cech) w edytorze Statistica, wpisz je w arkuszu Excelu, bezpośrednio nad wartościami Import danych Uruchom program Statistica a następnie: 1. Wybierz polecenie Otwórz (np. z menu głównego, z opcji Plik ) 2. Znajdź plik Excelu z danymi do importu. 3. W oknie dialogowym kliknij odpowiedni przycisk: 4. Jeżeli importujesz dane tylko z jednego arkusza, wskaż jego nazwę: 5. Jeżeli umieściłeś nazwy zmiennych (cech) w pierwszym wierszu arkusza z danymi zaznacz teraz odpowiednią opcję: W powyższym oknie możesz też odpowiednio do swoich potrzeb ustawić inne opcje. Np. jeżeli chcesz rozpocząć wczytywanie danych od 18 wiersza, ustaw jego numer w odpowiednim polu (Statistica domyśli się, że w wierszu 18. umieściłeś nazwy zmiennych, a dopiero w 19. konkretne dane). Możesz pozostawić formaty komórek, itp. Statystyczna analiza danych w leśnictwie z wykorzystaniem programu STATISTICA™ – elektyw 2005/2006 2 ©Lucylla Rutkowska, Jarosław Socha – Katedra Dendrometrii, Wydział Leśny AR w Krakowie Dane powinny zostać wczytane: Możesz je teraz zapisać w formacie wymaganym przez program Statistica ( Plik/Zapisz ). Edycja danych. Zarządzanie danymi. ¾ Większość operacji, które wykonuje się na arkuszu z danymi zgromadzone jest w opcjach Dane i Edycja w menu górnym. Można również wyświetlić pasek narzędzi o nazwie Arkusz przyspieszający wykonanie niektórych czynności. ¾ Arkusz z danymi w Statistice wygląda podobnie jak w Excelu. Zauważ jednak, że kolumny noszą nazwy poszczególnych cech (zmiennych). ¾ Edycja komórek z danymi i ich formatowanie przypomina podobne czynności w Excelu. Pamiętaj jednak, że masz tutaj do czynienia nie z kolumnami, ale ze zmiennymi i nie z wierszami, ale z przypadkami . ¾ Oprócz nazw zmiennych Statistica nadała im też kolejne numery. Ułatwi to późniejsze odwoływanie się do nich. W opcji Widok menu głównego możesz odpowiednio do potrzeb ustawić ich wyświetlanie lub nie. ¾ Statistica wczytała wartości zmiennych nominalnych (BON, Klasa) w takiej postaci, jak zapisałeś to w Excelu, jednak przy wczytywaniu nadała im odpowiednie kody liczbowe: 101, 102, itd…. Możesz je wyświetlić klikając odpowiedni przycisk na pasku narzędzi Arkusz : Dodawanie nowej zmiennej Do danych przykładowych dodamy dodatkową zmienną G=πD 2 /40000 1. Z menu górnego wybierz Wstaw/Dodaj zmienne 2. W oknie dialogowym wypełnij pola: Ile zmiennych, Wstaw po, Nazwa, Długa nazwa (etykieta albo formuła z Funkcją) podobnie jak na poniższym rysunku. Przy wpisywaniu formuły postępujesz podobnie jak w Excelu (rozpoczynasz od znaku „=”, funkcje możesz wklejać wybierając je przyciskiem Funkcja ): Statystyczna analiza danych w leśnictwie z wykorzystaniem programu STATISTICA™ – elektyw 2005/2006 3 ©Lucylla Rutkowska, Jarosław Socha – Katedra Dendrometrii, Wydział Leśny AR w Krakowie 3. Klikasz przycisk OK. i gotowe! 4. Gdyby wartości zmiennej nie zostały policzone to: − zaznaczasz zmienną − naciskasz klawisz funkcyjny F9 lub opcję Przelicz z menu Dane . Specyfikacja zmiennych Wyświetlasz okno specyfikacji zmiennych (lub jednej zmiennej) w przypadku, gdy chcesz zmienić np. nazwę zmiennej, formułę wg której była obliczana itp. Okno specyfikacji wyświetlasz następująco: - z menu górnego wybierasz Dane/Specyfikacja zmiennej lub Dane/Spec.wszystkich zmiennych Kod braku danych (b.d.) Zdarza się, że nie dysponujemy wszystkimi pomiarami cech na obiektach w próbie. Np. nie można było pomierzyć (lub nie było takiej potrzeby) wysokości wszystkich drzew na powierzchni badawczej. W Excelu zostawiamy wówczas komórkę pustą i kontrolujemy, czy przy obliczaniu, np. wartości średniej nie jest ona interpretowana jako 0. W pakiecie Statistica sprawa jest prosta: program domyślnie interpretuje taką komórkę jako brak danych kodując ją jako liczbę -9999 i nie bierze pod uwagę przy obliczeniach. Uwaga! Nie zmieniaj tego ustawienia zanim dobrze nie poznasz programu. Unikniesz wielu przykrych niespodzianek! Selekcja przypadków do analizy statystycznej lub wykresów Często występuje konieczność wyboru tylko niektórych obiektów do dalszej analizy. Zadanie: Do obliczeń potrzebne będą nam tylko pomiary wykonane na drzewach rosnących na powierzchniach o numerach (NP) niemniejszych niż 6 i bez pęknięć czołowych (p). Wybierz je. Wykonanie: - Wybieramy w menu górnym opcję Narzędzia/Warunki selekcji/Edycja (lub naciskamy klawisz funkcyjny F8 lub klikamy przycisk Select cases dostępny w wielu oknach programu) - W oknie, które się pojawi zaznaczamy opcje Włącz przypadki i Określone przez - W polu Wyrażenie wpisujemy warunki włączenia danych (obiektów) do obliczeń: Statystyczna analiza danych w leśnictwie z wykorzystaniem programu STATISTICA™ – elektyw 2005/2006 4 [ Pobierz całość w formacie PDF ] |