Recepta na nienormalność rozkładu i współzależność obserwacji z wykorzystaniem testów randomizacyjnych i testu Mantela – na przykładzie rozmieszczenia zasobów ludzkich w regionach Francji
DOI:
https://doi.org/10.24917/20801653.302.12Słowa kluczowe:
Francja, kapitał ludzki, metody statystyczne, randomizacja, R-pakiet, test MantelaAbstrakt
Wykorzystując metody statystyczne w badaniach geograficznych, badacze często spotykają się z problemem niespełnienia przez posiadane dane założeń wymaganych przez liczne testy statystyczne. Dla przykładu wiele tzw. parametrycznych testów statystycznych opartych jest na założeniu normalności rozkładu danych. W praktyce jednak taka supozycja często nie jest zrealizowana, a rażące odchylenie rozkładu danych od rozkładu normalnego (np. rozkład J-kształtny) może prowadzić do wręcz absurdalnych wartości przedziałów ufności (np. przedział ufności dla średniej). Innym często spotykanym problemem z danymi pochodzącymi z badań geograficznych jest przestrzenna współzależność obserwacji. Wzajemne skorelowanie danych może przykładowo odzwierciedlać odległości między miejscami, gdzie te dane pozyskano. Dlatego wyniki pomiarów pochodzące z miejsc położonych w bliskiej odległości mogą być do siebie bardziej podobne niż obserwacje pochodzące z miejsc od siebie oddalonych. W takiej sytuacji oszacowanie wartości p-value dla testów badających zależności między zmiennymi (np. korelacja Pearsona) mogą być bardzo mylące, gdyż klasyczne metody statystyczne zakładają niezależność zmiennych. W powyższych sytuacjach badacz może wykorzystać tzw. testy randomizacyjne, które pozwalają obejść założenia normalności rozkładu czy niezależności obserwacji. Metody te, wraz z możliwością wykonywania złożonych obliczeń przy wykorzystaniu narzędzi informatycznych, stają się obecnie coraz bardziej popularne wśród badaczy. W artykule wyjaśniona została logika testów randomizacyjnych i dwa przykłady ich zastosowania: szacowanie przedziału dla średniej i obliczanie korelacji Mantela wraz z testowaniem jej istotności. W rezultacie przeprowadzonych obliczeń wykazano, że w obydwu przypadkach pominięcie założeń statystycznych prowadzi do otrzymania błędnych wyników. W tekście w celach zobrazowania powyższych metod statystycznych wykorzystano dane obrazujące wielkość i udział zasobów ludzkich dla nauki i techniki (HRST) w regionach Francji oraz tempo zmian tych wartości w czasie i przestrzeni. Obliczenia oparto na darmowym pakiecie statystycznym R oraz arkuszu kalkulacyjnym Excel.Downloads
Metrics
Bibliografia
Bruin, J. (2006) (2015, 11 stycznia). Newtest: command to compute new test, UCLA: Statistical Consulting Group. Pozyskano z: http://www.ats.ucla.edu/stat/stata/ado/analysis/
Czapliński, P. (2008). Problematyka badawcza przemysłu w geografii na tle nauk ekonomicznych, Prace Komisji Geografii Przemysłu Polskiego Towarzystwa Geograficznego, 11, 46–52.
Davison, A.C., Hinkley, D.V. (2008). Bootstrap Methods and their Application. Cambridge Series in Statistical and Probabilistic Mathematics. Cambridge: University Press.
Dorocki, S., Borowiec, M. (2011). Rola kapitału ludzkiego w procesie kształtowania innowacyjności układów regionalnych Francji. W: B. Namyślak (red.). Przekształcenia regionalnych struktur funkcjonalno-przestrzennych. Wrocław: Instytut Geografii i Rozwoju Regionalnego. Uniwersytet Wrocławski, 215–230.
Dziewoński, K. (1965). Zagadnienia integracji analizy kartograficznej i statystycznej w badaniach geograficznych. Przegląd Geograficzny, 37(4), 585–597.
Fortin, M., Gurevitch, J. (2001). Mantel Tests: Spatial Structure in Field Experiments. W: S.M. Scheiner, J. Gurevitch (red.). Design and Analysis of Ecological Experiments. Nowy Jork: Chapman & Hall, 308–315.
Janc, K. (2006). Zjawisko autokorelacji przestrzennej na przykładzie statystyki I Morana oraz lokalnych wskaźników zależności przestrzennej (LISA) – wybrane zagadnienia metodyczne. W: T. Komornicki, Z. Podgórski (red.). Idee i praktyczny uniwersalizm geografii, Dokumentacja Geograficzna, 33, 76–83.
Olejnik, A. (2013). Wybrane metody testowania modeli regresji przestrzennej. Przegląd Statystyczny, 60(3), 381–393.
Wibig, J. (2013). O współczynniku korelacji liniowej raz jeszcze. W: K. Jarzyna (red.). Zastosowanie metod statystycznych w geografii. Kielce: Instytut Geografii Uniwersytetu Jana Kochanowskiego w Kielcach, 47–61.
Pobrania
Opublikowane
Jak cytować
Numer
Dział
Licencja
Artykuły publikowane są zgodnie z warunkami licencji Creative Commons (CC BY-ND 4.0; uznanie autorstwa-bez utworów zależnych).