Statystyka to dziedzina matematyki, która ogólnie rzecz bada zmienność danych, a także definiuje proces, który tę zmienność oblicza. Wiemy doskonale o tym, że statystyka jest wręcz niezbędnym zagadnieniem na potrzeby przeprowadzania różnego rodzaju wnioskowania oraz zrozumienia uzyskanych wyników. Ale jakie są podstawowe pojęcia dotyczące statystyki, które warto znać?
Aby skupić się na podstawowych pojęciach, na jakich opiera się statystyka, musimy na początek przejść do jej poddziedziny, która określana jest jako statystyka opisowa. Ta gałąź nauki zajmuje się opisem danych eksperymentalnych. W szczególności obejmuje ona gromadzenie, organizację i analizę danych. Dane statystyczne opisują w takim przypadku zestaw cech i wartości obiektów należących do zbioru danych.
Jeśli zajmujesz się statystyką w choćby minimalnym stopniu, to musisz znać co najmniej kilka podstawowych pojęć z tej dziedziny nauki. Te najważniejsze z nich przybliżymy Ci dzisiaj w naszym artykule!
Według profesora Ignacio Casco z Uniwersytetu Karola III w Madrycie (oryg. Universidad Carlos III de Madrid) do niektórych z podstawowych pojęć statystycznych, które każdy z nas powinien koniecznie znać, należą przede wszystkim:
1. Populacja statystyczna, czyli pojęcie, na którym wręcz opiera się statystyka
Populacja statystyczna to dobrze zdefiniowany zbiór przedmiotów o pewnych cechach, które mogą zainteresować badacza. Ten zbiór może być skończony lub nieskończony. Dlatego też wielkość populacji statystycznej to po prostu liczba zawartych w niej przedmiotów. Zazwyczaj jest oznaczony przez N.
Jeśli liczebność populacji statystycznej jest bardzo duża, przeprowadzenie badania może być bardzo kosztowne. W niektórych przypadkach nie można w ogóle brać pod uwagę możliwości przeanalizowania każdego elementu zbioru z osobna. Dlatego badacze w takim wypadkach zwykle wybierają kilka elementów z całej populacji statystycznej lub zawężonego jej przedziału.
2. Elementy
Element jest podstawowym obiektem wchodzącym w skład populacji statystycznej. Oczywiście wszystko zależy od kontekstu, elementami tymi nie muszą być zawsze ludzie. Jednak w psychologii zwykle tak właśnie jest.
3. Statystyka, a rozmiar (liczebność) próbki
Próbka to zestaw elementów, który najlepiej odzwierciedla cechy populacji statystycznej. Jeśli wielkość próbki odzwierciedla wszystkie interesujące nas parametry populacji, wówczas próbka jest określana mianem reprezentatywnej. Ponadto wielkość (liczebność) próbki to po prostu liczba elementów, które ona zawiera. Oznaczamy wielkość próbki poprzez „n”.
Jeśli wielkość próbki i populacji statystycznej pokrywają się, to sytuację taką określamy jako spis statystyczny, powszechny lub cenzus.
4. Zmienne
Zmienna (X) jest symbolem reprezentującym dowolną cechę, liczbę lub liczebność populacji statystycznej. Dane (r) to wartość, która może się zmieniać w obrębie zmiennej (stąd też jej nazwa). Jej konkretna wartość zależy od pomiaru danego elementu.
Rodzaje zmiennych, a statystyka
Poniżej zaprezentujemy Ci trzy podstawowe rodzaje zmiennych, na których opiera się statystyka. Są to kolejno:
Zmienna jakościowa
Ten typ zmiennej przyjmuje wartości odpowiadające niekwantyfikowalnym cechom elementów. A to oznacza, że nie możesz stwierdzić wprost, że jeden element ma wartość większą od drugiego lub odwrotnie.
Przykładem tego typu zmiennej może być płeć. Zmienne te nazywane są jakościowymi, ponieważ różnice między nimi opierają się wyłącznie na właściwościach lub cechach.
Zmienna porządkowa
Zmienna porządkowa może być podzielona na kategorie. Ponadto badacze mogą je uszeregować lub uporządkować ze względu na ich konkretną wartość. Jeśli miałbyś w populacji statystycznej same zmienne jakościowe, możesz je uszeregować w dowolnym porządku.
Pomyśl na przykład o klasach i ocenach szkolnych. „5” ma wartość wyższą, niż „3”. Analogicznie rzecz biorąc „3” ma wartość wyższą, niż „1”.
Zmienna ilościowa
Zmienne ilościowe przyjmują konkretne wartości liczbowe. Oznacza to, że możesz je zmierzyć stosując tradycyjne metody arytmetyczne. Istnieją dwa podtypy zmiennych ilościowych:
- Zmienna dyskretna. Zestaw możliwych wartości i elementów jest skończony lub policzalny. Na przykład zmienną dyskretną może być liczba dzieci w pojedynczej rodzinie.
- Zmienna ciągła. Zestaw wartości jest nieskończony lub niepoliczalny. Na przykład zmienną dyskretną jest czas.
Statystyka, a miary pozycji
Statystyka opisowa pozwala Ci na określenie pozycji analizowanych przez Ciebie elementów za pomocą miar pozycji.
Miary tendencji centralnej
Średnie lub miary tendencji centralnej są typowymi lub reprezentatywnymi wartościami dla danego zbioru elementów. Dlatego też ich celem jest podsumowanie wszystkich danych za pomocą jednej uśrednionej wartości.
Najczęściej stosowane miary to dominanta (dla zmiennych jakościowych), mediana (dla zmiennych porządkowych) i średnia (dla zmiennych ilościowych).
- Dominanta. Ta miara definiuje element populacji statystycznej, który pojawia się najczęściej. Jeśli istnieje więcej niż jedna z tych wartości, zmienna ta jest wielomodalna. Ponadto możesz obliczyć ją dla zmiennych dowolnego rodzaju.
- Mediana. Obliczasz ją wyłącznie dla zmiennych porządkowych. W szczególności sprawdza się wtedy, jeśli co najmniej połowa elementów populacji statystycznej była mniejsza lub równa medianie. Analogicznie także wtedy, jeśli co najmniej połowa elementów jest większa lub równa medianie.
Dlatego też jeśli w populacji statystycznej występuje więcej niż jedna mediana, musisz wziąć punkt środkowy między największą i najmniejszą medianą. Będzie to wartość pojawiająca się w próbce i służąca jako mediana właściwa. - Średnia arytmetyczna. Jest to najpopularniejsza lub najbardziej znana miara tendencji centralnej. Możesz więc znać ją jako średnią jeszcze z lat szkolnych. Aby móc ją obliczyć, musisz dysponować w szczególności zbiorem zmiennych ilościowych. Średnia arytmetyczna to po prostu środek geometryczny lub punkt, do którego zmierzają Twoje dane.
Ze średnią arytmetyczną jednak w wielu przypadkach „dzieje się coś dziwnego”, ponieważ może ona nie być reprezentatywna dla próbki, ale może również nie reprezentować żadnej rzeczywistej wartości z tej próbki. Innymi słowy, ta wartość może nie istnieć w próbce danych.
Garść przemyśleń na sam koniec
Chociaż statystyka wykorzystuje także wiele innych pojęć, to powyżej zaprezentowaliśmy Ci być może te najbardziej podstawowe. Za ich pomocą możesz skutecznie organizować i obliczać różnego rodzaju tendencje oraz tworzyć reprezentacje danych. Są to zatem doskonałe narzędzia dla naukowców i społeczności naukowej. Statystyka daje Ci kompletną mapę wyników Twojego badania. Nie lekceważ więc jej.
Bibliografia
Wszystkie cytowane źródła zostały dokładnie sprawdzone przez nasz zespół, aby zapewnić ich jakość, wiarygodność, trafność i ważność. Bibliografia tego artykułu została uznana za wiarygodną i posiadającą dokładność naukową lub akademicką.
- de Datos, A. E. (1983). Estadística Descriptiva.
- Fernández, S. F., Sánchez, J. M. C., Córdoba, A., Cordero, J. M., & Largo, A. C. (2002). Estadística descriptiva. Esic Editorial.
-
García Pérez, A. (2008). Estadística aplicada: Conceptos básicos.