Arkusz kodowy (ang. transfer sheet)

Dawno dawno temu (obecnie raczej sporadycznie) arkuszem kodowym nazywano papierowy dokument, podzielony na kolumny i wiersze, do których wpisywane były wartości zmiennych i nazwy przypadków, pochodzące z wyników przeprowadzonego badania. Obecnie papierowy arkusz kodowy został zastąpiony przez komputerowe pakiety statystyczne, … Czytaj dalej

Brak odpowiedzi (ang. no answer)

Brak odpowiedzi to nieudzielenie odpowiedzi przez respondenta na pytanie zamieszczone w kwestionariuszu wywiadu lub ankiecie. Może to wynikać z tego, że wybór odpowiedzi zamieszczonych w kafeterii jest niewystarczający, pytanie jest niejasno sformułowane itp. W trakcie wprowadzania danych do arkusza kodowego … Czytaj dalej

Braki danych (ang. missing values)

Braki danych to wszystkie nieznane wartości zmiennych i nazw przypadków, znajdujące się w bazie danych, arkuszu kodowym pakietu statystycznego itp. Braki danych wynikają zazwyczaj z nieudzielenia przez respondentów odpowiedzi na pytania zamieszczone w kwestionariuszu wywiadu lub ankietach. Braki danych po … Czytaj dalej

Częstości brzegowe (ang. boundary values)

Częstości brzegowe, najprościej mówiąc, są to zliczenia znajdujące się w ostatniej kolumnie lub wierszu tabeli krzyżowej, będące podsumowaniem wszystkich zliczanych przypadków lub zmiennych.

Czyszczenie logiczne (ang. contingency cleaning)

Czyszczenie logiczne to procedura sprawdzania spójności i sensowności zależności pomiędzy wartościami zmiennych, wprowadzanych do pakietu statystycznego lub innego programu, w którym będą przetwarzane i analizowane.

Dane surowe (ang. raw data)

Dane surowe to wszystkie informacje, które są wprowadzane do pakietu statystycznego lub innego programu komputerowego, w którym będą następnie czyszczone, uzupełniane i przygotowywane do dalszej analizy.

Dzikie kody (ang. wild codes)

Dzikie kody to potoczne określenie wszystkich błędnych kodów, które zostały omyłkowo wpisane przez koderów do pakietu statystycznego lub innego programu, w którym mają być analizowane dane z przeprowadzonego badania. Przykładem może być oznaczenie zmiennej „płeć” kodem o wartości numerycznej 3, … Czytaj dalej

Imputacja (ang. imputation)

Imputacja to procedura uzupełniania braków danych wprowadzonych do pakietu statystycznego. Braki danych mogą być pomijane w trakcie analizy lub też zastępowane wartościami losowymi, średnimi itp. Braki danych na temat wysokości dochodów respondentów, którzy nie podali takiej informacji, można uzupełnić np. w … Czytaj dalej

Klucz kodowy (ang. codeframe)

Klucz kodowy to zestawienie wszystkich numerów, za pomocą których oznaczamy wartości zmiennych, wprowadzanych do pakietu statystycznego lub innego programu. Przykładowo zmienna płeć będzie oznaczona dwoma numerami (np. 1 i 2), które zostaną przypisane do konkretnej płci.