Inhoudsopgave
Hoe ga je om met missing values?
In plaats van geobserveerde data weg te gooien, kunnen we deze data gebruiken om een schatting van de missende waarden te maken. Deze techniek noemen we imputeren. Single imputation is de methode waarin iedere missende waarde één keer geschat en ingevuld wordt. Hiervoor kunnen verschillende modellen toegepast worden.
Wat doen met missende data?
Mean imputation Imputation is het vervangen van missende data met berekende ‘schattingen’. Er zijn tal van mogelijkheden om een waarde te schatten en bij mean imputation (of mean substitution) wordt een missende waarde vervangen door het gemiddelde van de kolom waarin de waarde is gevonden.
Hoeveel missing values mag je hebben?
Je kunt maximaal drie verschillende discrete missing values invoeren.
Wat te doen met missing data SPSS?
Als je descriptives van alle variabelen zoekt, dan geeft SPSS (als er ontbrekende waarden zijn), onderaan je output een VALID N (listwise). Deze geeft het aantal ‘rijen’ weer waar er geen missing values zijn.
Hoe missing values verwijderen SPSS?
Je kunt de data verwijderen door een rij, of meerdere rijen te selecteren en deze te deleten door de delete knop in te drukken. Als de nepdata een duidelijke identifier heeft kun je ook met een select-cases opdracht een selectie van de data verwijderen.
Hoe variabelen samenvoegen SPSS?
Items samenvoegen in SPSS In het ‘Compute’ scherm, noteer je onder ’target variabele’ de naam van de variabele die je gaat aanmaken. Wil je de items samenvoegen door het gemiddelde te berekenen. Dit doe je met de functie ‘MEAN(?,?) ‘ om het gemiddelde van de items te berekenen.
Hoe outliers verwijderen?
Variabele negeren/verwijderen: als een variabele teveel outliers bevat, is het een optie om deze variabele simpelweg niet te selecteren in analyses. Ook kan de variabele in zijn geheel worden verwijderd; selecteer in ‘data view’, de kolom horende bij de ongewenste variabele en druk op ‘delete’.
Hoe bereken je een outlier?
De eerste stap in het berekenen van uitbijters is het vinden van de mediaanwaarde (of de middelste waarde) van de gegevensset….We tellen dit getal op bij Q3 en trekken het af van Q1, om als volgt de binnengrenzen te vinden:
- 71,5 + 2,25=73,75.
- 70 – 2,25=67,75.
- De binnengrenzen zijn dus 67,75 en 73,75.