+ - 0:00:00
Notes for current slide
Notes for next slide

Statistiek 1a

Week 1

donderdag 12 september 2024

Gert Stulp

1 / 33

Huishoudelijke mededeling

Huiswerkopgaven hoeven niet ingeleverd te worden.

Practica dienen ingeleverd te worden aan het einde van de sessie.

Uitwerkingen van week 1 staan online.

2 / 33

Soorten variabelen

kwantitatief

  • De scores zijn getallen.
  • Wiskundige bewerkingen zinvol (optellen, delen, ...).
  • Discreet of continu.

Voorbeelden:

Inkomen
Tentamencijfers
Aantal tweets Trump
Gewicht

2.1

3 / 33

Soorten variabelen

kwantitatief

  • De scores zijn getallen.
  • Wiskundige bewerkingen zinvol (optellen, delen, ...).
  • Discreet of continu.

Voorbeelden:

Inkomen
Tentamencijfers
Aantal tweets Trump
Gewicht

2.1

kwalitatief (categorisch)

  • De scores zijn labels.
  • De getalsinformatie heeft geen getalsbetekenis.
  • Altijd discreet.

Voorbeelden:

Favoriete politieke partij
In bezit van auto
Haarkleur
Wijn- of bierdrinker

3 / 33

Soorten variabelen

continu

  • Alle waarden op een interval.
  • Tussen ieder paar scores ligt altijd nog tenminstens 1 andere mogelijke score

Voorbeelden:

Inkomen
Gewicht

2.1

4 / 33

Soorten variabelen

continu

  • Alle waarden op een interval.
  • Tussen ieder paar scores ligt altijd nog tenminstens 1 andere mogelijke score

Voorbeelden:

Inkomen
Gewicht

2.1

discreet

  • Beperkt aantal waarden
  • Vaste meeteenheid die niet       verder onderverdeeld kan worden.

Voorbeelden:

Tentamencijfers (afgerond)
Aantal tweets Trump

4 / 33

Soorten variabelen

continu

  • Alle waarden op een interval.
  • Tussen ieder paar scores ligt altijd nog tenminstens 1 andere mogelijke score

Voorbeelden:

Inkomen
Gewicht

2.1

discreet

  • Beperkt aantal waarden
  • Vaste meeteenheid die niet       verder onderverdeeld kan worden.

Voorbeelden:

Tentamencijfers (afgerond)
Aantal tweets Trump

Het onderscheid tussen continu en discreet is in de praktijk vager dan in theorie:

  • Metingen zijn altijd discreet omdat ieder meetinstrument een maximale precisie heeft (bijvoorbeeld een weegschaal op 0.1 kilogram nauwkeurig).
  • Als bij continue schalen een beperkt aantal mogelijkheden voorkomen, gebruiken we ‘discrete technieken’.
4 / 33

Meetniveaus

Het meetniveau van een variabele geeft aan hoeveel getalsinformatie in de scores van een variabele je ‘serieus mag nemen’

nominaal:

gevallen hebben verschillende scores
Jan heeft een hond, en Piet een kat

2.1
5 / 33

Meetniveaus

Het meetniveau van een variabele geeft aan hoeveel getalsinformatie in de scores van een variabele je ‘serieus mag nemen’

nominaal:

gevallen hebben verschillende scores
Jan heeft een hond, en Piet een kat

2.1

ordinaal:

gevallen kunnen gerangschikt worden op scores
Jan drinkt vaak Bier, en Piet soms

5 / 33

Meetniveaus

Het meetniveau van een variabele geeft aan hoeveel getalsinformatie in de scores van een variabele je ‘serieus mag nemen’

nominaal:

gevallen hebben verschillende scores
Jan heeft een hond, en Piet een kat

2.1

ordinaal:

gevallen kunnen gerangschikt worden op scores
Jan drinkt vaak Bier, en Piet soms

interval:

het verschil tussen gevallen a&b is 2× verschil c&d
Jan heeft 3 IQ-punten meer dan zijn broer, en Piet 6; 2x zoveel dus

5 / 33

Meetniveaus

Het meetniveau van een variabele geeft aan hoeveel getalsinformatie in de scores van een variabele je ‘serieus mag nemen’

nominaal:

gevallen hebben verschillende scores
Jan heeft een hond, en Piet een kat

2.1

ordinaal:

gevallen kunnen gerangschikt worden op scores
Jan drinkt vaak Bier, en Piet soms

interval:

het verschil tussen gevallen a&b is 2× verschil c&d
Jan heeft 3 IQ-punten meer dan zijn broer, en Piet 6; 2x zoveel dus

ratio:

geval a is 2× zo (vul in) als geval b
Jan verdient 2x minder dan Piet

5 / 33

Meetniveaus

nominaal

Latin: nōmen ("name").

Voorbeelden:

Beroep
Geslacht

ordinaal

Latin: ordo ("order").

Voorbeelden:

Politieke oriëntatie
Schooldiploma


Bij een ordinaal meetniveau zit er een bepaalde volgorde in de categorieën. Vaak is er bij bij een nominaal meetniveau wel een volgorde te verzinnen. Bijvoorbeeld beroep: "blue collar", "white collar".

2.1

6 / 33

Meetniveaus

interval

Voorbeelden:

IQ
Temperatuur (°C)
Geboortejaar

ratio

Voorbeelden:

Lichaamslengte
Temperatuur (K)
Studiepunten


Het fundamentele verschil tussen het interval en ratio meetniveau is dat laatstgenoemde een absoluut nulpunt heeft waarbij de 0 "afwezigheid van de eigenschap" betekent. 0 studiepunten betekent de afwezigheid van studiepunten; 0 °C betekent niet de afwezigheid van warmte, maar minder warmte dan 1 °C.

2.1

7 / 33

Soorten variabelen en meetniveaus

8 / 33

Oefenen met meetniveaus

9 / 33

aantal bananen per tros

10 / 33

aantal bananen per tros

kwantitatief, discreet, ratio

10 / 33

lichaamslengte met meetlint in centimeters

11 / 33

lichaamslengte met meetlint in centimeters

kwantitatief, discreet, ratio

11 / 33

aantal huwelijken in een jaar

12 / 33

aantal huwelijken in een jaar

kwantitatief, discreet, ratio

12 / 33

toename aantal huwelijken in %

13 / 33

toename aantal huwelijken in %

kwantitatief, continu, interval

13 / 33

favoriete dier

14 / 33

favoriete dier

categorisch, discreet, nominaal

14 / 33

favoriete dier

categorisch, discreet, nominaal

14 / 33

provincie waarin je woont

15 / 33

provincie waarin je woont

categorisch, discreet, nominaal

15 / 33

seksuele geaardheid

16 / 33

seksuele geaardheid

categorisch, discreet, nominaal

16 / 33

geboortejaar

17 / 33

geboortejaar

kwantitatief, discreet, interval

17 / 33

wat is het ideale aantal kinderen voor een doorsnee Nederlands gezin?

18 / 33

wat is het ideale aantal kinderen voor een doorsnee Nederlands gezin?

kwantitatief, discreet, ratio

18 / 33

wat is het ideale aantal kinderen voor een doorsnee Nederlands gezin?

kwantitatief, discreet, ratio

18 / 33

Bias (vertekening)

Enkele voorbeelden van bias in steekproeven zijn:

sampling bias:

niet iedereen heeft een gelijke kans om in de steekproef te komen. Voorbeelden: volunteer sampling, undercoverage, overcoverage

2.3

19 / 33

Bias (vertekening)

Enkele voorbeelden van bias in steekproeven zijn:

sampling bias:

niet iedereen heeft een gelijke kans om in de steekproef te komen. Voorbeelden: volunteer sampling, undercoverage, overcoverage

2.3

response bias:

respondent geeft onjuist antwoord. Voorbeelden: liegen, ambigue vragen.

19 / 33

Bias (vertekening)

Enkele voorbeelden van bias in steekproeven zijn:

sampling bias:

niet iedereen heeft een gelijke kans om in de steekproef te komen. Voorbeelden: volunteer sampling, undercoverage, overcoverage

2.3

response bias:

respondent geeft onjuist antwoord. Voorbeelden: liegen, ambigue vragen.

nonresponse bias:

respondent wordt niet bereikt, wil niet meewerken, of beantwoordt niet alle vragen

19 / 33

Verschil sampling en (non)-response bias

Bij sampling bias gaat het om fouten die betrekking hebben op de manier waarop de steekproef is getrokken. Er zullen dus mensen in de steekproef ontbreken of overgerepresenteerd zijn. Voorbeelden: telefonische interviews afnemen tussen 9-17 uur, steekproef studenten in de UB

2.3

20 / 33

Verschil sampling en (non)-response bias

Bij sampling bias gaat het om fouten die betrekking hebben op de manier waarop de steekproef is getrokken. Er zullen dus mensen in de steekproef ontbreken of overgerepresenteerd zijn. Voorbeelden: telefonische interviews afnemen tussen 9-17 uur, steekproef studenten in de UB

2.3 Bij response/non-response bias gaat om fouten die betrekking hebben op het niet of foutief beantwoorden van de vragen in de vragenlijst, maar de steekproef kan wel correct getrokken zijn.

20 / 33

Verschil sampling en (non)-response bias

Bij sampling bias gaat het om fouten die betrekking hebben op de manier waarop de steekproef is getrokken. Er zullen dus mensen in de steekproef ontbreken of overgerepresenteerd zijn. Voorbeelden: telefonische interviews afnemen tussen 9-17 uur, steekproef studenten in de UB

2.3 Bij response/non-response bias gaat om fouten die betrekking hebben op het niet of foutief beantwoorden van de vragen in de vragenlijst, maar de steekproef kan wel correct getrokken zijn.

Bij response bias is een respondent wel bereikt voor het onderzoek, maar liegt hij of zij tijdens het beantwoorden van de vragen of beantwoordt hij of zij de vragen verkeerd door ambiguïteit of de volgorde van de vragen. Voorbeelden: liegen over aantal sekspartners.

20 / 33

Verschil sampling en (non)-response bias

Bij sampling bias gaat het om fouten die betrekking hebben op de manier waarop de steekproef is getrokken. Er zullen dus mensen in de steekproef ontbreken of overgerepresenteerd zijn. Voorbeelden: telefonische interviews afnemen tussen 9-17 uur, steekproef studenten in de UB

2.3 Bij response/non-response bias gaat om fouten die betrekking hebben op het niet of foutief beantwoorden van de vragen in de vragenlijst, maar de steekproef kan wel correct getrokken zijn.

Bij response bias is een respondent wel bereikt voor het onderzoek, maar liegt hij of zij tijdens het beantwoorden van de vragen of beantwoordt hij of zij de vragen verkeerd door ambiguïteit of de volgorde van de vragen. Voorbeelden: liegen over aantal sekspartners.

Bij de non-response bias wordt de respondent niet bereikt wordt of deze wil niet mee doen, of deze slaat sommige vragen bewust over. Voorbeelden: inkomen niet opgeven, geen zin meer in de rest van de vragenlijst.

20 / 33

Sampling methoden

De manier waarop een steekproef wordt getrokken heeft grote invloed op het vermijden van bias en hoe (goed) je vanuit de steekproef conclusies over de populatie kan afleiden. Er zijn diverse sampling methoden.

simple random sample:

iedereen heeft gelijke kans op deelname. Voorbeeld: enquête onder studenten op basis van studentnummer.

2.4
21 / 33

Sampling methoden

De manier waarop een steekproef wordt getrokken heeft grote invloed op het vermijden van bias en hoe (goed) je vanuit de steekproef conclusies over de populatie kan afleiden. Er zijn diverse sampling methoden.

simple random sample:

iedereen heeft gelijke kans op deelname. Voorbeeld: enquête onder studenten op basis van studentnummer.

2.4

cluster sampling:

deel de populatie op in verschillende "clusters" en trek een SRS van de clusters. Efficiënter.

21 / 33

Sampling methoden

De manier waarop een steekproef wordt getrokken heeft grote invloed op het vermijden van bias en hoe (goed) je vanuit de steekproef conclusies over de populatie kan afleiden. Er zijn diverse sampling methoden.

simple random sample:

iedereen heeft gelijke kans op deelname. Voorbeeld: enquête onder studenten op basis van studentnummer.

2.4

cluster sampling:

deel de populatie op in verschillende "clusters" en trek een SRS van de clusters. Efficiënter.

stratified sampling:

deel de populatie in groepen van ‘soortgelijke’ individuen ("strata") en trek een SRS binnen elke groep. Voorbeeld: onderzoek naar etnische minderheden.

21 / 33

Sampling methoden

2 vormen van stratified sampling:

2.4

proportional stratified sampling:

deel de populatie op in verschillende "strata" en trek een SRS binnen de strata De grootte van de SRS is proportioneel ten aanzien van de grootte van die strata in de populatie. Voorbeeld: 20% van de studenten aan RuG zijn 'internationaal'. Trek een steekproef van 10 internationale en 40 Nederlandse studenten

disproportional stratified sampling:

deel de populatie op in verschillende "strata" en trek een SRS binnen de strata. De grootte van de SRS wordt zo bepaald dat er van beide strata goede schattingen gemaakt kunnen worden. Voorbeeld: 100 Nederlandse en 100 internationale studenten

22 / 33

Statistiek in de sociale wetenschappen

23 / 33

Oefenen met biases

24 / 33

de docent vraagt persoonlijk aan alle studenten wat ze van het vak vinden

25 / 33

de docent vraagt persoonlijk aan alle studenten wat ze van het vak vinden

response bias

25 / 33

een onderzoeker geïnteresseerd in super-marktgedrag ondervraagt mensen in de Aldi

26 / 33

een onderzoeker geïnteresseerd in super-marktgedrag ondervraagt mensen in de Aldi

sampling bias

26 / 33

een survey vraagt naar het inkomen van de respondent

27 / 33

een survey vraagt naar het inkomen van de respondent

response bias / nonresponse bias

27 / 33

hoeveel auto-reparaties heb je gedaan in het afgelopen jaar?

28 / 33

hoeveel auto-reparaties heb je gedaan in het afgelopen jaar?

response bias

28 / 33

je vraagt aan al je vrienden of ze een vragenlijst willen invullen

29 / 33

je vraagt aan al je vrienden of ze een vragenlijst willen invullen

sampling bias

29 / 33

internetonderzoek met als eerste vraag "vind je vragenlijsten invullen leuk"?

30 / 33

internetonderzoek met als eerste vraag "vind je vragenlijsten invullen leuk"?

nonresponse bias

30 / 33

een streng-gelovige onderzoeker vraagt naar ideeën over abortus

31 / 33

een streng-gelovige onderzoeker vraagt naar ideeën over abortus

response bias / nonresponse bias

31 / 33

je vraagt studenten om direct na het tentamen een evaluatieformulier in te vullen

32 / 33

je vraagt studenten om direct na het tentamen een evaluatieformulier in te vullen

sampling bias / response bias / nonresponse bias

32 / 33

Huishoudelijke mededeling

Huiswerkopgaven hoeven niet ingeleverd te worden.

Practica dienen ingeleverd te worden aan het einde van de sessie.

Uitwerkingen van week 1 staan online.

2 / 33
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow