Background image

terug

Vraag 10

Voor de 996.734 woorden in de rapporten van beide ziekenhuizen samen geldt C = 88.000.
In bijlage "Grafiek Zipf" zijn van alle gebruikte woorden de frequenties uitgezet tegen de rangnummers.
Op beide assen is gekozen voor een logaritmische schaalverdeling. De woorden uit bijlage "Frequentie woorden" vind je in bijlage "Grafiek Zipf" terug als de bovenste 10 punten.
Om de wet van Zipf en de werkelijkheid met elkaar te kunnen vergelijken, is in bijlage "Grafiek Zipf" ook de grafiek van fr = 88.000 / r getekend. De grafiek uit bijlage "Grafiek Zipf" is ook afgedrukt op de uitwerkbijlage.

De wet van Zipf geldt voor algemene teksten zoals krantenartikelen en dergelijke. Omdat medische rapporten niet 'algemeen' zijn, vertonen de grafieken opmerkelijke verschillen.
Tussen de rangnummers 2 en (ongeveer) 2200 zijn de werkelijke frequenties groter dan de frequenties volgens de wet van Zipf.

Onderzoek of dit verschil bij r = 100 groter is dan bij r = 500. Licht je antwoord toe.

terug

Bijlage(n)

Bij deze vraag worden één of meerdere bijlagen gebruikt.

Bijlage: Frequentie woorden
Bijlage: Grafiek Zipf
Bijlage: Uitwerkbijlage - Grafiek Zipf