Indhold

Ugrupperet statistik

I videoen gennemgås det hvordan man laver statistik på ugrupperede data, både som rå data og som hyppighedsopdelte data. Der gennemgås hvordan man bestemmer deskriptorer og tegner søjlediagrammer og boksplot (med og uden outliers).

0:00Statistik på rå data vha. regnearket.
1:15Deskriptorer
2:15Hyppighedsopdelte data
2:56Boksplot med og uden outliers
3:30Justering på tegneblokken
5:29Boksplot ud fra udvidet kvartilsæt
6:55Boksplot og søjlediagram uden at bruge regneark
9:30Deskriptorer beregnet i CAS

Deskriptorer

Eksempler på hvordan man bestemmer forskellige deskriptorer vha. kommandoer.

Der er målt følgende data:

7, 9, 11, 1, 13, 8, 8, 10, 12, 11, 10, 7, 8, 8, 11, 6 .

Herudfra kan man bestemme middelværdi, mindste og største værdi, kvartiler og spredning:
obs := {7, 9, 11, 1, 13, 8, 8, 10, 12, 11, 10, 7, 8, 8, 11, 6}
middel(obs)
Middelværdi
Min(obs)
Mindste værdi
Maks(obs)
Største værdi
Q1(obs)
Nedre kvartil
Median(obs)
Median
Q3(obs)
Øvre kvartil
stdevp(obs)
Spredning
stdev(obs)
Stikprøvespredning
Man kan også bestemme hvilke unikke målinger der er i datasættet og hvad deres hyppigheder er:
Unik(obs)
Hyppighed(obs)

Bemærkning

Alle disse kommandoer fungerer både i CAS- og i algebra-vinduet.
Deskriptorer for målinger med hyppighed:
Observation 92122232425
Hyppighed 1697125
Herudfra kan man bestemme middelværdi, kvartiler og spredning:
obs := {9, 21, 22, 23, 24, 25}
hyp := {1, 6, 9, 7, 12, 5}
middel(obs, hyp)
Middelværdi
Q1(obs, hyp)
Nedre kvartil
Median(obs, hyp)
Median
Q3(obs, hyp)
Øvre kvartil
stdevp(obs, hyp)
Spredning
stdev(obs, hyp)
Stikprøvespredning

Boksplot-kommandoen

Eksempler

Nogle eksempler på anvendelse af Boksplot-kommandoen.

Boksplot over målingerne

7, 9, 11, 1, 13, 8, 8, 10, 12, 11, 10, 7, 8, 8, 11, 6 .

obs = {7, 9, 11, 1, 13, 8, 8, 10, 12, 11, 10, 7, 8, 8, 11, 6}
Boksplot(1, 0.5, obs)
Hvis outliers skal markeres, skriver man
Boksplot(1, 0.5, obs, true)

Bemærkninger

  1. Tallene 1 og 0.5 i kommandoen angiver hvilken \(y\)-værdi boksplottet placeres ud for, og hvor bredt/højt boksplottet skal være.
  2. Man behøver ikke lave en selvstændig liste til observationerne, man kunne også nøjes med at skrive
    Boksplot(1, 0.5, {7, 9, 11, 1, 13, 8, 8, 10, 12, 11, 10, 7, 8, 8, 11, 6})
    Men en selvstændig liste er praktisk hvis man skal gøre mere med observationerne end bare at tegne boksplottet.
Boksplot over målinger med hyppighed
Observation 92122232425
Hyppighed 1697125
obs = {9, 21, 22, 23, 24, 25}
hyp = {1, 6, 9, 7, 12, 5}
Boksplot(1, 0.5, obs, hyp, false)
Hvis man vil have vist outliers, skriver man
Boksplot(1, 0.5, obs, hyp, true)

Bemærkning

Her skal man angive om man vil have outliers vist ved at skrive enten true eller false til sidst i parentesen.
Boksplot med mindste værdi 6, nedre kvartil 8, median 9,5, øvre kvartil 11 og største værdi 14. Altså hvor det udvidede kvartilsæt er (6, 8, 9.5, 11, 14):
Boksplot(1, 0.5, 6, 8, 9.5, 11, 14)

Bemærkning

Her kan der af gode grunde ikke vises outliers.

Grupperet statistik

I videoen gennemgås histogrammer og deskriptorer for grupperede data samt hvordan man tegner sumkurver og bestemmer kvartilsæt.

0:00Indtastning af lister.
1:27Histogram
2:39Deskriptorer
2:52Sumkurve
5:19Bestemmelse af kvartilsæt
8:00Middelværdi og spredning

Sumkurve og kvartilsæt

Hvis der er givet dette datasæt
Højde 150-160160-170170-180180-190190-200
Hyppighed 345675112
kan man tegne sumkurven på denne måde:
int = {150, 160, 170, 180, 190, 200}
hyp = {3, 45, 67, 51, 12}
f = hyp/Sum(hyp)
F = Sekvens(Sum(f, i), i, 0, Længde(f))
S = StykvisLinje((int, F))
Herefter kan man bestemme kvartilsættet ved at finde skæringerne mellem sumkurven S og linjerne med ligningerne \(y=0,\!25\), \(y=0,\!5\) og \(y=0,\!75\).
K_1 = Skæring(y = 0.25, S)
M = Skæring(y = 0.5, S)
K_3 = Skæring(y = 0.75, S)

Bemærkning

Hvis man allerede har frekvenserne (i stedet for hyppighederne) i de enkelte intervaller, kan listen f ovenfor defineres til at være listen af frekvenser.