Kapittel 1: Ã… utforske og beskrive fordelinger
Utvalgte læringsmål fra emnesiden:
- Etter å ha fullført emnet har du kjennskap til standard metoder for å beskrive data ved oppsummerende mål og grafiske framstillinger
- Etter å ha fullført emnet kan du bruke statistikkprogrammet R til grunnleggende dataanalyse
Noen sentrale begreper og konsepter:
- Individer, variabler (kategoriske og kvantitative), verdier
- Gjennomsnitt, median
- Kvartiler, percentiler
- Femtallsoppsummering
- Tetthetskurver
Ferdigheter:
- Karakterisere et datasett ved hjelp av "Hvem? Hva? Hvorfor?"
- Lage og tolke grafer:
- Kategoriske variable:
- Kakediagram
- Stolpediagra m
- Kvantitative variable:
- Stilk-og-bladplott
- Histogram
- Boksplott
- Kategoriske variable:
- Beregne mål på senter og spredning
- 1.5 IQR-regelen for mistenkte uteliggere
- 68, 95, 99.7- regelen for normalfordelinga
- Beregne standardisert verdi, z-score for normalfordelinga
- Beregne andeler for et intervall av verdier i normalfordeling N(mu, sigma)
- Inverse normalberegninger: beregne verdi av percentil for oppgitt %-verdi/andel
¹ó´Ç°ù²õ³ÙÃ¥±ð±ô²õ±ð:
- Beskrive mønsteret for en fordeling, og identifisere avvik fra mønsteret
- Vurdere uteliggere
- Sammenligne verdier av gjennomsnitt og median for en fordeling, tolke evt forskjell
- Velge mål på senter og spredning
- Effekt av lineærtransformasjon / endring av måleenhet for en variabel
- Tetthetskurver
- Tolke QQ-plott
Kapittel 2: Ã… utforske og beskrive sammenhenger mellom variable
Utvalgte læringsmål fra emnesiden:
- Etter å ha fullført emnet har du kjennskap til standard metoder for å beskrive sammenhenger i data ved oppsummerende mål og grafiske framstillinger
- Etter å ha fullført emnet kan du bruke statistikkprogrammet R til grunnleggende dataanalyse
Noen sentrale begreper og konsepter:
- Forklaringsvariabel, responsvariabel
- Statistisk sammenheng mellom to variabler
- Regresjonslinje (konstantledd, stigningstall)
- Prediksjon
- Interpolere, ekstrapolere
- Residualplott
Ferdigheter:
- Lage og tolke spredningsplott
- Konstruere en ny variabel som en log-transformasjon av en eksisterende variabel
- Beregne korrelasjon
- Lese av ligning for regresjonslinje fra R-utskrift, lese av R^2
- Predikere verdi av responsvariabel gitt verdi av forklaringsvariabel pluss regresjonslinje
- Fem kriterier for å evaluere kausalitet
¹ó´Ç°ù²õ³ÙÃ¥±ð±ô²õ±ð:
- Form, retning og styrke på statistisk sammenheng
- Forklare betydningen av R^2 for minste kvadraters regresjonslinje
- Forklare termen "minste kvadrat" i minste kvadraters regresjon
- Faren ved ekstrapolasjon
- Sammenhengen mellom korrelasjon og minste kvadraters regresjon
- Forskjellen på korrelasjon og kausalitet
- Lurkende / underliggende variable
Kapittel 3: Ã… produsere eller innhente data
Utvalgte læringsmål fra emnesiden:
- Etter å ha fullført emnet har du kjennskap til grunnleggende prinsipper og metoder for å samle inn data
Noen sentrale begreper og konsepter:
- Anektotiske data, tilgjengelige data, utvalgsundersøkelser og eksperimenter
- Observasjonsstudie, eksperiment
- Dobbelblindet
- Design av eksperimenter
- Matchede par-design, blokkdesign
- Placeboeffekt
- Forventningsskjevhet
- Populasjon, utvalg
- Strata
- Enkelt tilfeldig utvalg (eng: Simple Random Sample, SRS)
Ferdigheter:
- Forklare viktigheten av kontrollgruppe i statistiske eksperimenter
- Forklare viktigheten av randomisering i statistiske eksperimenter
- Ã… kunne randomisere til grupper
- Vurdere effekt av underdekning og ikke-respons
¹ó´Ç°ù²õ³ÙÃ¥±ð±ô²õ±ð:
- Prinsippene for eksperimentell design
- (Kontrollere for underliggende variable ved å) sammenligne
- Randomiser
- Replikasjon
- Identifisere mulige årsaker til forventningsskjevhet
- Etiske problemstillinger rundt innsamling og lagring av data (og publisering). Kjenne til at det finnes etablerte ordninger med etiske komitéer (eks REK)
Kapittel 4: Tilfeldighet og sannsynlighet
Utvalgte læringsmål fra emnesiden:
- Etter å ha fullført emnet har du kjennskap til sannsynlighetsbegrepet og grunnleggende regler for sannsynlighet (inkludert betinget sannsynlighet og Bayes regel), samt kunnskap om tilfeldige variable (inkludert forventning, varians og kovarians for slike)
- Etter å ha fullført emnet har du kunnskap om store talls lov
Noen sentrale begreper og konsepter:
- Tilfeldighet, sannsynlighet
- Gjennomsnitt, median
- Utfall, utfallsrom, hendelse
- Uavhengig, disjunkt
- Tilfeldig variabel: diskret eller kontinuerlig
- Forventningsverdi
- Store talls lov (eng: Law of Large Numbers)
Ferdigheter:
- Sannsynlighetsberegninger for hendelser ved hjelp av reglene for sannsynlighet, inkl Bayes regel (se kap 4.2, 4.5)
- Sannsynlighetsberegninger for diskret tilfeldig variabel
- Sannsynlighetsberegninger for intervall av verdier for kontinuerlige tilfeldige variable: arealet under tetthetskurven, eks: normalfordelinga, uniformfordelinga
- Beregne forventningsverdi og varians for tilfeldig variabel, (inkludert for ny tilfeldig variabel konstruert som lineærtransformasjon av eksistererende tilfeldig variabel / endring av måleenhet)
- Tegne og forstå venndiagram, trediagram
¹ó´Ç°ù²õ³ÙÃ¥±ð±ô²õ±ð:
- Store talls lov
- Hva sannsynlighet er, eksempler på hvor det er nyttig
- Hva betinget sannsynlighet er
Kapittel 5: Utvalgsfordelinger
Utvalgte læringsmål fra emnesiden:
- Etter å ha fullført emnet har du kunnskap om sannsynlighetsfordelinger (inkludert normal, binomisk og Poisson)
- Etter å ha fullført emnet behersker du statistisk inferens som punktestimering
- Etter å ha fullført emnet har du kunnskap om sentralgrenseteoremet
Noen sentrale begreper og konsepter:
- Populasjon, parameter
- Utvalg, observator (eng: "statistic")
- Simulering
- Estimator
- Forventningsrett
- Utvalgsfordeling
- Sentralgrenseteoremet (eng: Central Limit Theorem)
Ferdigheter:
- Identifisere måter å redusere forventningsskjevhet og varians i en observator
- Beregne forventningsverdi og standardavvik av observator for enkelt tilfeldig utvalg (SRS) av størrelse n fra populasjon med oppgitt forventningsverdi og standardavvik
- Sentralgrenseteoremet for SRS av størrelse n (stor)
- Sannsynlighetsberegning for lineærkombinasjoner av uavhengige normalfordelte variabler
- Sannsynlighetsberegninger for binomisk tilfeldig variabel; forventningsverdi og standardavvik
- Sannsynlighetsberegninger for Poisson-fordelt tilfeldig variabel; forventningsverdi og standardavvik
¹ó´Ç°ù²õ³ÙÃ¥±ð±ô²õ±ð:
- Sammenheng mellom variabilitet av observator og størrelse på utvalg den er beregnet fra
- Forskjell på utvalgsfordeling og populasjonsfordeling
- Vurdere når en tilfeldig variabel har binomisk eller Poisson-fordeling,
- Vurdere når og hvordan vi kan bruke normalfordelinga som en tilnærming til sannsynlighetsberegninger for en tilfeldig variabel med hhv binomisk eller Poisson-fordeling
Kapittel 6 + 7: Statistisk inferens for forventningsverdi
Utvalgte læringsmål fra emnesiden:
- Etter å ha fullført emnet behersker du statistisk inferens (slutningsmetodikk) som punktestimering, intervallestimering (konfidensintervall) og hypotesetesting for ett og to utvalg (spesielt t-tester)
- Etter å ha fullført emnet kan du bruke statistikkprogrammet R til grunnleggende dataanalyse
Noen sentrale begreper og konsepter:
- Enkelt tilfeldig utvalg
- Konfidensintervall, (konfidens)-nivå, estimat, feilmargin
- Hypotesetest (statistisk signifikanstest), nullhypotese, alternativ hypotese, standardisert testobservator, P-verdi
- Robust [statistisk inferens-prosedyre]
- t-fordeling (familien av t-fordelinger), frihetsgrader (eng: degrees of freedom (df))
Ferdigheter:
- Konstruere nivå C konfidensintervall for ett og to utvalg, hhv
- Bruke formelen for et nivå C konfidensintervall til å beregne (minste) nødvendig størrelse på utvalg for å oppnå spesifisert (maksimal) feilmargin
- Hypotesetest for ett og to utvalg
¹ó´Ç°ù²õ³ÙÃ¥±ð±ô²õ±ð:
- Grunntanken bak et nivå C (for eksempel 95 %) konfidensintervall
- Hvilke antagelser som ligger bak konstruksjon av et nivå C konfidensintervall for forventningsverdien i en populasjon
- Grunntanken bak en hypotesetest
- Sammenhengen mellom en nivå α to-sidet hypotesetest for forventningsverdien µ og nivå 1- α konfidensintervallet for den samme parameteren µ
- Statistisk signifikans versus praktisk relevans (av effekt, forskjell etc)
- Multiple tester, hvorfor og hvordan gjøre Bonferroni-korreksjon
Kapittel 10.1 + 11: Enkel og multippel lineær regresjon
Utvalgte læringsmål fra emnesiden:
- Etter å ha fullført emnet behersker du enkel og multippel lineær regresjon
- Etter å ha fullført emnet kan du bruke statistikkprogrammet R til grunnleggende dataanalyse
Noen sentrale begreper og konsepter:
- Populasjonsregresjonslinje for kvantitativ responsvariabel
- populasjonsparametere \(\beta_0, \beta_1, (\beta_2, \cdots, \beta_p,)\ \sigma\)
- Minste kvadraters regresjonslinje, responsvariabel, forklaringsvariabel
- "Feilledd" \(\epsilon\) (individuell variasjon om forventningsverdi) versus residualer
- Konfidensintervall for forventningsverdi
- Predisjonsintervall
Ferdigheter:
- Utføre lineærregresjon i R, tolke R-utskrift fra lineærregresjon, inkl skrive ned ligninga for estimert modell
- Konstruere og tolke et nivå C konfidensintervall for populasjonsparameteren \(\beta_j\)
- Stegene for og tolkning av hypotesetest for \(\beta_j\)
- Konstruere og tolke et nivå C konfidensintervall for forventningsverdi for angitt(e) verdi(er) av forklaringsvariabel(ene)
- Konstruere og tolke et nivå C prediksjonsintervall for forventningsverdi for angitt(e) verdi(er) av forklaringsvariabel(ene)
¹ó´Ç°ù²õ³ÙÃ¥±ð±ô²õ±ð:
- Modellantagelser og modellsjekker
- Forskjellen (i tolkning og i feilmargin/intervallbredde) på et konfidensintervall for forventningsverdi og et predisjonsintervall for angitt(e) verdi(er) av forklaringsvariabel(ene)
- Vurderinger rundt å transformere forklaringsvariabel og/eller responsvariabel (når det ikke er en lineær sammenheng i originalform av variablene)
Kapittel 14: Logistisk regresjon
+ sannsynlighetsmaksimeringsprinsippet (Maximum Likelihood)
Utvalgte læringsmål fra emnesiden:
- Etter å ha fullført emnet behersker du statistisk inferens (slutningsmetodikk) som punktestimering, intervallestimering (konfidensintervall) og hypotesetesting
- kan du bruke statistikkprogrammet R til grunnleggende dataanalyse
Noen sentrale begreper og konsepter:
- Sannsynlighetsmaksimeringsprinsippet (eng: Maximum Likelihood (ML))
- Odds, logodds, odds ratio
- Regresjon for kategorisk (binær, dvs to mulige verdier: suksess/feil; 1/0) responsvariabel: Logistisk regresjon
Ferdigheter:
- Beregne odds fra en sannsynlighetsverdi p, beregne odds ratio for sammenligning av to andeler
- Utføre logistisk regresjon i R, tolke R-utskrift fra logistisk regresjon, inkl skrive ned ligninga for estimert modell
- Beregne estimert odds ratio for forklaringsvariabel j fra estimert stigningstall i en logistisk regresjonsmodell
- Konstruere og tolke et nivå C konfidensintervall for populasjonsparameter\(\beta_j\) , og for odds ratio for forklaringsvariabel j
- Stegene for og tolkning av hypotesetest for \(\beta_j\)
¹ó´Ç°ù²õ³ÙÃ¥±ð±ô²õ±ð:
- Hvorfor regresjonsmodell for logodds når vi har en binær responsvariabel?