# Opgave samling

### Opgave samling

Bent Willum Hansen Introduktion til teoretisk statistik og nogle af dens anvendelser
EMNEOPDELTE OPGAVESAMLING
Beskrivende statistik ..........................................................................................................................2
Sandsynlighedsregning ......................................................................................................................3
Stokastiske variable ...........................................................................................................................6
Modeller og sandsynlighedsfordelinger .........................................................................................8
Estimation ........................................................................................................................................12
Multinomiske modeller ...................................................................................................................15
Regressionsanalyse ..........................................................................................................................18
Hypotesetest af µ, σ, p og λ .............................................................................................................22
Stikprøveteori ...................................................................................................................................26
Fejltyper og Styrkefunktion ...........................................................................................................28
Bestemmelse af stikprøvestørrelse .................................................................................................29
OPGAVESÆT MED PROGRESSIV EMNEOPTAGELSE ......................................................31
OPGAVESÆT MED BLANDEDE OPGAVER ..........................................................................67
4. 4. Beskrivende statistikBeskrivende statistikOpgave AEt teleselskab er interesseret i at sammenligne tilfredsheden hos deres kunder i Århus og København.De har derfor udtaget 2 stikprøver – en fra København og en fra Århus. Tilfredsheden er målt på en skala fra1 til 10 med 1 som meget utilfreds og 10 som meget tilfreds.Resultatet af undersøgelsen fremgår af følgende tabel:Tilfredshedsscore København Århus 1 8 9 5 6 2 4 8 9 8 1 9 8 8 2 3 7 7 7 8 8 10 8 8 3 9 10 10 9 9 7 7 9 7 7 7 6 8 8 6 8 8 6 8 8 7 7 8 7 7A.1 Udregn både for København og Århus følgende nøgletal: Gennemsnittet for tilfredshedsscoren Standardafvigelsen for tilfredshedsscoren Medianen for tilfredshedsscoren Kvartilsættet for tilfredshedsscoren SkævhedA.2 Foretag på baggrund af ovenstående nøgletal en sammenligning af de to stikprøver.Opgave BTeleselskabet ønsker at udregne prisindeks for de 3 forskellige modeller af mobiltelefoner A, B og C.Selskabet har indsamlet relevante oplysninger for de 3 modeller, som fremgår af følgende tabel: 1. kvartal 2. kvartal 3. kvartal 4. kvartalModel pris afsætning pris afsætning pris afsætning pris afsætning (1.000 stk.) (1.000 stk.) (1.000 stk.) (1.000 stk.) A 425 20 440 20 450 19 455 18 B 829 12 830 13 825 14 799 18 C 540 26 540 28 569 25 580 25Beregn Laspeyres, Paasches og Fishers prisindeks for 2. kvartal, 3. kvartal og 4. kvartal, idet 1. kvartalbenyttes som basisperiode. 2
5. 5. SandsynlighedsregningSandsynlighedsregningBemærkning!Ved løsning af nogle af opgaverne skal der gøres brug af sætningen:Hvis hændelserne H1 , H2 , ......., Hq danner et udfaldsrum H1 ∪ H2 ∪ ....... ∪ Hq = U og deres indbyrdesfællesmængde er tom Hi ∩ Hj = Ø så gælder det, at sandsynligheden for hændelsen A er givet ved P(A) = P(A ∩ H1) + P(A ∩ H2) + ........... + P(A ∩ Hq)Specielt gælder det for to vilkårlige hændelser A og B, at P(A) = P(A ∩ B) + P(A ∩ B )Opgave 1Med udgangspunkt i teoribogens tabel 1 side 25, besvares følgende spørgsmål.a) Bestem P(H5) og P(H6)b) Bestem P(H5 ∩ H6)c) Bestem P(H5 ∪ H6)d) Vis at P( H 6 ) = P( H 6 ∩ H 5 ) + P( H 6 ∩ H5 ) og forklar resultatet i orde) Bestem P(H5 | H6) og vis at P(H5 ∩ H6) = P(H6) P(H5 | H6)f) Undersøg om P(H5) og P(H6) er uafhængige.Opgave 2I et eksperiment kan der forekomme følgende hændelser A, B, C, I og II, hvor det oplyses, at den indbyrdesfællesmængde mellem A, B og C er tom og at den indbyrdes fællesmængde mellem I og II er tom.På denne baggrund defineres et udfaldsrum U = {u1 , u2 , u3 , u4 , u5 , u6}, hvor udfaldene er karakteriseretved: u1 = A ∩ I; u2 = A ∩ II; u3 = B ∩ I; u4 = B ∩ II; u5 = C ∩ I; u6 = C ∩ IIDet oplyses at P(u3) = P(u4) = 0,15 P(I) = 0,60 og P(II) = P(A) = 0,4 hændelserne A og I er uafhængige hændelserne A og II er uafhængigeVed løsning af spørgsmålene i opgave 2 på næste side skal det fremgå hvilke fra følgende formelsæt der erbragt i anvendelse:: 1) P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 2) P( A ) = 1 − P(A) P(A ∩ B) 3) P(A | B) = P(B) 4) A og B er uafhængige ⇔ P(A ∩ B) = P(A)⋅P(B) 5) Lad B1 , B2 , ......, Bn være disjunkte og B1 ∪ B2 ∪ ....... ∪ Bn = U så gælder der, at P(A) = P(A ∩ B1 ) ∪ P(A ∩ B2 ) ∪ ........... ∪ P(A ∩ Bn) Specielt gælder det, at P(A) = P(A ∩ B) + P(A ∩ B ) 3
6. 6. Sandsynlighedsregninga) Udfyld en tabel, svarende til nedenstående, med relevante sandsynligheder. A B C I P(I) =II P(II) = P(A) = P(B) = P(C) =Bestem sandsynlighederneb) P(A ∩ I)c) P(A ∩ B)d) P(A ∪ I)e) P(A ∪ B)f) P( A )g) P(II | A)h) P(A ∪ A )i) P(C ∩ II) + P( C ∩ II)Opgave 3Sandsynlighederne for et eksperiment med 6 udfald er givet ved tabellen: A B C I alt M 0,10 0,40 K 0,20 0,60 I alt 0,30 0,20 1,00Det oplyses at P(M | B) = 0,25Udfyld resten af tabellen, idet anvendte regneregler skal angives eksplicit.Opgave 4For hændelserne A og B gælder: P(A) = 0,40 , P(B | A) = 0,50Bestem P(A ∩ B)Opgave 5P(A ∩ B) = 0,3 og P(A ∩ B ) = 0,2Angiv P(A) og begrund svaret.Opgave 6P(A ∩ B) = 0,2 , P( B ) = 0,6 og P(A | B ) = 0,5Bestem P(A).Opgave 7 (den svære)Et sommerhusområde er udlejet til udelukkende danskere og tyskere. 60 % af sommerhusene er udlejet tildanskere. Det oplyses endvidere, at 10 % af danskerne har sommerhus ved vandet, mens det for tyskernesvedkommende gælder, at 20 % har sommerhus ved vandet.Bestem sandsynligheden for, at en tilfældigt valgt person med sommerhus ved vandet, er dansker. 4
7. 7. SandsynlighedsregningOpgave 8På et loft hænger 20 strømper, hvoraf de 12 er røde. Lyset går ud og der skal nedtages 6 strømper.Bestem sandsynligheden for, ata) netop 4 er rødeb) ingen er rødec) mindst én er rødd) højst 5 er rødeOpgave 9Ved en spilleautomat er der tre udfald A, B og C. Sandsynligheden for at A, B eller C indtræffer erhenholdsvis 20 %, 30 % og 50 %. Nu spilles der 3 gange. Bestem sandsynligheden fora) A indtræffer ikkeb) A indtræffer mindst én gangc) A indtræffer netop én gangd) Udelukkende B og C indtræffere) Udelukkende A og B indtræfferf) A, B og C indtræffer 5
8. 8. Stokastiske variableStokastiske variableOpgave 10En virksomhed ønsker at vurdere den fremtidige samlede afsætning for 2 varer, S1 og S2.Antag at afsætningen kan beskrives ved en stokastisk variabel, således at X = afsætning for vare S1 ; E(X) = 9.200 stk. og VAR(X) = 10.000 Y = afsætning for vare S2 ; E(Y) = 8.000 stk. og VAR(Y) = 8.100a) Bestem den forventede samlede afsætning for de to varer under et.b) Bestem både varians og standardafvigelse for de to varer under et.c) Salgsprisen pr. stk. for de to varer er 5 kr. for vare S1 og 10 kr. for vare S2. Bestem den forventede omsætning samt den varians, der knytter sig til omsætningen.Opgave 11I Sønderjylland er ha-udbyttet i gennemsnit 1.200 kg.I Vestjylland er ha-udbyttet i gennemsnit 800 kg.Fra Sønderjylland skal der udtages en stikprøve på 10 ha og fra Vestjylland skal der udtagesen stikprøve på 20 ha.Vi indfører følgende betegnelser: Xi = udbytte i Sønderjylland pr. ha, for arealenhed nr. i ; i = 1, 2, ….., 9, 10 Yj = udbytte i Vestjylland pr. ha, for arealenhed nr. j ; j = 1, 2, ….., 19, 20a) Bestem stikprøvens forventede høstudbytte, både for Sønderjylland og for Vestjylland.b) Bestem det forventede gennemsnitlige høstudbytte pr. ha for begge stikprøver under et.c) I Sønderjylland er prisen for et kg høstudbytte 2 kroner og i Vestjylland er den tilsvarende pris 2,5 kr. Hvilken forventet samlet salgsværdi vil de to stikprøven få?d) I Sønderjylland er det opgjort, at variansen pr. ha høstudbytte er 10.000, mens variansen i Vestjylland er opgjort til 16.000 Angiv den usikkerhed (= standardafvigelse), der knytter sig til svaret i spm. c).Opgave 12Vi betragter et eksperiment, hvor der kastes én gang med en mønt og én gang med en terning.Vi definerer følgende stokastiske variable: X = antal plat Y = antal øjneBestem forventning og varians for variablen: Z = X + Y 6
9. 9. Stokastiske variableOpgave 13På destinationen St. Anton har rejsebureauet Downhill indgået en kontrakt med den lokale lægeklinik om atmodtage og behandle gæster, der er kommet til skade ved skiløb. I den tid, som Downhill har haft kontraktmed lægeklinikken, har den gennemsnitlige udgift i forbindelse med skiskader, andraget 3.800 kr. pr. skade.Downhill finansierer disse omkostninger via en forsikringsordning de selv administrerer.Prisen på forsikringen pålægges alle rejser til St. Anton.Erfaringsmæssigt regner Downhill med, at sandsynligheden for at pådrage sig en skade ved skiløb i løbet afen uge, kan sættes til 0,07.Vi betragter nu et rejseselskab på 300 personer og definerer de stokastiske variable: Xi = antal skader for person nr. i ; xi ∈ {0; 1}Endvidere indfører vi variablen Y med følgende betydning: ∑X 300 Y= i = antal ugentlige skader i forbindelse med skiløb for et rejsehold på 300 deltagere. i =1a) Bestem E(Y) og VAR(Y).b) Bestem de forventede forsikringsomkostninger for et rejsehold på 300 personer.c) Bestem standardafvigelsen med hensyn til forsikringsomkostningerne for et rejsehold på 300 personer.Opgave 14En ejendomsmægler har erfaring for, at villaer har en forventet liggetid på 90 dage med en varians på 900,mens de tilsvarende tal for ejerlejligheders vedkommende er 100 og 400.Ejendomsmægleren har netop fået 20 nye kunder, som har bedt ham formidle salget af i alt 12 villaer og 8ejerlejligheder. Det skønnes, at en liggedag koster kunden 500 når der er tale om salg af villaer og 450 kr.når der er tale om salg af ejerlejligheder.Bestem de samlede forventede liggetidsomkostninger og den tilhørende standardafvigelse som er forbundetmed det forestående salg af de 20 ejendomme.Opgave xxI indeværende periode forventes lønnen for en økonom at være 30.000 kr. med en standardafvigelse på 3.000 kr.I den kommende periode forventes lønnen at stige. Den forventede lønstigning og tilhørende standardafvigelseer henholdsvis 3.000 kr. og 1.000 kr.Antag at korrelationskoefficienten mellem løn i indeværende periode og lønstigning i den kommende periodeer − 0,5.a) Bestem den forventede løn i den kommende periode.b) Bestem standardafvigelsen for lønnen i den kommende periode. 7
10. 10. Modeller og sandsynlighedsfordelingerModeller og sandsynlighedsfordelingerOpgave 15I nedenstående situationer skal du angive den relevante variabel og hvilken fordeling denne kan antages atfølge.a) En tilfældig mandag mellem kl. 14.00 og 16.00 optælles antal personer, der søger asyl ved grænsen til Tyskland.b) På Danfoss har man i en uge optalt antal arbejdsulykker.c) Med henblik på at vurdere andelen af alvorlige arbejdsulykker, har man blandt 78 registrerede arbejdsulykker fundet 3 der krævede sygefravær i mere end en måned.d) For at vurdere beståelsesprocenten i statistik på MAK-studiet er der udtaget en simpel tilfældig stikprøve på 100 studerende. I alt har 65 af disse bestået.e) Blandt de studerende, der har bestået i statistik på MAK-studiet, har man opgjort det ugentlige forbrug af timer til at studere statistik.f) Ved kvalitetskontrollen på De Danske Spritfabrikker udtages der løbende en stikprøve, hvor alkoholprocenten måles.g) Blandt de formodede hiv-smittede i Danmark udtages der en stikprøve på 75 personer for at vurdere andelen af heteroseksuelle. Det oplyses, at der er 8.500 hiv-smittede i Danmark.Opgave 16For hvert af nedenstående eksperimenter er der defineret en stokastisk variabel X. Bestem for hvert afnedenstående eksperimenter følgende:1) Fordeling af X: hypergeometrisk, binomial, poisson eller normal2) P(X < 4), P(X > 6), P(4 ≤ X ≤ 6) og P(X = 5)3) E(X) og st.afv(X)a)Undersøgelse af kviksølvindhold i bundprøver fra Københavns havn. 25 % af bundprøverne indeholderkviksølv over en kritisk grænseværdi.X = antal bundprøver der overskrider den kritiske grænseværdi ud af i alt 25 bundprøver.b)40 % af de MAK-studerende kommer direkte fra gymnasiet.Der udtages en stikprøve på 8 MAK-studerendeX = antal studerende der er kommet direkte fra gymnasiet.c)Undersøgelse vedrørende antal læsere af Berlingske Tidende. 40 % af avislæsere læser Berlingske Tidende.X = antal læsere af Berlingske Tidende ud af en stikprøve på 10.d)Undersøgelse af cadmiumindhold i mg af drikkevandsprøver i Vestjylland. Det gennemsnitlige indhold pr.drikkevandsprøve er 1 mg og variansen er 1.X = antal mg cadmium pr drikkevandsprøve.e)Undersøgelse af antal flyankomster i Kastrup i tidsrummet 9.00 - 10.00. I gennemsnit lander der 15 fly idette tidsrum.X = antal flyankomster i tidsrummet 9.00 - 10.00 8
11. 11. Modeller og sandsynlighedsfordelingerf)Undersøgelse af togforsinkelser i perioden 1/1 - 31/1. I gennemsnit er der 18 togforsinkelser.X = antal togforsinkelser mellem 1/1 - 31/1g)Undersøgelse af togforsinkelser over 20 minutter. Hvert 10. tog er forsinket over 20 minutter.X = antal forsinkelser over 20 min. ud af en stikprøve på 20 forsinkelser.h)Undersøgelse af dagtemperatur kl. 12.00 i januar måned. Middeltemperaturen er 4 grader celsius ogvariansen er 25.X = dagtemperatur kl. 12.00 i januar månedi)Undersøgelse af antal dage med en dagtemperatur over 5 grader celsius i januar måned. 20 % af dagene haren temperatur over 5 grader celsius i januar.X = antal dage med over 5 grader celsius i januar måned ud af en stikprøve på 15 dagej)Undersøgelse af længere tids soleksponerings kræftfremkaldende virkning. Der er 5 % der udvikler hudkræftved overdreven soldyrkning. Der udtages en stikprøve på i alt 20 personer, som har været udsat for længeretids soleksponering.X = antal hudkræfttilfældek)Undersøgelse af længere tids soleksponerings kræftfremkaldende virkning. I gennemsnit er der 12 personerom året i Roskilde der udvikler hudkræft.X = antal personer i Roskilde der udvikler hudkræft i løbet af et årl)Undersøgelse over mængden af ukurante varer som følge af utilstrækkelige lagerfaciliteter. Det har vist sig at15 % af varerne bliver ukurante som følge af de utilstrækkelige opbevaringsforhold.Et udvalgt parti varer på i alt 18 enheder studeres.X = antal enheder der bliver ukurantem)Studier over alkoholprocenten ved fremstilling af kirsebærvin. En hobbyist fremstiller 25 flasker vin og detviser sig at 10 af flaskerne har en alkoholprocent over 7. Han har ikke mærket flaskerne, så efter en vis tidhar han glemt, hvilke flasker der havde den "store" alkoholprocent.X = antal flasker med den "store" alkoholprocent når der fremtages i alt 12 flasker vin til en familiefestn)Lille Børge tror, han er god til at skyde med luftgevær. Ud af 20 skud forventer han at ramme plet 2 gange.Til en havnefest køber Børge 15 skud.X = antal gange Børge rammer plet 9
12. 12. Modeller og sandsynlighedsfordelingerOpgave 17En virksomhed, der fremstiller jernkæder, mener at have opfundet en bedre produktionsmetode. For atundersøge om den nye metode er bedre end den hidtil brugte, prøvefremstiller man 15 stk. 8 mm kæde, hvermed en længde af 5 meter. Man opspænder hvert kædestykke i en prøvebænk, hvor man strækker kæden, indtil den springer. Følgende trækbelastninger, alle målt i kg, blev registreret umiddelbart før kædestykket brødsammen:2.453, 1.980, 2.758, 3.110, 2.738, 2.917, 2.322, 2.645, 2.566, 2.200, 2.441, 2.778, 2.691, 2.533, 2.469Ved den hidtil brugte fremstillingsmetode var brudstyrken normalfordelt med en middelværdi på 2.500 kg ogen standardafvigelse på 100 kg.1 Undersøg, om brudstyrken efter den nye metode kan antages at følge en normalfordeling2 Virksomheden sælger sine kæder med garanti for, at kæderne har en brudstyrke på mindst 2.200 kg. Kommenter denne påstand, både i relation til kæder fremstillet efter den hidtil brugte fremstillings- metode, og i relation til den nye fremstillingsmetode.3 Antag at der skal fremstilles en prøveproduktion på 10 kabler efter den gamle metode. Bestem sandsynligheden for at den gennemsnitlige brudstyrke for de 10 kabler er på mindst 2.573,4 kg.4 Virksomheden fremstiller en prøveproduktion på 50 kabler efter den nye metode. Estimer sandsynligheden for, at mindst 48 kabler har en brudstyrke, der opfylder garantien.5 a) Hvilken garanti kan virksomheden tilbyde for kabler produceret efter den gamle metode, hvis man ønsker, at garantien skal opfyldes med en sandsynlighed på 98 %? b) Hvilken gennemsnitlig brudstyrke, det vil sige µ, skal kablerne have efter den nye metode, hvis virksomheden ønsker, at garantien på 2.200 kg skal opfyldes med en sandsynlighed på 98 %?6 Virksomheden har erfaring for, at den gennemsnitlige afsætning pr. måned er 3.200 meter, med en varians på 10.000. Kablernes udsalgspris pr. løbende meter er 1.250 kr. Bestem virksomhedens forventede omsætning pr. måned, samt den tilhørende standardafvigelse.Opgave 18Ved rensning af flasker i forbindelse med ølproduktion må man i gennemsnit regne med, at anlægget fårdriftstop 3 gange i løbet af en uge.a) Bestem sandsynligheden for, at der sker mindst 4 driftstop i løbet af en uge.b) Bestem sandsynligheden for, at der sker mindst 16 driftstop i løbet af en måned (= 4 uger).Opgave 19Antag, at der er en sandsynlighed på 0,40 for at en tilfældig person, der er ryger, kan stoppe med at ryge.Bestem sandsynligheden for, at der blandt 30 rygere er mellem 12 og 15 personer (begge inklusive), der kanstoppe rygningen.Opgave 20Ved indtagelse af en cola kan det antages, at det i gennemsnit medfører en vægtforøgelse på 50 gram med enstandardafvigelse på 20.Bestem sandsynligheden for, at en person, der har drukket en cola, højst øger sin vægt med 40 gram. 10
13. 13. Modeller og sandsynlighedsfordelingerOpgave 21Køretiden for en vognmand fra København til Esbjerg er udregnet til i gennemsnit at tage 7 timer.Standardafvigelsen kan erfaringsmæssigt sættes til 1. Der udtages en stikprøve på 35 kørsler.Bestem sandsynligheden for at gennemsnittet af køretiden for de 35 kørsler er mellem 6 og 7 timer.Vink! Overvej hvilken fordeling variablen X følger, når Xi ~ N(µ, σ2) (se bogen)Opgave 22En virksomhed har erfaring for at deres afsætning X i styk følger en normalfordeling N(1050, 1002)De ønsker at opbygge et bufferlager således at efterspørgslen kan efterkommes i mindst 98 % af tilfældene.Bestem bufferlagerets størrelse.Opgave 23En stikprøve på 10 biler har vist at deres hastighed var følgende:56, 54, 48, 49, 50, 57, 44, 52, 52, 47Kontroller grafisk om hastigheden kan antages at følge en normalfordeling. 11
14. 14. EstimationEstimationOpgave 24I et forsøg på at estimere den gennemsnitlige ordrestørrelse blandt gæster i en restaurant, er der udtaget enstikprøve på 10 personer. Stikprøveresultatet var følgende ordrestørrelse i kr.:75, 77, 95, 102, 35, 75, 97, 97, 65, 70.Fra tidligere undersøgelser vides at standardafvigelsen σ er 15.a) Punktestimer den gennemsnitlige ordrestørrelseb) Lav et 95 % konfidensinterval for den gennemsnitlige ordrestørrelsec) Anvend punktestimatet fundet i spm. a) til at bestemme sandsynligheden for at en tilfældig gæst afgiver en ordre på mere end 90 kr.d) 90 % af ordrerne er større end et vist beløb K. Anvend punktestimatet fundet i spm. a) til at udregne størrelsen K.Opgave 25En undersøgelse blandt 340 mænd og 114 kvinder der læser Romanbladet viste at gennemsnitsalderen blandtmændene var 47 år og blandt kvinderne 44 år. Antag at populationens standardafvigelse for både mænd ogkvinder er 8.a) Udregn et 95 % konfidensinterval for gennemsnitsalderen for mænd.b) Udregn et 95 % intervalestimat for gennemsnitsalderen for kvinder.c) Sammenlign de to konfidensintervaller og overvej om man kan antage at der er forskel i gennemsnitsalderen.d) Bestem sandsynligheden for at alderen for en tilfældig kvindelig læser er højere end alderen for en tilfældig mand. Ved beregningen anvendes de relevante punktestimater. Benyt sætningen: Hvis X ∼ N(µ1 , σ12) og Y ∼ N(µ2 , σ22) er uafhængige så er (X − Y) ∼ N(µ1 − µ2 , σ12 + σ22)Opgave 26En stikprøveundersøgelse blandt 250 amerikanske fabriksarbejdere viste en gennemsnitlig årsindkomst på\$24.000 og en standardafvigelse på \$5.000a) Bestem et 90 % konfidensinterval for populationsgennemsnittet.b) Bestem et 95 % konfidensinterval for populationsgennemsnittet.c) Bestem et 99 % konfidensinterval for populationsgennemsnittet.d) Forklar hvad der sker efterhånden som konfidensniveauet hæves og hvorfor det nødvendigvis må være sådan. 12
15. 15. EstimationOpgave 27Op til en turnering har bowlingklubben “Keglegodte” udført en undersøgelse, der skal blotlægge spillernesform. Blandt de 10 turneringsspillere har man noteret, hvor mange strikes der laves ud af 245 kast.Resultatet var 205.a) Angiv et punktestimat for andelen af strikes blandt de 10 turneringsspillere.b) Angiv et 95 % konfidensinterval for andelen af strikes blandt de 10 turneringsspillere.c) Benyt punktestimatet fra spm. a) og udregn sandsynligheden for at der laves 8 eller flere strikes ud af 10 kast.Opgave 28I 10 på hinanden følgende dage observerer man antallet af færdselsuheld, der involverer cyklister.Resultatet af undersøgelsen var følgende: 16, 13, 14, 17, 25, 11, 14, 16, 12, 15.a) Bestem et punktestimat for det gennemsnitlige antal færdselsuheld pr. dag.b) Bestem et 90 % konfidensinterval for det gennemsnitlige antal færdselsuheld pr. dag.Opgave 29En stikprøve undersøgelse blandt 14 sygeplejersker har vist et gennemsnitligt sygefravær på 12 % ogen standardafvigelse på 4 %. (Bemærk at der ikke er tale om populationens standardafvigelse, men omstikprøvens standardafvigelse).a) Beskriv populationens elementer.b) Angiv et punktestimat for det gennemsnitlige sygefravær.c) Angiv et punktestimat for populationsvariansen og populationens standardafvigelse med hensyn til sygefravær.d) Angiv et 99 % konfidensinterval for populationsgennemsnittet.e) Angiv et 90 % konfidensinterval for både populationsvarians og populationsstandardafvigelse med hensyn til sygefravær.Opgave 30Blandt 100 tilfældigt valgte MAK-studerende er det konstateret, at den gennemsnitlige forberedelsestid tilsamtlige fag pr. uge er 6 timer med en tilhørende varians på 4. Endvidere er det konstateret, at 20 af dissestuderende ikke forbereder sig til statistik.a) Angiv et 95 % konfidensinterval for den gennemsnitlige forberedelsestid blandt MAK-studerende.b) Angiv både et punkt- og intervalestimat for den andel af MAK-studerende, der ikke forbereder sig til statistik. Konfidensintervallet skal have niveauet 95 %.c) Angiv et 90 % konfidensinterval for populationsvariansen.d) Antag at σ2 = 3. Beregn på denne baggrund sandsynligheden for at s2 ≤ 3,27. 13
16. 16. EstimationOpgave 31Anderierne håber naturligvis på, at rigtig mange mennesker vælger and juleaften. For at få en ide om, hvorstor en andel der vælger and, har anderiet udspurgt 780 tilfældige personer. 480 svarede at de ville spise andjuleaften. Udarbejd et 95 % intervalestimat for denne andel.Opgave 32Opgave der kan bruges til evaluering af egen viden og indsatsAEn planteskole har omlagt deres bede og plantestier, samt ombygget forretningen. Iden forbindelse har de lavet en rundspørge blandt tilfældige kunder, hvor kunderneer blevet spurgt om de foretrækker den nye indretning frem for den gamle og om dentid de har brugt i havecentret.Resultatet af undersøgelsen var at der blandt 120 adspurgte var 82 som syntes at indretningen var bedre endden gamle indretning og at de i gennemsnit havde brugt 40 minutter med en standardafvigelse på 20 minutteri havecentret.1) Angiv et 95 % konfidensinterval for den andel af kunderne som synes at den nye indretning er bedre end den gamle indretning.2) Angiv et 90 % konfidensinterval for den tid som kunderne i gennemsnit vil bruge i havecentret, samt udregn et 90 % konfidensinterval for den standardafvigelse der er knyttet til kundernes tidsforbrug i havecentret.BEn bank har som et forsøg oprettet en konsulenttjeneste i tilknytning til en af deres investeringsforeninger.Med henblik på at bemande denne tjeneste ønsker man at få et skøn over hvor mange opringninger derkommer om mandagen mellem kl. 1000 og kl. 1200. Et forsøg over 5 tilfældige mandage har vist følgenderesultat: Mandag Mandag Mandag Mandag Mandag d. 2/10 d. 9/10 d. 23/10 d. 30/10 d. 13/11 5 2 6 6 4I forbindelse med ovennævnte undersøgelse blev navn og adresse registreret for dem der ringede op.Efter 3 måneder opgjorde man for de 23 personer der havde ringet op, hvor mange penge de havde investereti foreningen. En sammentælling viste, at de i gennemsnit havde investeret 12.500 kr. med enstandardafvigelse på 6.000 kr., samt at 10 af investorerne havde investeret 25.000 kr. eller mere.1) Bestem både et punktestimat og et 95 % konfidensinterval for det antal personer man kan forvente der vil ringe til konsulenttjenesten en mandag mellem kl. 1000 og 1200.2) Bestem et 90 % konfidensinterval for den andel af dem der henvender sig til konsulenttjenesten, og investerer mindst 25.000 kr. inden for 3 måneder.Fra tidligere omfattende undersøgelser har man erfaring for at standardafvigelsen med hensyn tilinvesteringens størrelse kan antages at være 6.500 kr3) Bestem et 90 % konfidensinterval for den gennemsnitlige investering bankens kunder vil foretage i løbet af en 3 måneders periode 14
17. 17. Multinomiske modellerMultinomiske modellerOpgave 33I 1999 viste en omfattende undersøgelse, at andelene af tv-seere, der foretrækker henholdsvisTV-DANMARK, TV-2 og DR1, fordelte sig således: Andel der ser mest tv fra DR1 TV2 TV-Danmark 35 % 40 % 25 %I 2000 udførtes en stikprøveundersøgelse, bestående af 340 personer, hvor hver person blev spurgt om,hvilken af de tre stationer de havde som 1. prioritet.Undersøgelsesresultatet fremgår af nedenstående tabel: Antal med 1. prioritet DR1 TV2 TV-Danmark 100 150 90Tyder denne stikprøveundersøgelse på, at seer-andelene er ændret?Opgave 34En undersøgelse fra 16. maj 2000, angående hvilket transportmiddel der benyttes oftest, viste følgendefordeling: Tog: 15 % Bus: 18 % Bil: 52 % Andet: 15 %Undersøgelsen omfattede 300 personer.I 1998 blev der foretaget en omfattende undersøgelse, der viste, at de tilsvarende andele var Tog: 18 % Bus: 20 % Bil: 45 % Andet: 17 %Kan vi på baggrund af undersøgelsesresultatet fra 2000 konkludere at andelene er ændret?Opgave 35En undersøgelse fra USA, hvor man spurgte hver enkelt deltager om, hvilken farve han/hun foretrækker viste Farve Antal Brun 20 Gul 15 Rød 30 Orange 22 Grøn 16 Blå 12Kan det for USA som helhed afvises, at andelene med hensyn til farvevalg er lige store?Opgave 36En pc-producent vil undersøge, om der er forskel i folks præferencer med hensyn til nogle bestemteskærmtyper A, B, C og D. En undersøgelse omfattende 1.000 potentielle kunder viste: A: 27 % B: 30 % C: 25 % D: 18 %Tyder stikprøveresultatet på, at præferencerne er forskellige? 15
18. 18. Multinomiske modellerOpgave 37En importør af biler har undersøgt sammenhængen mellem købt bilmodel og købernes bopæl.Nedenfor gengives de tal importøren har fundet frem til ved en tilfældig udvalgt stikprøve på 500. Sedan Lift back Stationcar I altJylland 53 66 32 151Øerne 21 23 59 103København 101 119 26 246I alt 175 208 117 500Undersøg ved en test på 5 % niveauet om der er sammenhæng mellem bilmodel og bopæl og i givet faldidentificer hvilke kategorier der især er sammenhæng imellem.Opgave 38En ejendomsmægler har for 300 ejerboliger undersøgt sammenhængen mellem salgstid og beliggenhed.Undersøgelsesresultatet i procent af de 300 ejerboliger fremgår af følgende tabel: Salgstid I alt Område 1 Område 2 i mdr. 0 10 % 13 % 23 % 1 12 % 17 % 29 % 2 12 % 17 % 29 % over 2 9% 10 % 19 % I alt 43 % 57 % 100 %Undersøg ved en test, om der er uafhængighed imellem salgstid og beliggenhed.Opgave 39En spiller, der spiller Joker, ønsker at undersøge om der er uafhængighed i rækkefølgen af lige og uligenumre. Spilleren har derfor samlet oplysninger om 204 spil.Nedenstående tabel viser hvor ofte lige og ulige cifre optrådte efter hinanden. Første ciffer Lige Ulige Andet ciffer Lige 57 44 Ulige 44 59Undersøg ved en test, om der er uafhængighed i rækkefølgen af lige og ulige cifre. 16
19. 19. Multinomiske modellerOpgave 40I et messecenter ønsker man at undersøge betydningen af standenes placering. I den forbindelse vil manundersøge det rimelige i at opstille modellen:Model: X = antal personer der i løbet af en periode på 15 minutter besøger standen ~ ps(λ)3 forskellige steder i messecentret med placering A, B og C har man opsat den samme stand. For hver standhar man løbende registreret antal besøgende for perioder af 15 minutter.Resultatet for stand A er Antal besøgende Antal perioder 0 3 1 12 2 18 3 15 4 15 5 eller flere 12 I alt 75Undersøg ved en test rimeligheden i at opstille ovenstående model. 17
20. 20. RegressionRegressionsanalyseOpgave 41Et slagteri vil begynde en produktion af hundefoder. Til prisfastsættelsen af hundefoder ønskervirksomheden at identificere de faktorer, der er bestemmende for totalomkostningerne vedrørendeproduktion af hundefoder.Slagteriet har målt den anvendte mængde af variable produktionsfaktorer og totalomkostningerne i de første7 dages produktion.Resultaterne fremgår af følgende tabel: Produktion i kg Tilsat Tilsat Totale produktions- stabilisator i kg protein i kg omkostninger i 1.000 kr. 750 12 5,5 16,0 800 12 5,5 16,5 850 15 5,5 16,6 900 15 5,5 17,5 1.000 16 6 18,0 1.500 17 6 19,0 2.000 18 6 21,0Alle delopgaver 33.2 til 33.6 besvares på baggrund af den opstillede model i 33.1Opgave 41.1Foretag en grafisk afbildning af talmaterialet vedrørende sammenhængen mellem produktionen i kg og detotale produktionsomkostninger og opstil på den baggrund en regressionsmodel.Præciser forudsætningerne for modellen.Opgave 41.2Estimer modellens parametre og giv en økonomisk fortolkning af disse.Opgave 41.3Beregn determinationskoefficienten og fortolk denne.Opgave 41.4Afgør ved en test, om der er lineær sammenhæng mellem produktionen i kg og de totaleproduktionsomkostninger.Opgave 41.5En dag planlægger slagteriet at producere 1.700 kg. Bestem et 95 % forudsigelsesinterval for de totaleproduktionsomkostninger.Opgave 41.6Beskriv hvordan det er muligt grafisk at kontrollere modellens forudsætninger.Opgave 41.7Redegør for, om modellen i opgave 41.1 bør udbygges med de øvrige produktionsfaktorer. 18
21. 21. RegressionOpgave 42Et engelsk Travselskab Racing Horse har haft et svingende antal gæster gennem de seneste 10 år.Man mener, at det specielt er faktorerne ”vejret” og ”entréprisen”, der kan forklare antallet af gæster pr.travdag. Med henblik på at undersøge om denne formodning holder stik, har man for de seneste 10 årindsamlet data om det gennemsnitlige antal gæster pr. travdag, antal dage med tørvejr og entrépriser.Undersøgelsesresultatet fremgår af følgende tabel: Gennemsnitligt Antal Entrépris antal gæster pr. travdag tørvejrsdage Y X1 X2 913 161 20 1041 188 20 1124 181 25 1159 187 25 1117 189 25 966 168 40 1230 195 30 1096 173 30 838 137 25 975 160 2042.1 Opstil en regressionsmodel, der beskriver sammenhængen mellem det gennemsnitlige antal gæster pr. travdag og antal tørvejrsdage. Kontroller om modellens forudsætninger er opfyldt.42.2 Opstil en hypotese om, at der er lineær sammenhæng mellem det gennemsnitlige antal gæster pr. travdag og antal tørvejrsdage. Gennemfør testen og fortolk resultatet.42.3 Opstil et 95 % forudsigelsesinterval for det gennemsnitlige antal gæster pr. travdag, hvis antal tørvejrsdage et år er 180.42.4 Opstil og estimer en multipel regressionsmodel, der forklarer det gennemsnitlige antal gæster pr. travdag som en lineær funktion af antal tørvejrsdage og entréprisen. Argumenter for om nogle af denne models variable bør udelades. 19
22. 22. RegressionOpgave 43Et bageri ønsker at undersøge om afsætningen af deres ”Økobrød” kan forklares ved prisen og holdbarheden.Bageriet har derfor iværksat en undersøgelse, der skal vise om dette er tilfældet. Data fra denne undersøgelsefremgår af nedenstående tabel. Afsætning Pris Holdbarhed i i 100 stk. dage 47,50 8,00 9,7 47,50 8,25 10,0 46,25 8,50 10,2 45,00 8,75 10,7 45,00 9,00 10,8 42,50 9,25 11,1 41,25 9,25 11,3 40,50 9,50 11,4 40,00 9,50 12,043.1 Opstil og estimer relevante regressionsmodeller på baggrund af datamaterialet.43.2 Test om der er en lineær sammenhæng mellem afsætningen af ”Økobrød” og prisen på ”Økobrød”.43.3 Opstil et 95 % forudsigelsesinterval for ”Økobrød”, hvis prisen sættes til 10 kr.43.4 Hvilken af de i spørgsmål 43.1 nævnte modeller vil du foretrække, når afsætningen af ”Økobrød” skal forklares?Opgave 44Ved salg af ejendomme med en grundstørrelse over 1.400 m2 som kan udstykkes, træder en særbeskatning ikraft. Særbeskatningen afhænger ikke af, hvor meget arealet overstiger 1.400 m2.Særbeskatningen kan altså betragtes som en faktor, der kun virker én gang, nemlig når et grundarealoverstiger 1.400 m2 og ejendommen kan udstykkes.Observationer for ejendomsvurdering, areal og dummyvariabel (= særbeskatning) fremgår af nedenståendetabel.Ejendoms- Grundareal Særbeskatnings- vurdering (m2) regel(1.000 kr.)  0 = før særbeskatning er indført Y X1 X2 X2 =  1.000 1.000 0 1.200 1.100 0  1 = efter særbeskatning er indført 1.250 1.200 0 1.300 1.300 0 1.400 1.400 0 1.700 1.500 1 1.700 1.600 1 1.730 1.700 1 1.800 1.800 1 20
23. 23. RegressionUdfør regressionsanalyser for følgende modeller:1. Yi = β0 + β1X1i + ei ; ei er uafhængige N(0, σ2)2. Yi = β0 + β2X2i + ei ; ei er uafhængige N(0, σ2)3. Yi = β0 + β1X1i + β2X2i + ei ; ei er uafhængige N(0, σ2)og bestem R2 for hver model. Undersøg endvidere, hvilke modeller der er signifikante når der anvendes ettestniveau på 0,08 og argumenter for om særbeskatningen har betydning når man skal forklare variationerne iejendomsvurderingen.Opgave 45I nedenstående tabel vises observationer for variable der antages at have betydning for ejendomsværdiensstørrelse. Ejendomsvurdering Grundareal Renteniveau Beboelsesareal Afstand til bymidte (1.000 kr.) (m2) (pct) (m2) (m) Y X1 X2 X3 X4 1.000 1.000 6,5 110 500 1.200 1.100 6,5 125 1200 1.250 1.200 6 125 300 1.300 1.300 5 130 600 1.400 1.400 5 140 3500 1.700 1.500 4 160 4200 1.700 1.600 4 160 1800 1.730 1.700 4 170 1500 1.800 1.800 4 180 1500Undersøg på et 10 % testniveau om variablene Grundareal og Afstand til bymidte kan udelades af modellen: Yi = β0 + β1X1i + β2X3i + β3X3i + β4X4i + ei ; ei er uafhængige og N(0, σ2) Y = Ejendomsvurdering X1 = Grundareal X2 = Renteniveau X3 = Beboelsesareal X4 = Afstand til bymidte 21
24. 24. Hypotesetest af µ, σ, p og λHypotesetest af µ, σ, p og λOpgave 46Luftforureningen er i almindelighed øget i Danmark gennem de sidste årtier. Imidlertid viser flereundersøgelser samstemmende, at graden af forurening er bestemt af en række faktorer, såsom trafik-belastning, vejrforhold og geografisk beliggenhed.I en mindre provinsby i Jylland har man gennem de sidste 5 år haft erfaring for, at forureningsgraden, måltved indholdet af kuldioxid, ikke er steget. Forureningsgraden blev i denne sammenhæng målt som detgennemsnitlige indhold af kuldioxid pr. luftprøve og blev målt til højst 45 enheder.Der er i 1995 foretaget en stikprøve, hvor det gennemsnitlige indhold af kuldioxid er målt til 47.46.1 Antag at stikprøven var baseret på 10 målinger og at populationens standardafvigelse er kendt lig 4. Undersøg på denne baggrund, om der er grundlag for at antage at der er sket en stigning i luftforureningen. a) Udfør test ved hjælp af KV-metoden. b) Udfør test ved hjælp af ss-metoden.46.2 Antag at stikprøven var baseret på 25 målinger, og at standardafvigelsen er beregnet til 4. Undersøg på denne baggrund, om der er grundlag for at antage at der er sket en stigning i luft- forureningen. Udfør test ved hjælp af ss-metoden.46.3 Antag at stikprøven var baseret på 25 målinger og at standardafvigelsen er beregnet til 4. Undersøg på denne baggrund om der er grundlag for at antage at der er sket en ændring i luft- forureningen. Udfør test ved hjælp af ss-metoden. Udfør test ved hjælp af KV-metoden.46.4 Antag at stikprøven var baseret på 75 målinger og at standardafvigelsen er beregnet til 4. Undersøg på denne baggrund om der er grundlag for at antage at der er sket en stigning i luft- forureningen. Udfør test ved hjælp af ss-metoden.Opgave 47Erfaringsmæssigt antages det at højst 40 % af unge mellem 14 år og 20 år benytter kondom hver gang de harseksuelt samkvem.På baggrund af kampagner mod hiv-smitte er der foretaget en undersøgelse, der viser at 43 % ud af 1.000adspurgte benyttede kondom ved hvert samleje.Giver dette resultat anledning til at tro, at andelen af unge, der benytter kondom, er steget?Opgave 48Et mejeri har erfaring for, at en bestemt ostetype modnes optimalt ved at lagre osten i 7 uger og 3 timer,hvilket svarer til 1.179 timer. Kan denne modningstid nedbringes vil det være lønsomt for mejeriet. Et forsøggennemføres med en ny lagringsform. I alt lagres der 20 oste og for hver ost noteres den tid, der er medgåettil, at osten har samme kvalitet som efter den gamle metode.I gennemsnit skulle ostene ligge 1.170 timer til lagring.Er det rimeligt at antage, at der er forskel mellem den gamle og den nye lagringsmetode?Det oplyses at stikprøvevariansen blev beregnet til 144. 22
25. 25. Hypotesetest af µ, σ, p og λOpgave 49Et revisionsfirma har konstateret ved en stikprøve på 370 bilag, at 5 % af bilagene var fejlposteret.Normalt oplever man kun en fejlprocent på 4. Giver stikprøven anledning til at tro at fejlprocenten er steget?Opgave 50En virksomhed indfører et akkordsystem som aflønningsform. Det viser sig efter en forsøgsperiode på enuge, at produktionen i gennemsnit pr. medarbejder er steget fra de normale 1.208 stk. til 1.215 stk. med enberegnet standardafvigelse på 16.50.1 Diskuter om en sådan forsøgsperiode er egnet som stikprøvegrundlag.50.2 Antag at forsøget omfattede 14 medarbejdere og konkluder på denne baggrund, om der er grundlag for at antage at effektiviteten er steget.50.3 Antag at forsøget omfattede 75 medarbejdere og konkluder på denne baggrund, om der er grundlag for at antage at effektiviteten er steget.50.4 Antag at forsøget omfattede 75 medarbejdere og konkluder på denne baggrund, om der er grundlag for at antage at der er forskel i effektiviteten.Opgave 51Over en periode på 5 dage, er der konstateret følgende antal driftsafbrydelser i en virksomheds edb-system:7, 5, 9, 8, 7.Normalt kalkulerer man med gennemsnitlig 6 driftsafbrydelser pr. dag.Er der grundlag for at foretage et dyberegående check af edb-systemet?Opgave 52Det er vigtigt ved fremstilling af fløde, at fedtprocenten er nogenlunde konstant. Man følger denkvalitetsnorm, at der i FLØDE-11 skal være en gennemsnitlig fedtprocent på 11 % og en standardafvigelsepå højst 1,5.En stikprøvekontrol har vist, at der blandt 25 tilfældigt udvalgte kartoner var en gennemsnitlig fedtprocent på12 med en standardafvigelse på 2. Giver dette anledning til at justere produktionsapparatet?Blandt de 25 kartoner fløde var der 15, der havde en fedtprocent over 11. Blandemaskinen, der sørger for denrigtige fedtprocent, arbejder normalt således, at andelen af de kartoner, der har en fedtprocent over 11, er0,50.Giver stikprøveresultatet anledning til at tro at maskinen er ude af justering, det vil sige blander således, atpopulationsandelen er forskellig fra 0,50.Opgave 53Den seneste tids debat omkring produktionsforholdene på de store svinefarme, hvor det er antydet, atsvinenes specielle levevilkår påvirker kødkvaliteten, har animeret ledelsen på et større slagteri til ativærksætte en undersøgelse, der skal af- eller bekræfte denne antydning.Man har i samråd med slagteriets veterinærgruppe besluttet, at undersøgelsen skal omfatte to aspekter vedkødkvaliteten, dels andelen af svin, der er salmonellainficeret, dels kødets gennemsnitlige fedtprocent.Undersøgelsen udføres som en stikprøveundersøgelse, hvor svin fra svinefarmen sammenlignes med svin frade små producenter.Der udtages en simpel tilfældig stikprøve af svin fra henholdsvis svinefarmen og fra de små producenter.Resultatet af stikprøverne er vist i tabel 1. 23
26. 26. Hypotesetest af µ, σ, p og λ Tabel 1: Salmonellainficerede svin og gennemsnitlig fedtprocent for svin produceret under henholdsvis små- og stordrift Stikprøvestørrelse Antal svin der er Gennemsnitlig Standardafvigelse salmonellainficeret fedtprocent for fedtprocent Svinefarme 500 35 35,2 1,8 Små producenter 300 15 32,1 1,553.1 Giver stikprøveundersøgelsen grundlag for at påstå, at der er forskel i andelen af salmonellainficerede svin blandt svin opdrættet på svinefarmen og svin opdrættet hos de små producenter?53.2 Undersøg ved en test på 5 % niveauet, om andelen af salmonellainficerede svin blandt svin opdrættet på svinefarmen er mindst 1 procentpoint større end svin opdrættet hos de små producenter?53.3 Udarbejd et 95 % konfidensinterval for andelen af salmonellainficerede svin.53.4 Inden for hvilke grænser må man med 95 % sikkerhed forvente, at det årlige antal salmonellainficerede svin er beliggende, når det oplyses, at årsproduktionen er på 80.000 svin?53.5 Undersøg om den gennemsnitlige fedtprocent for svin leveret af de små producenter er lavere end fedtprocenten i svin leveret af svinefarmen.53.6 Undersøg ved en test på 10 % niveauet om svin leveret af de små producenter har en gennemsnitlig fedtprocent som er mere end 3 procentpoint lavere end fedtprocenten i svin leveret af svinefarmen.53.7 Hvis de viste gennemsnit og standardafvigelser i tabel 1 havde været baseret på stikprøver med 21 svin fra svinefarmen og 40 svin fra de små producenter, hvad er da svaret på opgave 53.5?For nylig henvendte slagteriarbejdernes tillidsmand sig til ledelsen og klagede over, at arbejdsskaderne varfor hyppige, og at dette skyldtes slagteriets akkordsystem. Som argument for, at akkordsystemet var denskyldige faktor, henviste han til et konkurrerende slagteri, der i stedet for akkordaflønning anvendte etbonussystem, hvilket affødte langt færre arbejdsskader.Ledelsen og tillidsmanden bliver enige om, at lønsystemets indvirkning på antal arbejdsskader børundersøges nøjere. Indhentede oplysninger fra slagteriet og fra konkurrenten viser, at der i det sidste år harværet 12 arbejdsskader på slagteriet og 8 hos konkurrenten.53.8 Undersøg om der er forskel i antal arbejdsskader pr. år mellem slagteriet og konkurrenten. Hvilke forudsætninger må være opfyldt for at din konklusion er anvendelig?En af de store svinefarme har eksperimenteret med forskellige foderstoffer med det formål at nedbringefedtprocenten for slagtesvinene. Man har afprøvet 3 foderblandinger på nogle tilfældigt udvalgte svin.Resultatet af eksperimentet fremgår af følgende tabel: Tabel 2: Fedtprocent ved forskellig foderblanding Foderblanding A Foderblanding B Foderblanding C fedtprocent fedtprocent fedtprocent 25 30 27 30 31 28 28 33 35 26 27 25 36 29 29 33 35 28 30 38 26 32 38 32 28 29 31 32 2553.9 Afgør ved en test på 5 % niveauet, om der er forskel på de 3 foderblandinger med hensyn til virkningen på svinenes fedtprocent. 24
27. 27. Hypotesetest af µ, σ, p og λOpgave 54Et udenlandsk pengeinstitut AML har nylig oprettet filialer i Danmark og i denne forbindelse har degennemført en markedsanalyse i form af en spørgeskemaundersøgelse, hvor respondenterne var udvalgttilfældigt fra målgruppen. Undersøgelsen omfattede 1100 personer, hvor 660 personer var 30 år eller ældre.Et af spørgsmålene i spørgeskemaet var, om de benyttede netbank. Resultatet af undersøgelsen med hensyntil dette spørgsmål ses af følgende tabel Respondent Benytter netbank (%) Benytter ikke netbank (%) I alt under 30 år 45 55 100 30 år eller ældre 40 60 100Giver undersøgelsen grundlag for at påstå, at andelen som benytter netbank er større for aldersgruppen under30 år end for aldersgruppen på 30 år eller ældre. Benyt et testniveau på 5 % og kommenter testniveauetsbetydning for din konklusion.Opgave 55Et skadesforsikringsselskab har for en bestemt policetype inddelt deres kunder i 3 forskellige risikogrupper,alt afhængig af i hvilket område de bor. Hvert år opdaterer selskabet skadesrisikoen for hver af de 3risikogrupper, på grundlag skadesstatistikken for det forgangne år.Resultatet af skadesanmeldelser for det seneste år er følgende: Risikogruppe Antal forsikringstagere Antal skadesanmeldelser A 1012 208 B 1455 295 C 1822 470Påvis på et 5 % testniveau, at der er forskel mellem de 3 risikogrupper, når vi betragter forsikringstagernesskadesfrekvens pr. år.Kommenter rimeligheden i at forsikringsselskabet opretholder de 3 risikogrupper. 25
28. 28. StikprøveteoriStikprøveteoriOpgave 56Et svineslagteri modtager svin fra en række små og middelstore svineproducenter samt fra en enkelt storsvinefarm, der leverer 5 % af alle svin.Den seneste tids debat omkring produktionsforholdene på de store svinefarme, hvor det er antydet atsvinenes specielle levevilkår påvirker kødkvaliteten, har animeret slagteriledelsen til at iværksætte enundersøgelse, der skal af- eller bekræfte denne antydning.Man har i samråd med slagteriets veterinærgruppe besluttet, at undersøgelsen skal omfatte to aspekter vedkødkvaliteten, dels andelen af svin der er salmonellainficeret, dels kødets gennemsnitlige fedtprocent.Undersøgelsen udføres som en stikprøveundersøgelse, hvor svin fra svinefarmen sammenlignes med svin frade små producenter.Der udtages en simpel tilfældig stikprøve af svin fra henholdsvis svinefarmen og fra de små producenter.Resultatet af stikprøverne er vist i følgende tabel.Salmonellainficerede svin og gennemsnitlig fedtprocent forsvin produceret under henholdsvis små- og stordrift Antal svin Stikprøve- Antal svin der er Gennemsnitlig Standardafvigelse i alt størrelse salmonellainficeret fedtprocent for observationernes fedtprocentSvinefarm 22.000 500 35 35,2 1,8Små producenter 38.000 300 15 32,1 1,556.1 Bestem både et punktestimat og et 95 % KI for den gennemsnitlige fedtprocent blandt de i alt 60.000 svin.56.2 Bestem et 95 % KI for den gennemsnitlige fedtprocent blandt de i alt 60.000 svin, men under den forudsætning at stikprøven er ustratificeret. Antag i denne forbindelse at den gennemsnitlige fedtprocent er 34 og at standardafvigelsen er 1,7.56.3 Udarbejd et 95 % KI for andelen af salmonellainficerede svin.56.4 Inden for hvilke grænser må man med 95 % sikkerhed forvente, at det årlige antal salmonellainficerede svin er beliggende?56.5 Antag at standardafvigelserne, med hensyn til fedtprocenten, blandt svin produceret på svinefarme og småproducenter er henholdsvis 2 og 1. Bestem da, hvordan en stikprøve på 1.000 svin skulle fordeles på småproducenter og svinefarme.56.6 Bestem stikprøvestørrelsen, hvis intervallet i 56.2 højst skulle have en bredde på 0,1. Antag at σ kan sættes til 1,7.56.7 Bestem hvor stor en stikprøve der skal udtages, hvis stikprøven i 56.3 skal udtages efter princippet ”optimal stratificering”, og det ønskes at intervalbredden er på 0,02.Opgave 57Blandt en virksomheds 5.200 kunder hører 3.800 til kundekategori I og 1.400 til kundekategori II.Der er udtaget en stikprøve på 150 kunder med henblik på at vurdere deres holdning til en ny serviceordning,som virksomheden vil introducere. 45 kunder ud af 75 fra kategori I synes at ordningen virker god, mens derfra kundekategori II kun var 35 som syntes om den nye ordning.Bestem et 95 % konfidensinterval for andelen af kunder der synes den nye ordning er god. 26
29. 29. StikprøveteoriOpgave 58Et teleselskab udbyder 3 forskellige abonnementstyper A, B og C for internetopkobling.Med henblik på at vurdere kundernes generelle tilfredhed har man foretaget en undersøgelse blandtselskabets 20.000 kunder. Undersøgelsens resultat fremgår af følgende tabel: Abonnementstype Antal kunder Antal kunder Antal kunder som der deltog i svarede at de var undersøgelsen tilfredse Abonnemment A 8.000 290 152 Abonnemment B 6.000 217 130 Abonnemment C 6.000 217 145 I alt 20.000 724 42758.1 Hvilket stratificeringsprincip er der blevet anvendt i undersøgelsen ved udvælgelse af stikprøvens 724 personer?58.2 Bestem et 95 % konfidensinterval for andelen af tilfredse kunder.58.3 Bestem et 95 % konfidensinterval for antallet af tilfredse kunder.Opgave 59Et busselskab har for nylig indført en ny trafikplan og ønsker ved en spørgeskemaundersøgelse at få belyst,om borgerne er tilfredse med den nye trafikplan. I spørgeskemaet skal respondenterne vurdere den nyetrafikplan på en skala fra 1 til 10.Resultatet af undersøgelsen fremgår af følgende tabel: Antal Antal Karakter- Standard-Lokalitet borgere respondenter gennemsnit afvigelseBor i byen 70.000 157 7,5 0,9Bor i nærområde 100.000 157 6,5 1,3Bor i fjernområde 50.000 158 6,1 2,0I alt 220.000 472Estimer den gennemsnitlige karakter for de 220.000 borgere både som et punktestimat og et 95 %konfidensinterval.Opgave 60En brancheforening ønsker at få overblik over andelen af medarbejdere i byggebranchen der erhøjtuddannede (akademiker eller har en kortere videregående uddannelse). En totaloptælling har vist sig atvære nærmest umulig, dels på grund af omkostningsaspektet, men også på grund af praktiske og politiskeaspekter. Man har derfor valgt at udføre undersøgelsen som en stikprøveundersøgelse. Undersøgelsen erforegået på den måde, at der er udvalgt 15 tilfældige byggefirmaer, blandt de i alt 12.056. resultatet afundersøgelsen fremgår af følgende tabel: firma Antal Antal firma Antal Antal firma Antal Antal nr. ansatte højtudd. nr. ansatte højtudd. nr. ansatte højtudd. 1 5 0 6 13 3 11 45 7 2 20 3 7 7 1 12 42 8 3 15 2 8 6 1 13 15 2 4 12 1 9 9 1 14 18 3 5 12 0 10 11 2 15 9 1Udregn et 95 % konfidensinterval for andelen af højtuddannede blandt medarbejderne i byggebranchen. 27
30. 30. Fejltyper og StyrkefunktionFejltyper og StyrkefunktionOpgave 61En producent af vaskemidler fremstiller vaskepulver med tilsætning af blegemiddel. Ved anvendelse afblegemiddel sker der en farveafsmitning, der måles på en skala fra 0 til 100. Det er virksomhedenskvalitetsnorm, at den gennemsnitlige farveafsmitning ikke må overstige 16. Producenten kontrollererløbende kvaliteten gennem regelmæssige stikprøvekontroller.En nylig stikprøve, baseret på 48 observationer, har vist en farveafsmitning på 18 og en standardafvigelse på12. Erfaringsmæssigt ved man fra de løbende stikprøvekontroller, at produktionens standardafvigelsen er 10..61.1 Undersøg om det stadig er rimeligt at antage, at produktionens standardafvigelse er 10.I det følgende antages det at produktionens standardafvigelse er 10.61.2 Giver stikprøveresultatet anledning til at betvivle, at virksomhedens kvalitetsnorm er opfyldt?61.3 Opstil et testkriterium baseret på KV x for testen i spm. 61.2.61.4 Bestem styrkefunktionen for den hypotesetest, der er udført i spm. 61.2.Opgave 62Et mindre dagblad blandt den københavnske presse, har igennem flere år haft en konstant læserandel på40 % blandt de studerende på Københavns Universitet.En tilfældig rundspørge blandt de studerende på Københavns Universitet har imidlertid vist en læserandel på35 % for det omtalte dagblad.Det oplyses at undersøgelsen var baseret på 450 studerende.62.1 Giver den omtalte rundspørge belæg for at påstå, at det omtalte dagblad har mistet læserandele blandt de studerende på Københavns Universitet?62.2 Opstil et testkriterium baseret på KVx for testen i spm 62.1.62.3 Bestem størrelsen af type II fejl for den test, der er udført i spm. 62.1, hvis det antages, at den sande andel af læsere er 36 %.Opgave 63En virksomhed fører fortløbende kontrol med de driftforstyrrelser der sker deres intranet pr. uge.Kontrollen udføres på baggrund af det antal driftforstyrrelser der er konstateret for seneste 4 uger. I denneforbindelse testes hypoteserne H0: λ ≤ 5 λ = forventet antal driftforstyrrelser pr. uge H1: λ > 5med et testniveau på 10 %63.1 Beregn styrkefunktionen og bestem sandsynligheden for at begå type 2 fejl, hvis λ = 7.63.2 For de seneste 4 uger er der indtruffet 22 driftforstyrrelser. Skal H0 forkastes? 28
31. 31. Bestemmelse af stikprøvestørrelseBestemmelse af stikprøvestørrelseOpgave 64Et bryggeri fører løbende kontrol med om deres returflasker renses ordentligt i flaskerenserautomaten.Kontrollen foregår ved at de estimerer andelen af ikke-tilfredsstillende rensede flasker.Bryggeriet estimerer denne andel ved hjælp af et 98 % konfidensinterval. De ønsker, at intervalbredden påkonfidensintervallet højst må være 0,04.Bestem den nødvendige stikprøvestørrelse der skal til for at opfylde bryggeriets krav.Opgave 65En cementfabrik producerer cementsække med en garanti for, at den gennemsnitlige vægt pr. sæk er på 50kg.Ved hjælp af stikprøvekontrol fører cementfabrikken løbende kontrol med, at cementsække overholdervægtgarantien. Kontrollen udføres ved hjælp af et intervalestimat med en sikkerhed på 95 %.Antag at standardafvigelsen med hensyn til sækkenes vægt er 5 kg.Bestem stikprøvestørrelsen, når cementfabrikken vil estimere den gennemsnitlige vægt pr. sæk med enpræcision på ± 1 kg.Opgave 66En bankfilial i en større provinsby med 12.000 kunder ønsker at estimere andelen af disse, som er tilfredsemed givne service, som filialen yder. Man vil derfor iværksætte en spørgeskemaundersøgelse, hvor kundernebliver spurgt, om de er tilfredse med servicen.Hvis filialen vil estimere denne andel ved hjælp af et 97 % konfidensinterval, der maksimalt må havebredden 0,10, hvor stor en stikprøve skal der så udtages?Opgave 67Den omtalte filial i opgave 53 stiller det krav til serviceniveauet, at mere end 75 % af kunderne skal væretilfredse.De vil derfor foretage en test af hypoteserne H0: p ≤ 0,75 H1: p > 0,75med et testniveau på α = 0,05.Hvis den sande andel p er på p1 = 0,80, ønsker de kun at acceptere H0 med en sandsynlighed på maksimalt5 %.Bestem den stikprøvestørrelse der skal til for at opfylde filialens krav.Opgave 68En virksomhed opererer med 3 kundesegmenter A, B og C. De ønsker at estimere graden af tilfredshed meden ny serviceordning og ønsker at bestemme den stikprøvestørrelse der skal til for at opnå en maksimalfejlmargin på 0,1 ved et 95 % konfidensinterval. I spørgeskemaet bliver kunderne bedt om at vurderetilfredsheden med den nye serviceordning på en skala fra 1 til 10. Oplysninger fra virksomhedenskundestatistik samt resultatet af forrige undersøgelsen fremgår af følgende tabel: Antal kunder i Resultat af forrige tilfredshedsundersøgelseKundesegment kundesegment Antal kunder Gennemsnit Standardafvigelse A 10.000 260 8,2 1,2 B 15.000 380 8,1 1,5 C 25.000 460 7,6 2,168.1 Bestem stikprøvestørrelsen såfremt man vil udtage en stikprøve efter det proportionale princip.68.2 Bestem stikprøvestørrelsen såfremt man vil udtage en stikprøve efter det optimale princip. 29
32. 32. 30
34. 34. Opgavesæt med progressiv emneoptagelseOpgavesæt med progressiv emneoptagelse (U-opgaver)U-opgaverne 1 til 9 inddrager gradvis følgende emner i den givne rækkefølge: Sandsynlighedsregning Stokastiske variable – forventning og varians Modeller og fordelinger Estimation Multinomiske modeller Regressionsanalyse Test af populationsparammetrene µ, σ, p og λ Stikprøveteori Styrkefunktion og fejltyper Bestemmelse af stikprøvestørrelseFU-opgaverne 1 til 5 inddrager gradvis visse af bogens emner i følgende rækkefølge: Sandsynlighedsregning Stokastiske variable – forventning og varians Modeller og fordelinger Estimation Test af populationsparammetrene µ, σ, p og λEn naturlig fortsættelse af disse opgavesæt findes i U-opgaver i form af sættene 4 til 9.Det skal bemærkes at en del af FU-opgaverne er identiske med U-opgaverne. 32
35. 35. Opgavesæt med progressiv emneoptagelse U1Sæt U1Opgave 1Turistbureauet FIN STRAND udlejer sommerhuse på den jyske vesterhavskyst. Bureauet har udregnetsandsynligheder for at bestemte kundegrupper vælger at leje bestemte typer sommerhuse. Af tabel 1 fremgårdisse sandsynligheder.Tabel 1: Sandsynligheden for, at en vilkårlig turist tilhører en bestemt nationalitet og samtidig bor i en bestemt kategori sommerhus. Kategori 1 Kategori 2 Kategori 3 Tabel 2 Uden havudsigt Med havudsigt Med havudsigt I alt og jacuzzibadDanskere 0,08 0,22 0,10 0,40(Primær kundegruppe )Tyskere 0,07 0,24 0,19 0,50(Primær kundegruppe )Andre 0,05 0,04 0,01 0,10(Sekundær kundegruppe)I alt 0,20 0,50 0,30 1,001.1 Følgende spørgsmål besvares på baggrund tabel 1:a) Bestem sandsynligheden for, at en turist tilhører den primære kundegruppe.b) Bestem sandsynligheden for, at en turist bor i et sommerhus med havudsigt.c) Bestem sandsynligheden for, at en turist både bor i et sommerhus med havudsigt og tilhører den primære kundegruppe.d) På baggrund af resultaterne fra opgave a), b) og c) skal sandsynligheden for, at en turist bor i et sommerhus med havudsigt eller tilhører den primære kundegruppe, bestemmes.e) Bestem sandsynligheden for, at en turist, der tilhører den primære kundegruppe, bor i et sommerhus med havudsigt.f) Undersøg om der er uafhængighed mellem nogle af kundegrupperne og nogle af huskategorierne.1.2 (Oplysninger fra tabel 1 skal anvendes ved løsning af opgaven) Fra bureauets statistikkontor oplyses det, at familier med børn udgør 60 % af gruppen tyske turister. Endvidere oplyses det, at familier med børn udgør 40 % af samtlige turister. Bestem sandsynligheden for at en familie med børn tilhører gruppen af tyske turister.1.3 Bureauet har 25 sommerhuse i kategori 3. 10 af de 25 sommerhuse har installeret satellit-tv. En gruppe på 5 tyske familier har hver lejet et sommerhus i kategori 3. Bestem sandsynligheden for at 3 af familierne bor i et sommerhus med satellit-tv. 33
36. 36. Opgavesæt med progressiv emneoptagelse U1Opgave 2En virksomhed sælger to varer A og B. Afsætningen pr. måned af vare A og B betegnes med henholdsvis Xog Y.På baggrund af omfattende interne statistikker kan det antages, at E(X) = 6.700 stk. og VAR(X) = 25.000 E(Y) = 8.200 stk. og VAR(Y) = 10.000Vare A sælges for 10 kr. pr. stk. og vare B sælges for 15 kr. pr. stk.2.1 Bestem den forventede omsætning for vare A.2.2 Bestem standardafvigelsen for omsætningen for vare A.2.3 Bestem den forventede samlede omsætning for vare A og B.2.4 Bestem standardafvigelsen for den samlede omsætning for vare A og B. 34
37. 37. Opgavesæt med progressiv emneoptagelse U2Sæt U2Opgave 1Peter er ansat som sælger i virksomheden Mobixtra A/S. Han er ifølge sin ansættelseskontrakt 100 %provisionslønnet, og afregnes med 70 kr. pr. solgt mobilabonnement.Peter dækker et segment, hvor der forventes at være 20 % sandsynlighed for, at en kontaktet kunde tegner etmobilabonnement.a) Opstil en model der beskriver antal mobilabonnementer Peter kan sælge på en arbejdsdag hvor han har kontaktet 50 potentielle kunder.b) Hvor meget kan Peter forvente at tjene på en arbejdsdag med 50 kundekontakter?c) Beregn sandsynligheden for, at Peter tjener mere end 1.050 kr. på en dag, hvor han har kontaktet 50 kunder.Opgave 2Mobixtra A/S kalkulerer med, at der i gennemsnit opstår 12 transmissionsfejl pr. uge på den forbindelse sommobilabonnementet omfatter.Bestem sandsynligheden for følgende hændelser:a) Der opstår højst 10 transmissionsfejl på en uge.b) Der opstår mindst 15 transmissionsfejl på en uge.c) Der opstår flere end 60 transmissionsfejl på en måned (= 4 uger).Opgave 3Producenten SKIGLIS af skisportsartikler har udviklet en ny sålbelægning til slalomski.Produktionen af ski foregår således, at standardafvigelsen med hensyn til skienes friktion(= gnidningsmodstand), kan antages at være 0,02.Som led i en reklamekampagne ønsker producenten at give en garanti med hensyn til skienes friktion.Bestem den gennemsnitlige friktion µ, skiene skal have, når forhandleren ønsker at garantere, at der er 99 %sandsynlighed for, at friktionen for en vilkårlig ski ikke overstiger 0,10. 35
38. 38. Opgavesæt med progressiv emneoptagelse U2Opgave 4SKIGLIS har udtaget en stikprøve på 12 ski til kontrol. Friktionen for hver ski er målt og fremgår afnedenstående tabel: friktion 0,08 0,14 0,09 0,08 0,11 0,07 0,12 0,11 0,10 0,09 0,10 0,10Undersøg om skienes friktion kan antages at være normalfordelt.Opgave 5Sportsforhandleren i Ulle-Ville forventer at kunne sælge 45 par ski af type A i løbet af en uge.Sportsforhandleren regner med en usikkerhed på salget på 5 par ski, svarende til en standardafvigelse på 5.Salgsprisen for et par ski af type A er 750 kr.a) Bestem forhandlerens forventede omsætning og omsætningens standardafvigelse.Type B er en lidt dyrere ski og af denne forventer forhandleren at sælge 30 par med en standardafvigelse på10 par. Salgsprisen for type B er 1.050 kr. pr. par.b) Bestem den samlede forventede omsætning for begge typer ski og den samlede omsætnings standardafvigelse. 36
39. 39. Opgavesæt med progressiv emneoptagelse U3Sæt U3Opgave 1En større sportsforretning har igennem det sidste halve år mærket en klar fremgang i salget af rulleskøjter.Erfaringsmæssigt kan man regne med, at der i gennemsnit pr. dag sælges 20 par rulleskøjter.1.1 Opstil en model for rulleskøjtesalget og beregn sandsynligheden for at der en tilfældig dag højst sælges 10 par rulleskøjter.Hidtil har det været således at 25 % af kunderne, der købte rulleskøjter, har været førstegangskøbere.1.2 Antag, at der er en sandsynlighed på 25 % for at en tilfældig rulleskøjtekøber er førstegangskøber. Hvad er sandsynligheden for, at der blandt 200 rulleskøjtekøbere er mindst 60 førstegangskøbere?Per Ole Storm Johannes Pedersen, der er nybagt markedsføringsøkonom, mener ikke, at antagelsen om de25 % førstegangskøbere holder længere. Dette skøn baserer han på en selvbestaltet undersøgelse, hvor hanspurgte 100 kunder, om de var førstegangskøbere. Undersøgelsen viste, at 28 % af de adspurgte varførstegangskøbere.1.3 Bestem et 95 % konfidensinterval for andelen af førstegangskøbere og tag stilling til om det gamle skøn stadig er rimeligt.I forretningen sælger man hovedsagelig to typer af skøjter.• Type A: den klassiske model med 4 hjul, der er parvis parallelle• Type B: den nye model med en række med 4 hjulFra gamle statistikker har man kendskab til, at gennemsnitsalderen for dem, der køber type A, er 27 år.Man forbereder nu et reklamefremstød i lokalradioen for type B. For at kunne profilere sig hensigtsmæssigter det nyttigt at kende kundeunderlagets gennemsnitsalder. Til det formål har man indsamlet oplysninger om20 potentielle kunders alder.Undersøgelsens resultat viste en gennemsnitlig alder på 24 år og en standardafvigelse på 6 år.1.4 Opstil et relevant konfidensinterval og konkluder på baggrund af dette om undersøgelsen giver grundlag for at påstå, at den gennemsnitlige alder for publikum der køber henholdsvis type B og type A er forskellige.Opgave 2I den danske superliga i fodbold blev der i 1992 i gennemsnit scoret 2,5 mål pr. kamp.2.1 Angiv en sandsynlighedsfordeling der kan beskrive antal mål pr. kamp.2.2 Under forudsætning af at det gennemsnitlige antal mål pr. kamp stadig er 2,5 , hvad er da sandsynligheden for, at der scores mindst 3 mål i en superligakamp den kommende weekend?2.3 I begyndelsen af sæsonen i 1993 blev der for de første 20 kampe scoret 2,8 mål pr. kamp. Vurder på baggrund af et 95 % konfidensinterval for det gennemsnitlige antal mål pr. kamp, om det gennemsnitlige antal mål pr. kamp er ændret i forhold til 1992. 37
40. 40. Opgavesæt med progressiv emneoptagelse U4Sæt U4Opgave 1I brevduekredse er det kendt, at 40 % af de duer, der flyver kapflyvning, har daggamle unger.Bestem sandsynligheden for, at der ud af 200 duer er mindst 100 duer, der har daggamle unger.Opgave 2Ved køb af “no name” disketter har man erfaring for, at sandsynligheden for, at en diskette er defekt er 0,10.Bestem sandsynligheden for, at der blandt 100 disketter højst er 5 defekte.Opgave 3Gennem en lang årrække har man erfaring for, at der i gennemsnit opstår 150 brande i beboelsesejendomme iDanmark pr. år. Argumenter for den valgte models forudsætninger og bestem derefter sandsynligheden for,at der i et år opstår flere end 160 brande.Opgave 4Ud af 20.000 beboere i Vejle er der 5.000, der har kæledyr. Bestem sandsynligheden for, at der i en stikprøvepå 200 beboere er mindst 75, der holder kæledyr.Opgave 5Fedtprocenten i et bestemt mærke af hakket oksekød er i gennemsnit 15. Man regner med en usikkerhed påfedtprocenten ± 1,5. Bestem sandsynligheden for, at en tilfældig pakke oksekød har en fedtprocent, der erstørre end 16.Opgave 6En stikprøve på 35 ski er udtaget til kontrol. Friktionen for hver ski er målt og fremgår af nedenstående: Friktion 0,091 0,098 0,085 0,130 0,112 0,087 0,122 0,070 0,124 0,107 0,110 0,117 0,115 0,115 0,087 0,120 0,114 0,097 0,126 0,096 0,101 0,076 0,103 0,111 0,094 0,100 0,099 0,083 0,114 0,078 0,142 0,106 0,097 0,083 0,101Undersøg om skienes friktion kan antages at være normalfordelt. Angiv tillige et punktestimat for dengennemsnitlige friktion samt et punktestimat for standardafvigelsen med hensyn til skienes friktion.Opgave 7På baggrund af observationerne i opgave 6 skal du opstille et 95 % konfidensinterval for den gennemsnitligefriktion. 38
41. 41. Opgavesæt med progressiv emneoptagelse U4Opgave 8På baggrund af observationerne i opgave 6 skal du opstille et 90 % konfidensinterval for den andel af ski, derhar en friktion på 0,10 eller mindre.NB! Selv om evt. approksimationsbetingelser ikke er overholdt, skal konfidensintervallet udarbejdes ogkommenteres.Opgave 9På Lolland har roedyrkerne været udsat for svampeangreb. En nylig undersøgelse, omfattende 100 landmændder havde svampeangreb, tyder på, at svampeangrebet har hærget med forskellig geografisk styrke.Blandt de 100 landmænd viste det sig, at 30 % boede i området vest for Maribo, 40 % boede i området sydfor Maribo, og 30% boede i området øst for Maribo.Er undersøgelsesresultatet statistisk signifikant, det vil sige, er det rimeligt at påstå, at de omtalte områderpå Lolland angribes med forskellig styrke af svampe?Opgave 10Undersøgelsen over svampeangreb på Lolland viste yderligere, hvordan graden af svampeangrebet varfordelt på geografisk område. Graden af svampeangreb, som den enkelte landmand var udsat for, blev opdelti to kategorier:• Stærkt angrebet – mere end 20 % af roeavlen var angrebet• Moderat angrebet – 20 % eller mindre af roeavlen var angrebetUndersøgelsen resulterede i følgende fordeling: V. Maribo S. Maribo Ø. Maribo I alt Stærkt angrebet 10 15 15 40 Moderat angrebet 20 25 15 60 I alt 30 40 30 100Tyder undersøgelsen på, at der er forskel i ”angrebsstyrken” med hensyn til geografisk bosted? 39
42. 42. Opgavesæt med progressiv emneoptagelse U5Sæt U5Opgave 1Mecontent indkøber komponenter fra en leverandør, der garanterer for kvaliteten; derfor skal defektekomponenter blot returneres. Inden for det sidste år har Mecontent måttet returnere et stigende antalkomponenter, hvilket af og til har medført produktionsstop. Mecontent har netop fået leveret et parti på20.000 komponenter og beslutter at undersøge leverancen nærmere.Der udtages en stikprøve på 1 % af leverancen. Det viser sig, at der er 25 defekte komponenter i dennestikprøve.1.1 Giv et begrundet forslag til en stokastisk model, der kan beskrive antal defekte i stikprøven.1.2 Estimer andelen af defekte i varepartiet og beregn et konfidensinterval for defektandelen.Mecontent er utilfreds med den store defektandel, men leverandøren påstår, at defektandelen i hele partiethøjst er 0,10.1.3 Vurder på baggrund af spørgsmål 1.2 om leverandøren kan have ret.1.4 Antag, at defektandelen er 0,1. Udregn på denne baggrund sandsynligheden for, at der højst er 10 % defekte i stikprøven.Opgave 2På en produktionsvirksomhed er man interesseret i at belyse sandsynligheden for at der opstår arbejdsskader.Man vælger at observere antal arbejdsskader opstået i løbet af en måned. Resultatet af denne undersøgelseviste, at der var 18 arbejdsskader.2.1 Angiv en fordeling der kan beskrive antallet af arbejdsskader opstået i løbet af en måned.2.2 Bestem sandsynligheden for at der opstår 15 eller færre skader i løbet af en måned. Antag, at de 18 arbejdsskader er et godt skøn over det gennemsnitlige antal arbejdsskader pr. måned.Virksomheden anser arbejdstempoet som en mulig årsag til nogle af disse arbejdsskader.For at belyse om denne antagelse kan være rigtig, har virksomheden opgjort den daglige produktion i sammemåned som arbejdsskaderne er opgjort. Resultatet af denne undersøgelse er vist i nedenstående tabel. Produktion i antal stk. 2.3 Undersøg grafisk, om observationerne kan antages 10.200 10.800 9.800 10.600 at være normalfordelte. 11.000 10.200 9.900 10.900 10.800 10.000 10.900 11.000 2.4 Opstil et 95 % konfidensinterval for den gennem- 9.700 11.300 11.100 11.500 snitlige dagsproduktion. 12.400 10.250 12.500 10.400 2.5 Virksomhedens gennemsnitlige dagsproduktion ligger normalt på 10.000. Tyder undersøgelsen på at dette forhold er ændret? 40
43. 43. Opgavesæt med progressiv emneoptagelse U5Opgave 3SKIING har et år tilfældigt udvalgt en stikprøve på 380 kunder og bedt dem om at svare på nogle spørgsmålom deres ferieophold. Kunderne har bl.a. givet en helhedsvurdering af rejsen. Vurderingen er givet som enkarakter mellem 1 og 3, hvor 1 er "Utilfreds", 2 er "Neutral" og 3 er "Tilfreds". Resultatet fremgår af tabellennedenfor. Område Frankrig Italien Schweiz I alt Vurdering Utilfreds 15 35 10 60 Neutral 88 64 29 181 Tilfreds 37 35 67 139 I alt 140 134 106 380Det oplyses, at SKIING det pågældende år havde følgende antal kunder i de tre områder: Område Frankrig Italien Schweiz I alt Antal kunder 3.552 3.103 1.976 8.6313.1 Test på 5 % niveauet, om stikprøven på 380 kunder er repræsentativ med hensyn til område.3.2 Tyder datamaterialet på, at kundernes helhedsvurdering afhænger af, hvilket område de har besøgt?3.3 Angiv et 95 % konfidensinterval for andelen af tilfredse kunder.3.4 Angiv et 95 % konfidensinterval for den gennemsnitlige tilfredshed med området SchweizOpgave 4En maskinstation høster bl.a. raps i hele Sønderjylland. Der er forskel på boniteten i Øst- ogVestsønderjylland, og fra tidligere opgørelser over høstudbyttet har man erfaring for, at det forventedehøstudbytte er:Østsønderjylland: Gennemsnit = 3.300 kg/ha Standardafvigelse = 210 kg/haVestsønderjylland: Gennemsnit = 2.800 kg/ha Standardafvigelse = 330 kg/haFoderstoffirmaet har kontrakt på levering af rapsudbyttet fra 200 ha i Vestsønderjylland og 300 ha iØstsønderjylland.Det oplyses at prisen for 1 kg raps fra Østsønderjylland er 5 kr. og at prisen for 1 kg raps fraVestsønderjylland er 4 kr.4.1 Beregn foderstoffirmaets samlede forventede omkostninger til indkøb af raps.4.2 Beregn standardafvigelsen, der knytter sig til de samlede omkostninger til indkøb af raps. 41
44. 44. Opgavesæt med progressiv emneoptagelse U5Opgave 5En undersøgelse over antallet af fejlopringninger til alarmcentralen er undersøgt over en periode på 40 uger.Resultatet fremgår af nedenstående tabel: Antal Antal fejlopringninger uger pr. uge 0 4 1 12 2 11 3 8 4 eller flere 5 40Undersøg om det kan antages, at antal fejlopringninger pr. uge følger en poissonfordeling medintensitetsparameter λ = 2. 42
45. 45. Opgavesæt med progressiv emneoptagelse U6Sæt U6Opgave 1SOAP producerer vaskepulver af høj kvalitet. De har for nylig introduceret et nyt vaskepulver ”Altid UltraRen”. Marketingchefen hos SOAP, Peter Skarpsyn, mener, at en massiv reklameindsats vil have afgørendebetydning for salget af deres vaskepulver, hvorimod prisen på vaskepulver vil have mindre betydning.SOAP planlægger derfor en større reklameindsats, der skal løbe over længere tid via tv.Med henblik på at vurdere den afsætningsmæssige virkning af prisfastsættelse og reklameindsats har SOAPforetaget en registrering af salget for de sidste 12 måneder.Måned nr. Afsætning i kg Pris pr. kg Reklameindsats i 1.000 kr. 1 4.750 8,00 100 2 4.750 8,00 100 3 4.625 8,25 100 4 4.500 8,25 100 5 4.250 8,50 90 6 4.125 8,50 90 7 4.050 8,75 80 8 4.000 9,00 80 9 4.000 9,00 70 10 4.100 9,25 70 11 3.900 9,25 70 12 3.867 9,50 701.1 Angiv en model der beskriver sammenhængen mellem pris og afsætning.1.2 Test om der er signifikant lineær sammenhæng mellem pris og afsætning.1.3 Angiv en model der beskriver sammenhængen mellem reklameindsats og afsætning.1.4 Test om der er signifikant lineær sammenhæng mellem reklameindsats og afsætning.1.5 Vurder de to modellers forklaringsevne.1.6 Hvis der kun skal angives én forklarende variabel, hvilken model vil du så foreslå?1.7 Opstil en model baseret på både pris og reklameindsats som forklarende variable og undersøg, om denne model giver en væsentlig bedre forklaring end den, du har foreslået i spm. 1.6.1.8 Test om de estimerede koefficienter i modellen fra spm. 1.7 er signifikante og benyt den estimerede model til at forudsige salget, når prisen er 8,50 kr. og reklameindsatsen er 100.000 kr. 43
46. 46. Opgavesæt med progressiv emneoptagelse U6Opgave 2Det er blevet foreslået på baggrund af en tidligere undersøgelse omfattende 10 reklamespot (se nedenfor), aten poissonfordeling kan beskrive sandsynligheden for, at en tilfældig person ser et vist antal reklamespot påTV2. Antal reklamespot Antal personer 0 20 1 50 2 60 3 50 ≥4 20Undersøg og diskuter rimeligheden i denne påstand.Opgave 3Producenten af "Altid Ultra Ren" abonnerer på det såkaldte Markedskort, dvs. en regelmæssig opgørelse afkendskab, loyalitet med videre for produktet. Markedskortet er baseret på en stikprøveundersøgelse blandtmålgruppen for produktet, bestående af 500 personer.For april 1993 og juli 1993 ser oplysningerne på markedskortet for "Altid Ultra Ren" således ud: April 1993 Juli 1993 I alt Kender ikke mærket 110 100 210 Kender mærket og bruger oftest mærket 25 30 55 bruger af og til mærket 150 140 290 bruger ikke mere mærket 80 110 190 har ikke prøvet mærket 135 120 255 I alt 500 500 1.0003.1 Da man netop i april kvartal har gennemført en større kampagne med henblik på at øge prøveandelen, bedes du intervalestimere prøveandelen i henholdsvis april 1993 og juli 1993 og kommentere resultatet. Prøveandelen er defineret som den andel af dem, der kender mærket, som rent faktisk også har prøvet det.3.2 Er markedskortene for de to perioder ens, eller er der sket en forskydning fra april til juli?3.3 Undersøgelser før juli 1993 har alle tydet på, at andelen af målgruppen der ikke kendte "Altid Ultra Ren", har været konstant omkring 22 %. Undersøg ved en test på 5 % niveauet om resultatet i juli 1993 kan tages som et udtryk for, at der er sket et fald i andelen af dem, der ikke kendte mærket.3.4 Undersøgelser før juli 1993 har alle tydet på, at andelene for nedenstående målgrupper har været rimelig konstante og i overensstemmelse med følgende opgørelse: Kender mærket og bruger oftest mærket 10 % bruger af og til mærket 40 % bruger ikke mere mærket 20 % har ikke prøvet mærket 30 % Tyder Markedskortets opgørelse for juli 1993 på, at dette ikke længere er tilfældet? 44