Upcoming SlideShare
×

316 views

Published on

0 Likes
Statistics
Notes
• Full Name
Comment goes here.

Are you sure you want to Yes No
• Be the first to comment

• Be the first to like this

Views
Total views
316
On SlideShare
0
From Embeds
0
Number of Embeds
199
Actions
Shares
0
2
0
Likes
0
Embeds 0
No embeds

No notes for slide
• Ejemplos de dist normal: pesos, salarios, etc. http://www.youtube.com/watch?v=xDIyAOBa_yU http://www.shodor.org/interactivate/activities/NormalDistribution/ Hablar de propiedades; Simetría. Sesgo=0 Las curvas de cualquier distribución de probabilidad están definidas por su media y su desviación estándar La desviación estándar determina el ancho de la curva: los valores más grandes resultan en curvas más anchas P(x=x0) = cero
• Ejemplo: Graficar Ancho de banda vs provedores de servicios http://www.nationmaster.com/graph/int_bro_acc-internet-broadband-access http://www.nationmaster.com/graph/int_int_cha-internet-charges Diferentes medidas… hay que estandarizar!!! The z-score is often called the standardized value. An observation’s z-score is a measure of the relative location of the observation in a data set. A data value less than the sample mean will have a z-score less than zero. A data value greater than the sample mean will have a z-score greater than zero . A data value equal to the sample mean will have a z-score of zero .
• How do you compare apples and oranges? Are you as good a student of French as you are in Physics? How many people did better or worse than you on a test? Are you abnormal or deviant? Should you ask your professor to curve the exam? Each of these questions suggests a comparison . Sometimes when you analyze data, you will need to compare scores within a sample (are you abnormal or deviant?) or across variables (as good in French as Physics). To do so effectively, you will need to present the comparisons in a way that facilitates decision making . You may be asked: What percentage of people falls below a given score? What is the relative standing of a score in one distribution versus another? What score or scores can be used to define an extreme or deviant situation? You can do all of these with the Z-Score!
• An Intuitive Example You enter your dorm room and find that one of your roommates has a happy face, but your other roommate is sad: What&apos;s happened! Why are you so happy? And why are you so sad? Hurray, I got a 60 on the Physics test!!! Wah!, I got a 60 on the French test!!! Why? As student you probably have figured out that the 60 on the French test is bad compared to every one else And the 60 on the Physicis test is good compared to everyone else
• An Intuitive Example The Normal Curve To test out our hunch, we need to be more precise. To do that we need to review the Normal Distribution. That&apos;s how we will compare the French and Physics tests. Data Types For our discussion of the Z-scores, we will be using measurement data (numerical scores). We will need: Measures of central tendency: The mean Measures of variability: standard deviation (SD) Finding Yourself on the Normal Curve Remember the normal curve. It is the shape of many measurement data distributions. The frequency of the scores tends to fall in a very specific shape in the normal distribution. The normal curve is described by its mean (arithmetic average) and SD (average deviation of scores around the mean). This is the normal curve and the line in the middle is the mean (SX/N) . Many frequency distributions in Psychology are normal. Each box on the graph represents a score. In our case it will be an exam score of a particular individual. The red arrow represents the SD.
• The First Big Idea So what does this have to do with the French and Physics tests? The Big Idea! Where you are relative to others in the distribution determines how well you did. Now that you can see the distributions of test scores, explain why your roommates are happy and sad. La prueba de física fue muy difícil con una media de 50. La calificación de 60 fue mejor que el de la mayoría. Con la prueba de Francés la media fue de 70, la calificación de 60 está por abajo de los demás
• The Second Big Idea Now we can quantify your place in a distribution. You don&apos;t have to always draw a picture. We will do this with the Z-Score . Formula:
• The Third Big Idea The SD is a Ruler. Consider the Z-score as the inch marks of the ruler. A Z-Score equals the Number of SDs ; the score is from the mean. Let&apos;s look at the Physics test! We know its mean is 50 . The SD is calculated to be 10 (someone used his or her calculator). Remember the SD is the distance from the mean to the Point of Inflection (change in direction of the curve).
• The Fourth Big Idea What&apos;s our Physics freak roommate&apos;s Z-score and why is she happy? 1. The roommate&apos;s score is 10 points above the mean or one SD above the mean. 2. Her Z-Score Equals 1 because: Z = (Score - Mean)/SD Z = (60 - 50) / 10 Z = 1 Let&apos;s do it again! The student down the hall runs into our gang&apos;s room. She yells, &quot;I got an 84 on the Physics test!!&quot; 1. Her Z-Score equals 3.4 because: Z = (Score - Mean)/SD Z = (84 - 50) / 10 Z = 3.4 This is a bright young person. Let&apos;s look at the Z-Score ruler on the normal curve. She gets a very big happy face She&apos;s done better than almost everyone in the class! Oh, Dear - Now we know why our French-taking roommate is sad! Z = (60 - 70) / 10 Z = -1.0 Her Z-score is negative and below the mean.
• Now, let’s go to our final question. Curving a test means that a professor marks you on a Z-Score basis. If the mean is high do you want the test curved? Think about it. Summary z scores act like a ruler; they place data on a standard scale. z scores express the distance of a single score from the mean in standard deviation units. If data are normally distributed, z scores can be easily turned into percentages. We can use z scores to identify or cut off specific percentages/areas of a distribution. This is useful for hypothesis testing.
• Seventy efficiency apartments were randomly sampled in a small college town. The monthly rent prices for these apartments are listed in ascending order. Skewness=S=3(media-mediana)/DesvEst Skewness= sum(xi-med)al cubo/n
• A random variable having a normal distribution with a mean of 0 and a standard deviation of 1 is said to have a standard normal probability distribution . We can think of z as a measure of the number of standard deviations x is from u . Enfatizar probabilidades. De hecho ejercicio a realizar
• Pep Zone sells auto parts and supplies including a popular multi-grade motor oil. When the stock of this oil drops to 20 gallons, a replenishment order is placed. The store manager is concerned that sales are being lost due to stockouts while waiting for an order. It has been determined that demand during replenishment lead-time is normally distributed with a mean of 15 gallons and a standard deviation of 6 gallons. The manager would like to know the probability of a stockout, P ( x &gt; 20).
• By raising the reorder point from 20 gallons to 25 gallons on hand, the probability of a stockout decreases from about .20 to .05. This is a significant decrease in the chance that Pep Zone will be out of stock and unable to meet a customer’s desire to make a purchase.
• Seis automóviles. Se usan sólo dos para evoitar averias Promedio de rendimiento 30 y 32 kmpl. Desv esta= s/raiz(n)
• 1- seleccionar población normal con un tamaño de muestra de 5. Seleccionar la media como el estadístico de muestra y generar 1000 muestras. Pregunta al grupo: la media y la desv. estand. de la muestra cae dentro de el error de la media de la población y el error estándar? (calculado de la población desv. estand/raiz(5)) Describe una curva normal la distribución de muestreo? 2- seleccionar población normal con un tamaño de muestra de 5. Seleccionar la DESVIACIÓN ESTÁNDAR como el estadístico de muestra y generar 1000 muestras. Pregunta al grupo: la media de la muestra cae dentro de el error de la media de la población? Describe una curva normal la distribución de muestreo? 3- Repetir 1 utilizando una curva exponencial 4- Repetir 1 utilizando una curva exponencial y un tamaño de muestra de 20. Hace esto que la forma de la distribución parezca más a la normal? 5- forma una ditribución customizada en donde la forma de distribución de muestreo no siga una curva normal, utilice un tamaño de 20. Aumenta a 500 los valores de muestreo de la media. 6- Incrementa a 100 el tamaño de la muestra. Muestrea 100 (ó mpas si la paciencia se está acabando) . Describe una curva normal la distribución de muestreo?
• ¿de qué hemos estado hablando?,  media muestral; estimador puntual de la media poblacional Generar con excel PHStat, números aleatorios 10 muestras/5000 números checar la diferencia entre las medias muestrales y la poblacional Un estimador puntual no provee un valor exacto del parámetro poblacional. El propósito de una estimación del intervalo es proveer información acerca de que tan cerca el estimador está del valor del parámetro.
• We refer to such cases as the  known case. Cuando no se conoce dev estad poblacional se puede usar la media muestral si la muestra es grande (n&gt;30)
• Sx=1.96(.8)/raiz(n)=1.95(.8)/raiz(50) = .22 .8 se asume
• 95% de lo valores de una variable aleatoria con distribución normal quedan dentro una distancia = 1.96 desv est de la media 90% =1.645 99% =2.576 =&gt; Nivel de confianza a a/2 Za/2 90% 0.10 0.05 1.645 95% 0.05 0.025 1.960 99% 0.01 0.005 2.576 Hay un 1   de probabilidad de que el valor de una media muestral provea un margen de error de a/2 o menos.
• Discount Sounds has 260 retail outlets throughout the United States. The firm is evaluating a potential location for a new outlet, based in part, on the mean annual income of the individuals inthe marketing area of the new location. A sample of size n = 36 was taken; the sample mean income is \$31,100. The population is not believed to be highly skewed. The population standard deviation is estimated to be \$4,500, and the confidence coefficient to be used in the interval estimate is .95.
• Thus, at 95% confidence, the margin of error is \$1,470. We are 95% confident that the interval contains the population mean.
• This is the  unknown case. (We’ll assume for now that the population is normally distributed.)
• (June 13, 1876 – October 16, 1937) before reading chemistry and mathematics at New College, Oxford. On graduating in 1899, he joined the Dublin brewery of Arthur Guinness &amp; Son.
• Hacer la demo de t cuando va a infinito en excel =DISTR.T.INV(2*Prob,GL) con =DISTR.T.INV(2*0.025,100)= 1.98397147 (ojo la probabilidad es de 0.025) comparando con = =DISTR.NORM.ESTAND.INV(1-Prob) Ojo: La distr.norm.estand.inv da la acumulada por lo que hay que restar 1- prob . La distr.t.inv viene de dos colas por lo que hay que multiplicar por dos la probabilidad
• Hablar de Tuercas, para qué sirve?
• http://www.stats.gla.ac.uk/steps/glossary/hypothesis_testing.html The null hypothesis, H0, represents a theory that has been put forward, either because it is believed to be true or because it is to be used as a basis for argument, but has not been proved The null hypothesis is an hypothesis about a population parameter.
• Testing Research Hypotheses The research hypothesis should be expressed as the alternative hypothesis. The conclusion that the research hypothesis is true comes from sample data that contradict the null hypothesis. 1- en una investigación la Hipótesis bajo investigación se pone como la hipótesis alternativa Testing the Validity of a Claim Manufacturers’ claims are usually given the benefit of the doubt and stated as the null hypothesis. The conclusion that the claim is false comes from sample data that contradict the null hypothesis. 1- Cuando alguien afirma algo, se pone como la Hipótesis Nula. Testing in Decision-Making Situations . A decision maker might have to choose between two courses of action, one associated with the null hypothesis and another associated with the alternative hypothesis. Example: Accepting a shipment of goods from a supplier or returning the shipment of goods to the supplier
• Subir ejercicio. Traer vasos desechables Pesa electrónica

1. 1. Sesión 3Sesión 3TLC,TLC,Intervalos de Confianza yIntervalos de Confianza ypruebas de Hipótesispruebas de HipótesisEstadística en lasorganizaciones AD4001Dr. Jorge Ramírez Medina
3. 3. Dr Jorge Ramírez MedinaEGADE Business SchoolValores ZSe interpreta como la cantidad de desviacionesSe interpreta como la cantidad de desviacionesestándar que dista xestándar que dista xii del promedio.del promedio.sxxz ii−=
6. 6. Para entender;Grafiquémoslo• Tipo de datos– Numéricos– Medidas de tendencia central (media)– Medidas de variabilidad (desviación estándar)Dr Jorge Ramírez MedinaEGADE Business School
10. 10. Cuarta ideaDr Jorge Ramírez MedinaEGADE Business SchoolZ = (Score - Mean)/SDZ = (60 - 50) / 10Z = 1Z = (Score - Mean)/SDZ = (84 - 50) / 10Z = 3.4Z = (60 - 70) / 10Z = -1.0
11. 11. Z-scores• Z-score puede ser positivo o negativo– Positivo es arriba de la media– Negativo es abajo de la media• La media de un Z-score es siempre cero• Si se tiene el promedio, el Z-score =0• La desviación estándar de una distribución Z =1Dr Jorge Ramírez MedinaEGADE Business School
12. 12. Dr Jorge Ramírez MedinaEGADE Business School425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460 465 465465 470 470 472 475 475 475 480 480 480480 485 490 490 490 500 500 500 500 510510 515 525 525 525 535 549 550 570 570575 575 580 590 600 600 600 600 615 615Para el ejemplode la sesión 1= .865
13. 13. Dr Jorge Ramírez MedinaEGADE Business SchoolValores z• z-Score del valor más pequeño (425)-1.20 -1.11 -1.11 -1.02 -1.02 -1.02 -1.02 -1.02 -0.93 -0.93-0.93 -0.93 -0.93 -0.84 -0.84 -0.84 -0.84 -0.84 -0.75 -0.75-0.75 -0.75 -0.75 -0.75 -0.75 -0.56 -0.56 -0.56 -0.47 -0.47-0.47 -0.38 -0.38 -0.34 -0.29 -0.29 -0.29 -0.20 -0.20 -0.20-0.20 -0.11 -0.01 -0.01 -0.01 0.17 0.17 0.17 0.17 0.350.35 0.44 0.62 0.62 0.62 0.81 1.06 1.08 1.45 1.451.54 1.54 1.63 1.81 1.99 1.99 1.99 1.99 2.27 2.27Valores estandarizadosValores estandarizados
18. 18. zz = (= (xx -- µµ)/)/σσ= (20 - 15)/6= (20 - 15)/6= .83= .83Paso 1: ConviertaPaso 1: Convierta xx a la distribución normal estándara la distribución normal estándarElTuercas5w-20Motor OilPaso 2: encuentre el área bajo la curva normalPaso 2: encuentre el área bajo la curva normalestandarizada a la izquierda de z = .83.estandarizada a la izquierda de z = .83.Distribución deDistribución deprobabilidadprobabilidadNormal estandarizadaNormal estandarizadaDr Jorge Ramírez MedinaEGADE Business School
19. 19. Tabla de probabilidad acumulada para la distribuciónnormal estandarizadaz .00 .01 .02 .03 .04 .05 .06 .07 .08 .09. . . . . . . . . . ..5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389. . . . . . . . . . .P(z < .83)P(z < .83)Distribución deDistribución deprobabilidadprobabilidadNormal estandarizadaNormal estandarizadaElTuercas5w-20Motor Oilhttp://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htmDr Jorge Ramírez MedinaEGADE Business School
20. 20. P(z > .83) = 1 – P(z < .83)P(z > .83) = 1 – P(z < .83)= 1- .7967= 1- .7967= .2033= .2033Step 3: Calcule el área bajo la curva normal estandara la derecha de z = .83.Probabilidad deProbabilidad defaltantesfaltantes P(x > 20)P(x > 20)ElTuercas5w-20Motor OilDistribución deDistribución deprobabilidadprobabilidadNormal estandarizadaNormal estandarizadaDr Jorge Ramírez MedinaEGADE Business School
24. 24. Paso 1: encuentre el valor de z que corta un área de .05en la cola derecha de la distribución normalestándar.z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09. . . . . . . . . . .1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .94411.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .95451.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .96331.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .97061.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767. . . . . . . . . . .Buscamos el complemento de elBuscamos el complemento de elárea en la cola (1 - .05 = .95)área en la cola (1 - .05 = .95) ElTuercas5w-20Motor OilDistribución deDistribución deprobabilidadprobabilidadNormal estandarizadaNormal estandarizadaDr Jorge Ramírez MedinaEGADE Business School
25. 25. paso 2: Convierta z.05 al correspondiente valor de x.x = µ + z.05σ= 15 + 1.645(6)= 24.87 o 25Un punto de reorden de 25 litros llevará la probabilidadde faltantes durante el reabasto (poco menos de) .05.ElTuercas5w-20Motor OilDistribución deDistribución deprobabilidadprobabilidadNormal estandarizadaNormal estandarizadaDr Jorge Ramírez MedinaEGADE Business School
26. 26. Distribución de muestreode la media muestral• Es la distribución de probabilidad de lapoblación de todas las posibles mediasmuestrales que pueden ser obtenidas detodas las posibles muestras del mismotamaño.Dr. Jorge Ramírez MedinaEGADE Business School
27. 27. Forma de distribuciónForma de distribuciónmuestral demuestral de xDr Jorge Ramírez MedinaEGADE Business School
28. 28. Si se usa una muestra aleatoria simple grande(n > 30) el teorema del límite central nos permiteconcluir que la distribución de puede seraproximada como una distribución normal.Cuando la muestra aleatoria simple es pequeña(n < 30), la distribución de muestreo de puede serconsiderada normal sólo si asumimos que lapoblación tiene una distribución normal.Forma de distribuciónForma de distribuciónmuestral demuestral de xDr Jorge Ramírez MedinaEGADE Business Schoolxx
29. 29. UnaUna estimación del intervaloestimación del intervalo se puede calcularse puede calcularpor sumar y restar unpor sumar y restar un margen de errormargen de error del estimadordel estimadorpuntual:puntual:Estimador puntual +/- Margen de ErrorMargen de Error yMargen de Error yestimación de intervalosestimación de intervalosPor ejemplo la forma general de una estimación delPor ejemplo la forma general de una estimación delintervalo para una media poblacional es:intervalo para una media poblacional es:Margen de Error±Dr Jorge Ramírez MedinaEGADE Business Schoolx
30. 30. Estimación de intervalo deEstimación de intervalo dela media de una Poblaciónla media de una Población :σ conocidaconocida El margen de error puede ser calculado con:– La desviación estándar de la población σ , o– La desviación estándar de la muestra s σ raramente se conoce con exactitud, sepueden obtener estimados de datoshistóricos.Dr Jorge Ramírez MedinaEGADE Business School
31. 31. Para el ejemplo de losautosDr. Jorge Ramírez MedinaEGADE Business School
32. 32. µµαα/2/2 αα/2/2Estimación de intervalo deEstimación de intervalo dela media de una Población :la media de una Población :σ conocidaconocidaxDr Jorge Ramírez MedinaEGADE Business SchoolDistribución deDistribución deMuestreo deMuestreo de1 - α detodos los valoresde xxz σα 2/ xz σα 2/intervalointervaloincluyeincluye mmintervalointervalononoincluyeincluye mmhttp://onlinestatbook.com/stat_sim/conf_interval/index.html
33. 33. • Estimación de intervalo de µdonde: es la media muestral1 -α es el coeficiente de confidenciazα/2 es el valor z que provee un área deα/2 en la cola superior de la distribuciónde probabilidad normal estandarizadaσ es la desviación estándar de la poblaciónn es el tamaño de la muestraEstimación de intervalo deEstimación de intervalo dela media de una Población :la media de una Población :σ conocidaconocidaxDr Jorge Ramírez MedinaEGADE Business Schoolnzxσα 2/±
34. 34. • Selección del tamaño de la muestraen la mayoría de las aplicaciones, un tamaño deen la mayoría de las aplicaciones, un tamaño demuestra de n = 30 es adecuado.muestra de n = 30 es adecuado.Si la distribución de la población es de un alto sesgoSi la distribución de la población es de un alto sesgoo contiene outliers, se recomienda un tamaño deo contiene outliers, se recomienda un tamaño demuestra de 50 ó más.muestra de 50 ó más.Estimación de intervalo deEstimación de intervalo dela media de una Población :la media de una Población :σ conocidaconocidaDr Jorge Ramírez MedinaEGADE Business School
35. 35. • Selección del tamaño de la muestrasi la población no está normalmente distribuida perosi la población no está normalmente distribuida peroes simétrica (+/-) un tamaño de muestra pequeñoes simétrica (+/-) un tamaño de muestra pequeñode 15 es suficiente.de 15 es suficiente.Si se cree que la distribución de la población esSi se cree que la distribución de la población esaproximadamente normal, se puede utilizar unaproximadamente normal, se puede utilizar untamaño de muestra de menos de 15.tamaño de muestra de menos de 15.Estimación de intervalo deEstimación de intervalo dela media de una Población :la media de una Población :σ conocidaconocidaDr Jorge Ramírez MedinaEGADE Business School
36. 36. • Ejemplo: DiscoSuenaEstimación de intervalo deEstimación de intervalo dela media de una Población :la media de una Población :σ conocidaconocidan=36U= \$31,100S= \$4,500Intervalo de confianza del 95%xσDr Jorge Ramírez MedinaEGADE Business School
37. 37. 95% de las medias muestrales, están dentro deun + 1.96 de la media poblacional µ.σ xEl margen de error es:Estimación de intervalo deEstimación de intervalo dela media de una Población :la media de una Población :σ conocidaconocidaLa estimación del intervalo para µ es:\$31,100 + \$1,470o\$29,630 to \$32,570470,136500,496.12/ ==nzσαDr Jorge Ramírez MedinaEGADE Business School
38. 38. • Si no se puede tener un estimado de ladesviación estándar de la población σ se utiliza ladesviación estándar s de la muestra para estimar σ .• En este caso, la estimación del intervalo para µ estábasada en la distribución t.Estimación de intervalo deEstimación de intervalo dela media de una Población :la media de una Población :σ desconocidadesconocidaDr Jorge Ramírez MedinaEGADE Business School
39. 39. La distribución t es una familia de distribuciones deLa distribución t es una familia de distribuciones deprobabilidad similares.probabilidad similares.Una distribución t específica depende de unUna distribución t específica depende de unparámetro conocido como grados de libertad.parámetro conocido como grados de libertad.Los grados de libertad se refieren a el número deLos grados de libertad se refieren a el número depiezas independientes de información que se usanpiezas independientes de información que se usanen el cálculo de s.en el cálculo de s.Distribución tDr Jorge Ramírez MedinaEGADE Business School
43. 43. Degrees Area in Upper Tailof Freedom .20 .10 .05 .025 .01 .005. . . . . . .50 .849 1.299 1.676 2.009 2.403 2.67860 .848 1.296 1.671 2.000 2.390 2.66080 .846 1.292 1.664 1.990 2.374 2.639100 .845 1.290 1.660 1.984 2.364 2.626.842 1.282 1.645 1.960 2.326 2.576∞Valores znormal estandarizadosDistribución tDr Jorge Ramírez MedinaEGADE Business School
44. 44. Pruebas de hipótesisPruebas de hipótesis• Una cola– Cola superior– Cola inferiorσ conocidaσ desconocida• Dos colasσ conocidaσ desconocidaDr Jorge Ramírez MedinaEGADE Business Schoolα = .10Reject H0Do Not Reject H0zz
45. 45. Hipótesis nula yalternativa Hypothesis testing can be used to determine whethera statement about the value of a population parametershould or should not be rejected. The null hypothesis, denoted by H0 , is a tentativeassumption about a population parameter. The alternative hypothesis, denoted by Ha, is theopposite of what is stated in the null hypothesis. The alternative hypothesis is what the test isattempting to establish.Dr Jorge Ramírez MedinaEGADE Business School
46. 46. • Testing Research HypothesesPlanteamiento deHipótesis• The research hypothesis should be expressed asthe alternative hypothesis.• The conclusion that the research hypothesis is truecomes from sample data that contradict the nullhypothesis.Dr Jorge Ramírez MedinaEGADE Business School
48. 48. Type I and Type II ErrorsCorrectDecisionType II ErrorCorrectDecisionType I ErrorReject H0(Conclude µ > 12)Accept H0(Conclude µ < 12)H0 True(µ < 12)H0 False(µ > 12)ConclusionPopulation ConditionDr Jorge Ramírez MedinaEGADE Business SchoolErroresErrores
49. 49. Error Tipo I Because hypothesis tests are based on sample data,we must allow for the possibility of errors.A Type I error is rejecting H0 when it is true.The probability of making a Type I error when thenull hypothesis is true as an equality is called thelevel of significance.Applications of hypothesis testing that only controlthe Type I error are often called significance tests.Dr Jorge Ramírez MedinaEGADE Business School
50. 50. A Type II error is accepting H0 when it is false.It is difficult to control for the probability of makinga Type II error.Statisticians avoid the risk of making a Type IIerror by using “do not reject H0” and not “accept H0”.Error Tipo IIDr Jorge Ramírez MedinaEGADE Business School
51. 51. One-tailed(lower-tail)One-tailed(upper-tail)Two-tailedSummary of Forms for Null and AlternativeHypotheses about a Population MeanThe equality part of the hypotheses always appearsin the null hypothesis. In general, a hypothesis test about the value of apopulation mean µ must take one of the followingthree forms (where µ0 is the hypothesized value ofthe population mean).Dr Jorge Ramírez MedinaEGADE Business School0 0:H µ µ≥0:aH µ µ<0 0:H µ µ≤0:aH µ µ>0 0:H µ µ=0:aH µ µ≠
52. 52.  The rejection rule:The rejection rule:RejectReject HH00 if theif the pp-value-value << αα .. Compute theCompute the pp-value-value using the following three steps:using the following three steps:3. Double the tail area obtained in step 2 to obtain3. Double the tail area obtained in step 2 to obtainthethe pp –value.–value.2. If2. If zz is in the upper tail (is in the upper tail (zz > 0), find the area under> 0), find the area underthe standard normal curve to the right ofthe standard normal curve to the right of zz..IfIf zz is in the lower tail (is in the lower tail (zz < 0), find the area under< 0), find the area underthe standard normal curve to the left ofthe standard normal curve to the left of zz..1. Compute the value of the test statistic1. Compute the value of the test statistic zz..p-Value para la prueba deHipótesis de dos colasDr Jorge Ramírez MedinaEGADE Business School
53. 53. he critical values will occur in both the lower andhe critical values will occur in both the lower andpper tails of the standard normal curve.pper tails of the standard normal curve.The rejection rule is:The rejection rule is:RejectReject HH00 ifif zz << --zzαα/2/2 oror zz >> zzαα/2/2.. Use the standard normal probability distributionUse the standard normal probability distributiontable to findtable to find zzαα/2/2 (the(the zz-value with an area of-value with an area of αα/2 in/2 inthe upper tail of the distribution).the upper tail of the distribution).p-Value para la prueba deHipótesis de dos colasDr Jorge Ramírez MedinaEGADE Business School
54. 54. Step 1.Step 1. Develop the null and alternative hypotheses.Develop the null and alternative hypotheses.Step 2.Step 2. Specify the level of significanceSpecify the level of significance αα..Step 3.Step 3. Collect the sample data and compute the testCollect the sample data and compute the teststatistic.statistic.pp-Value Approach-Value ApproachStep 4.Step 4. Use the value of the test statistic to compute theUse the value of the test statistic to compute thepp-value.-value.Step 5.Step 5. RejectReject HH00 ifif pp-value-value << αα..Pasos de la prueba deHipótesisDr Jorge Ramírez MedinaEGADE Business School
55. 55. Critical Value ApproachCritical Value ApproachStep 4.Step 4. Use the level of significanceUse the level of significance to determineto determinethe critical value and the rejection rule.the critical value and the rejection rule.Step 5.Step 5. Use the value of the test statistic and theUse the value of the test statistic and therejectionrejectionrule to determine whether to rejectrule to determine whether to reject HH00..Pasos de la prueba deHipótesisDr Jorge Ramírez MedinaEGADE Business School
56. 56. Ejemplo: Pasta dedientes• Two-Tailed Test About a Population Mean:Two-Tailed Test About a Population Mean: σσ KnownKnownoz.GlowGlowQuality assurance procedures call forQuality assurance procedures call forthe continuation of the filling process if thethe continuation of the filling process if thesample results are consistent with the assumption thatsample results are consistent with the assumption thatthe mean filling weight for the population of toothpastethe mean filling weight for the population of toothpastetubes is 6 oz.; otherwise the process will be adjusted.tubes is 6 oz.; otherwise the process will be adjusted.The production line for Glow toothpasteThe production line for Glow toothpasteis designed to fill tubes with a mean weightis designed to fill tubes with a mean weightof 6 oz. Periodically, a sample of 30 tubesof 6 oz. Periodically, a sample of 30 tubeswill be selected in order to check thewill be selected in order to check thefilling process.filling process.Dr Jorge Ramírez MedinaEGADE Business School
57. 57. Two-Tailed Test About a Population Mean:Two-Tailed Test About a Population Mean: σσ KnownKnownoz.GlowGlowPerform a hypothesis test, at the .03Perform a hypothesis test, at the .03level of significance, to help determinelevel of significance, to help determinewhether the filling process should continuewhether the filling process should continueoperating or be stopped and corrected.operating or be stopped and corrected.Assume that a sample of 30 toothpasteAssume that a sample of 30 toothpastetubes provides a sample mean of 6.1 oz.tubes provides a sample mean of 6.1 oz.The population standard deviation isThe population standard deviation isbelieved to be 0.2 oz.believed to be 0.2 oz.Ejemplo: Pasta de dientesDr Jorge Ramírez MedinaEGADE Business School
58. 58. 1. Determine the hypotheses.1. Determine the hypotheses.2. Specify the level of significance2. Specify the level of significance..3. Compute the value of the test statistic.3. Compute the value of the test statistic.αα = .03= .03 p –Value and Critical Value Approachesp –Value and Critical Value ApproachesGlowGlowHH00:: µµ = 6= 6HHaa:: 6µ ≠Prueba de dos colas deµ:σ conocidaDr Jorge Ramírez MedinaEGADE Business School74.2302.61.6=−=nxz/0σµ−=
59. 59. GlowGlow5. Determine whether to reject H5. Determine whether to reject H00.. p –Value Approachp –Value Approach4. Compute the p –value.4. Compute the p –value.ForFor zz = 2.74, cumulative probability = .9969= 2.74, cumulative probability = .9969pp–value = 2(1–value = 2(1 −− .9969) = .0062.9969) = .0062BecauseBecause pp–value = .0062–value = .0062 << αα = .03, we reject= .03, we reject HH00..We are at least 97% confident that the meanWe are at least 97% confident that the meanfilling weight of the toothpaste tubes is not 6 oz.filling weight of the toothpaste tubes is not 6 oz.Prueba de dos colas deµ:σ conocidaDr Jorge Ramírez MedinaEGADE Business School
60. 60. GlowGlowα/2 =.0150zα/2 = 2.17zα/2 =.015 p-Value Approachp-Value Approach-zα/2 = -2.17z = 2.74z = -2.741/2p -value= .00311/2p -value= .0031Prueba de dos colas deµ:σ conocidaDr Jorge Ramírez MedinaEGADE Business School
61. 61. Prueba de dos colas deµ:σ conocidaDr Jorge Ramírez MedinaEGADE Business School Critical Value ApproachCritical Value ApproachGlowGlow5. Determine whether to reject H5. Determine whether to reject H00..We are at least 97% confident that the meanWe are at least 97% confident that the meanfilling weight of the toothpaste tubes is not 6 oz.filling weight of the toothpaste tubes is not 6 oz.Because 2.47Because 2.47 >> 2.17, we reject2.17, we reject HH00..ForFor αα/2 = .03/2 = .015,/2 = .03/2 = .015, zz.015.015 = 2.17= 2.174. Determine the critical value and rejection rule.4. Determine the critical value and rejection rule.RejectReject HH00 ifif zz << -2.17 or-2.17 or zz >> 2.172.17
62. 62. Prueba de dos colas deµ:σ conocidaDr Jorge Ramírez MedinaEGADE Business Schoolα/2 = .0150 2.17Reject H0Do Not Reject H0zReject H0-2.17GlowGlow Critical Value ApproachCritical Value ApproachSamplingdistributionofα/2 = .015nxz/0σµ−=
63. 63. Prueba de Hipótesis deµ:σ desconocida• Test StatisticTest StatisticDr Jorge Ramírez MedinaEGADE Business SchoolThis test statistic has aThis test statistic has a tt distributiondistributionwithwith nn - 1 degrees of freedom.- 1 degrees of freedom.txs n=− µ0/
64. 64. Rejection Rule: p -Value ApproachRejection Rule: p -Value ApproachHH00:: µµ << µµ00 RejectReject HH00 ifif tt >> ttααRejectReject HH00 ifif tt << --ttααRejectReject HH00 ifif tt << -- ttα/2α/2 oror tt >> ttα/2α/2HH00:: µµ >> µµ00HH00:: µµ == µµ00Rejection Rule: Critical Value ApproachRejection Rule: Critical Value ApproachRejectReject HH00 ifif pp –value–value << ααPrueba de Hipótesis deµ:σ desconocidaDr Jorge Ramírez MedinaEGADE Business School