S04 ad4001 ss

343 views

Published on

Sesión 04 Estadística Dr. Jorge Ramírez Medina
TLC, Intervalos de confianza y pruebas de hipótesis

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
343
On SlideShare
0
From Embeds
0
Number of Embeds
98
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Repaso: Qué es estadística Estadística Inferencial Modelos. Media. Escribir Outcomei= Model + errori. SMM= outcome – model Sacar desv estand Representación de datos de tres maneras; tabla, gráfico, fórmula. Distribuciones de probabilidad: ojo se gráfican probabilidades!!!! Fórmula -> binomial c(n,x) p^(x)q(n-x) Poisson-> f(x)=u^x e^-u/x! Exponencial-> (1/u)e^(-x/u). F(X)= 1-e^(-x/u)
  • Ejemplos de dist normal: pesos, salarios, etc. http://www.youtube.com/watch?v=xDIyAOBa_yU http://www.shodor.org/interactivate/activities/NormalDistribution/ Hablar de propiedades; Simetría. Sesgo=0 Las curvas de cualquier distribución de probabilidad están definidas por su media y su desviación estándar La desviación estándar determina el ancho de la curva: los valores más grandes resultan en curvas más anchas P(x=x0) = cero
  • Ejemplo: Graficar Ancho de banda vs provedores de servicios http://www.nationmaster.com/graph/int_bro_acc-internet-broadband-access http://www.nationmaster.com/graph/int_int_cha-internet-charges Diferentes medidas… hay que estandarizar!!! The z-score is often called the standardized value. An observation’s z-score is a measure of the relative location of the observation in a data set. A data value less than the sample mean will have a z-score less than zero. A data value greater than the sample mean will have a z-score greater than zero . A data value equal to the sample mean will have a z-score of zero .
  • How do you compare apples and oranges? Are you as good a student of French as you are in Physics? How many people did better or worse than you on a test? Are you abnormal or deviant? Should you ask your professor to curve the exam? Each of these questions suggests a comparison . Sometimes when you analyze data, you will need to compare scores within a sample (are you abnormal or deviant?) or across variables (as good in French as Physics). To do so effectively, you will need to present the comparisons in a way that facilitates decision making . You may be asked: What percentage of people falls below a given score? What is the relative standing of a score in one distribution versus another? What score or scores can be used to define an extreme or deviant situation? You can do all of these with the Z-Score!
  • An Intuitive Example You enter your dorm room and find that one of your roommates has a happy face, but your other roommate is sad: What's happened! Why are you so happy? And why are you so sad? Hurray, I got a 60 on the Physics test!!! Wah!, I got a 60 on the French test!!! Why? As student you probably have figured out that the 60 on the French test is bad compared to every one else And the 60 on the Physicis test is good compared to everyone else
  • An Intuitive Example The Normal Curve To test out our hunch, we need to be more precise. To do that we need to review the Normal Distribution. That's how we will compare the French and Physics tests. Data Types For our discussion of the Z-scores, we will be using measurement data (numerical scores). We will need: Measures of central tendency: The mean Measures of variability: standard deviation (SD) Finding Yourself on the Normal Curve Remember the normal curve. It is the shape of many measurement data distributions. The frequency of the scores tends to fall in a very specific shape in the normal distribution. The normal curve is described by its mean (arithmetic average) and SD (average deviation of scores around the mean). This is the normal curve and the line in the middle is the mean (SX/N) . Many frequency distributions in Psychology are normal. Each box on the graph represents a score. In our case it will be an exam score of a particular individual. The red arrow represents the SD.
  • The First Big Idea So what does this have to do with the French and Physics tests? The Big Idea! Where you are relative to others in the distribution determines how well you did. Now that you can see the distributions of test scores, explain why your roommates are happy and sad. La prueba de física fue muy difícil con una media de 50. La calificación de 60 fue mejor que el de la mayoría. Con la prueba de Francés la media fue de 70, la calificación de 60 está por abajo de los demás
  • The Second Big Idea Now we can quantify your place in a distribution. You don't have to always draw a picture. We will do this with the Z-Score . Formula:
  • The Third Big Idea The SD is a Ruler. Consider the Z-score as the inch marks of the ruler. A Z-Score equals the Number of SDs ; the score is from the mean. Let's look at the Physics test! We know its mean is 50 . The SD is calculated to be 10 (someone used his or her calculator). Remember the SD is the distance from the mean to the Point of Inflection (change in direction of the curve).
  • The Fourth Big Idea What's our Physics freak roommate's Z-score and why is she happy? 1. The roommate's score is 10 points above the mean or one SD above the mean. 2. Her Z-Score Equals 1 because: Z = (Score - Mean)/SD Z = (60 - 50) / 10 Z = 1 Let's do it again! The student down the hall runs into our gang's room. She yells, "I got an 84 on the Physics test!!" 1. Her Z-Score equals 3.4 because: Z = (Score - Mean)/SD Z = (84 - 50) / 10 Z = 3.4 This is a bright young person. Let's look at the Z-Score ruler on the normal curve. She gets a very big happy face She's done better than almost everyone in the class! Oh, Dear - Now we know why our French-taking roommate is sad! Z = (60 - 70) / 10 Z = -1.0 Her Z-score is negative and below the mean.
  • Now, let’s go to our final question. Curving a test means that a professor marks you on a Z-Score basis. If the mean is high do you want the test curved? Think about it. Summary z scores act like a ruler; they place data on a standard scale. z scores express the distance of a single score from the mean in standard deviation units. If data are normally distributed, z scores can be easily turned into percentages. We can use z scores to identify or cut off specific percentages/areas of a distribution. This is useful for hypothesis testing.
  • Seventy efficiency apartments were randomly sampled in a small college town. The monthly rent prices for these apartments are listed in ascending order. Skewness=S=3(media-mediana)/DesvEst Skewness= sum(xi-med)al cubo/n
  • A random variable having a normal distribution with a mean of 0 and a standard deviation of 1 is said to have a standard normal probability distribution . We can think of z as a measure of the number of standard deviations x is from u . Enfatizar probabilidades. De hecho ejercicio a realizar
  • Pep Zone sells auto parts and supplies including a popular multi-grade motor oil. When the stock of this oil drops to 20 gallons, a replenishment order is placed. The store manager is concerned that sales are being lost due to stockouts while waiting for an order. It has been determined that demand during replenishment lead-time is normally distributed with a mean of 15 gallons and a standard deviation of 6 gallons. The manager would like to know the probability of a stockout, P ( x > 20).
  • By raising the reorder point from 20 gallons to 25 gallons on hand, the probability of a stockout decreases from about .20 to .05. This is a significant decrease in the chance that Pep Zone will be out of stock and unable to meet a customer’s desire to make a purchase.
  • Seis automóviles. Se usan sólo dos para evoitar averias Promedio de rendimiento 30 y 32 kmpl. Desv esta= s/raiz(n)
  • 1- seleccionar población normal con un tamaño de muestra de 5. Seleccionar la media como el estadístico de muestra y generar 1000 muestras. Pregunta al grupo: la media y la desv. estand. de la muestra cae dentro de el error de la media de la población y el error estándar? (calculado de la población desv. estand/raiz(5)) Describe una curva normal la distribución de muestreo? 2- seleccionar población normal con un tamaño de muestra de 5. Seleccionar la DESVIACIÓN ESTÁNDAR como el estadístico de muestra y generar 1000 muestras. Pregunta al grupo: la media de la muestra cae dentro de el error de la media de la población? Describe una curva normal la distribución de muestreo? 3- Repetir 1 utilizando una curva exponencial 4- Repetir 1 utilizando una curva exponencial y un tamaño de muestra de 20. Hace esto que la forma de la distribución parezca más a la normal? 5- forma una ditribución customizada en donde la forma de distribución de muestreo no siga una curva normal, utilice un tamaño de 20. Aumenta a 500 los valores de muestreo de la media. 6- Incrementa a 100 el tamaño de la muestra. Muestrea 100 (ó mpas si la paciencia se está acabando) . Describe una curva normal la distribución de muestreo?
  • ¿de qué hemos estado hablando?,  media muestral; estimador puntual de la media poblacional Generar con excel PHStat, números aleatorios 10 muestras/5000 números checar la diferencia entre las medias muestrales y la poblacional Un estimador puntual no provee un valor exacto del parámetro poblacional. El propósito de una estimación del intervalo es proveer información acerca de que tan cerca el estimador está del valor del parámetro.
  • We refer to such cases as the  known case. Cuando no se conoce dev estad poblacional se puede usar la media muestral si la muestra es grande (n>30)
  • 95% de lo valores de una variable aleatoria con distribución normal quedan dentro una distancia = 1.96 desv est de la media 90% =1.645 99% =2.576 => Nivel de confianza a a/2 Za/2 90% 0.10 0.05 1.645 95% 0.05 0.025 1.960 99% 0.01 0.005 2.576 Hay un 1   de probabilidad de que el valor de una media muestral provea un margen de error de a/2 o menos.
  • Discount Sounds has 260 retail outlets throughout the United States. The firm is evaluating a potential location for a new outlet, based in part, on the mean annual income of the individuals inthe marketing area of the new location. A sample of size n = 36 was taken; the sample mean income is $31,100. The population is not believed to be highly skewed. The population standard deviation is estimated to be $4,500, and the confidence coefficient to be used in the interval estimate is .95.
  • Thus, at 95% confidence, the margin of error is $1,470. We are 95% confident that the interval contains the population mean.
  • Sx=1.96(.8)/raiz(n)=1.95(.8)/raiz(50) = .22 .8 se asume
  • This is the  unknown case. (We’ll assume for now that the population is normally distributed.)
  • (June 13, 1876 – October 16, 1937) before reading chemistry and mathematics at New College, Oxford. On graduating in 1899, he joined the Dublin brewery of Arthur Guinness & Son.
  • Hacer la demo de t cuando va a infinito en excel =DISTR.T.INV(2*Prob,GL) con =DISTR.T.INV(2*0.025,100)= 1.98397147 (ojo la probabilidad es de 0.025) comparando con = =DISTR.NORM.ESTAND.INV(1-Prob) Ojo: La distr.norm.estand.inv da la acumulada por lo que hay que restar 1- prob . La distr.t.inv viene de dos colas por lo que hay que multiplicar por dos la probabilidad
  • Hablar de Tuercas, para qué sirve?
  • http://www.stats.gla.ac.uk/steps/glossary/hypothesis_testing.html The null hypothesis, H0, represents a theory that has been put forward, either because it is believed to be true or because it is to be used as a basis for argument, but has not been proved The null hypothesis is an hypothesis about a population parameter. 
  • Testing Research Hypotheses The research hypothesis should be expressed as the alternative hypothesis. The conclusion that the research hypothesis is true comes from sample data that contradict the null hypothesis. 1- en una investigación la Hipótesis bajo investigación se pone como la hipótesis alternativa Testing the Validity of a Claim Manufacturers’ claims are usually given the benefit of the doubt and stated as the null hypothesis. The conclusion that the claim is false comes from sample data that contradict the null hypothesis. 1- Cuando alguien afirma algo, se pone como la Hipótesis Nula. Testing in Decision-Making Situations . A decision maker might have to choose between two courses of action, one associated with the null hypothesis and another associated with the alternative hypothesis. Example: Accepting a shipment of goods from a supplier or returning the shipment of goods to the supplier
  • LA duda http://www.youtube.com/watch?v=sruS6bqep-k
  • Subir ejercicio. Traer vasos desechables Pesa electrónica
  • S04 ad4001 ss

    1. 1. Sesión 4Sesión 4 TLC,TLC, Intervalos de Confianza yIntervalos de Confianza y pruebas de Hipótesispruebas de Hipótesis Estadística en las organizaciones AD4001 Dr. Jorge Ramírez Medina
    2. 2. De la clase anterior Uso y abuso de la estadística • Cuidado con lo que asume. • Sea claro acerca quiere descubrir. • No tome la causalidad por sentado. • Con estadística no se puede probar cosas con el 100% de certeza • Un resultado que es numéricamente significativo puede ser inútil. Tomado de The Use and Misuse of statistics HBP. Dr Jorge Ramírez Medina EGADE Business School
    3. 3. Dr Jorge Ramírez Medina EGADE Business School σ µ x Distribución Normal
    4. 4. Dr Jorge Ramírez Medina EGADE Business School Valores Z Se interpreta como la cantidad de desviacionesSe interpreta como la cantidad de desviaciones estándar que dista xestándar que dista xii del promedio.del promedio. s xx z i i − =
    5. 5. Dr Jorge Ramírez Medina EGADE Business School Z-scores ¿cómo comparar peras con manzanas?
    6. 6. Dr Jorge Ramírez Medina EGADE Business School Un ejemplo 60 en estadística 60 en ética
    7. 7. Para entender; Grafiquémoslo • Tipo de datos – Numéricos – Medidas de tendencia central (media) – Medidas de variabilidad (desviación estándar) Dr Jorge Ramírez Medina EGADE Business School
    8. 8. Primera idea Dr Jorge Ramírez Medina EGADE Business School Nada es verdad, nada es mentira Todo es según el cristal en que se mira (Popular)
    9. 9. Segunda idea Dr Jorge Ramírez Medina EGADE Business School X X z SD − =
    10. 10. Tercera idea Dr Jorge Ramírez Medina EGADE Business School
    11. 11. Cuarta idea Dr Jorge Ramírez Medina EGADE Business School Z = (Score - Mean)/SD Z = (60 - 50) / 10 Z = 1 Z = (Score - Mean)/SD Z = (84 - 50) / 10 Z = 3.4 Z = (60 - 70) / 10 Z = -1.0
    12. 12. Z-scores • Z-score puede ser positivo o negativo – Positivo es arriba de la media – Negativo es abajo de la media • La media de un Z-score es siempre cero • Si se tiene el promedio, el Z-score =0 • La desviación estándar de una distribución Z =1 Dr Jorge Ramírez Medina EGADE Business School
    13. 13. Dr Jorge Ramírez Medina EGADE Business School 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 Para el ejemplo de la sesión 1 = .865
    14. 14. Dr Jorge Ramírez Medina EGADE Business School Valores z • z-Score del valor más pequeño (425) -1.20 -1.11 -1.11 -1.02 -1.02 -1.02 -1.02 -1.02 -0.93 -0.93 -0.93 -0.93 -0.93 -0.84 -0.84 -0.84 -0.84 -0.84 -0.75 -0.75 -0.75 -0.75 -0.75 -0.75 -0.75 -0.56 -0.56 -0.56 -0.47 -0.47 -0.47 -0.38 -0.38 -0.34 -0.29 -0.29 -0.29 -0.20 -0.20 -0.20 -0.20 -0.11 -0.01 -0.01 -0.01 0.17 0.17 0.17 0.17 0.35 0.35 0.44 0.62 0.62 0.62 0.81 1.06 1.08 1.45 1.45 1.54 1.54 1.63 1.81 1.99 1.99 1.99 1.99 2.27 2.27 Valores estandarizadosValores estandarizados
    15. 15. Dr Jorge Ramírez Medina EGADE Business School σ = 1 0 z La letra z es utilizada para designar a la variable normal aleatoria estandarizada. Distribución de probabilidad Normal estandarizada σ µ− = x z
    16. 16. Distribución deDistribución de probabilidad Normalprobabilidad Normal estandarizadaestandarizada Función de densidad normal estándar donde: z = (x – µ)/σ π = 3.14159 e = 2.71828 Dr Jorge Ramírez Medina EGADE Business School 2 2 2 1 )( z exf − = πσ
    17. 17. Distribución deDistribución de probabilidad Normalprobabilidad Normal estandarizadaestandarizada Ejemplo: “El tuercas” • Punto de reorden 20 litros • La demanda durante el tiempo de resurtido esta distribuida normalmente • Media 15 lts, desv. est. 6 lts El tuercas 5w-20 Motor Oil Dr Jorge Ramírez Medina EGADE Business School
    18. 18. zz = (= (xx -- µµ)/)/σσ = (20 - 15)/6= (20 - 15)/6 = .83= .83 Paso 1: ConviertaPaso 1: Convierta xx a la distribución normal estándara la distribución normal estándar El Tuercas 5w-20 Motor Oil Paso 2: encuentre el área bajo la curva normalPaso 2: encuentre el área bajo la curva normal estandarizada a la izquierda de z = .83.estandarizada a la izquierda de z = .83. Distribución deDistribución de probabilidadprobabilidad Normal estandarizadaNormal estandarizada Dr Jorge Ramírez Medina EGADE Business School
    19. 19. Tabla de probabilidad acumulada para la distribución normal estandarizada z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 . . . . . . . . . . . .5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224 .6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549 .7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852 .8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133 .9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389 . . . . . . . . . . . P(z < .83)P(z < .83) Distribución deDistribución de probabilidadprobabilidad Normal estandarizadaNormal estandarizada El Tuercas 5w-20 Motor Oil http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htm Dr Jorge Ramírez Medina EGADE Business School
    20. 20. P(z > .83) = 1 – P(z < .83)P(z > .83) = 1 – P(z < .83) = 1- .7967= 1- .7967 = .2033= .2033 Step 3: Calcule el área bajo la curva normal estandar a la derecha de z = .83. Probabilidad deProbabilidad de faltantesfaltantes P(x > 20)P(x > 20) El Tuercas 5w-20 Motor Oil Distribución deDistribución de probabilidadprobabilidad Normal estandarizadaNormal estandarizada Dr Jorge Ramírez Medina EGADE Business School
    21. 21. 0 .83 Area = .7967 Area = 1 - .7967 = .2033 z El Tuercas 5w-20 Motor Oil Distribución deDistribución de probabilidadprobabilidad Normal estandarizadaNormal estandarizada Dr Jorge Ramírez Medina EGADE Business School
    22. 22. Si se desea que la probabilidad de faltantes no sea más de 0.05, cuál deberá ser el punto de reorden? El Tuercas 5w-20 Motor Oil Distribución deDistribución de probabilidadprobabilidad Normal estandarizadaNormal estandarizada Dr Jorge Ramírez Medina EGADE Business School
    23. 23. 0 Area = .9500 Area = .0500 zz z.05 El Tuercas 5w-20 Motor Oil Distribución deDistribución de probabilidadprobabilidad Normal estandarizadaNormal estandarizada Dr Jorge Ramírez Medina EGADE Business School
    24. 24. Paso 1: encuentre el valor de z que corta un área de .05 en la cola derecha de la distribución normal estándar. z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 . . . . . . . . . . . 1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441 1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545 1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633 1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706 1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767 . . . . . . . . . . . Buscamos el complemento de elBuscamos el complemento de el área en la cola (1 - .05 = .95)área en la cola (1 - .05 = .95) El Tuercas 5w-20 Motor Oil Distribución deDistribución de probabilidadprobabilidad Normal estandarizadaNormal estandarizada Dr Jorge Ramírez Medina EGADE Business School
    25. 25. paso 2: Convierta z.05 al correspondiente valor de x. x = µ + z.05σ = 15 + 1.645(6) = 24.87 o 25 Un punto de reorden de 25 litros llevará la probabilidad de faltantes durante el reabasto (poco menos de) .05. El Tuercas 5w-20 Motor Oil Distribución deDistribución de probabilidadprobabilidad Normal estandarizadaNormal estandarizada Dr Jorge Ramírez Medina EGADE Business School
    26. 26. Distribución de muestreo de la media muestral • Es la distribución de probabilidad de la población de todas las posibles medias muestrales que pueden ser obtenidas de todas las posibles muestras del mismo tamaño. Dr. Jorge Ramírez Medina EGADE Business School
    27. 27. Forma de distribuciónForma de distribución muestral demuestral de x Dr Jorge Ramírez Medina EGADE Business School
    28. 28. Si se usa una muestra aleatoria simple grande (n > 30) el teorema del límite central nos permite concluir que la distribución de puede ser aproximada como una distribución normal. Cuando la muestra aleatoria simple es pequeña (n < 30), la distribución de muestreo de puede ser considerada normal sólo si asumimos que la población tiene una distribución normal. Forma de distribuciónForma de distribución muestral demuestral de x Dr Jorge Ramírez Medina EGADE Business School x x
    29. 29. UnaUna estimación del intervaloestimación del intervalo se puede calcularse puede calcular por sumar y restar unpor sumar y restar un margen de errormargen de error del estimadordel estimador puntual:puntual: Estimador puntual +/- Margen de Error Margen de Error yMargen de Error y estimación de intervalosestimación de intervalos Por ejemplo la forma general de una estimación delPor ejemplo la forma general de una estimación del intervalo para una media poblacional es:intervalo para una media poblacional es: Margen de Error± Dr Jorge Ramírez Medina EGADE Business School x
    30. 30. Estimación de intervalo deEstimación de intervalo de la media de una Poblaciónla media de una Población : σ conocidaconocida  El margen de error puede ser calculado con: – La desviación estándar de la población σ , o – La desviación estándar de la muestra s  σ raramente se conoce con exactitud, se pueden obtener estimados de datos históricos. Dr Jorge Ramírez Medina EGADE Business School
    31. 31. µµ αα/2/2 αα/2/2 Estimación de intervalo deEstimación de intervalo de la media de una Población :la media de una Población : σ conocidaconocida x Dr Jorge Ramírez Medina EGADE Business School Distribución deDistribución de Muestreo deMuestreo de 1 - α de todos los valores de x xz σα 2/ xz σα 2/ intervalointervalo incluyeincluye mm intervalointervalo nono incluyeincluye mm http://onlinestatbook.com/stat_sim/conf_interval/index.html
    32. 32. • Estimación de intervalo de µ donde: es la media muestral 1 -α es el coeficiente de confidencia zα/2 es el valor z que provee un área de α/2 en la cola superior de la distribución de probabilidad normal estandarizada σ es la desviación estándar de la población n es el tamaño de la muestra Estimación de intervalo deEstimación de intervalo de la media de una Población :la media de una Población : σ conocidaconocida x Dr Jorge Ramírez Medina EGADE Business School n zx σ α 2/±
    33. 33. • Selección del tamaño de la muestra en la mayoría de las aplicaciones, un tamaño deen la mayoría de las aplicaciones, un tamaño de muestra de n = 30 es adecuado.muestra de n = 30 es adecuado. Si la distribución de la población es de un alto sesgoSi la distribución de la población es de un alto sesgo o contiene outliers, se recomienda un tamaño deo contiene outliers, se recomienda un tamaño de muestra de 50 ó más.muestra de 50 ó más. Estimación de intervalo deEstimación de intervalo de la media de una Población :la media de una Población : σ conocidaconocida Dr Jorge Ramírez Medina EGADE Business School
    34. 34. • Selección del tamaño de la muestra si la población no está normalmente distribuida perosi la población no está normalmente distribuida pero es simétrica (+/-) un tamaño de muestra pequeñoes simétrica (+/-) un tamaño de muestra pequeño de 15 es suficiente.de 15 es suficiente. Si se cree que la distribución de la población esSi se cree que la distribución de la población es aproximadamente normal, se puede utilizar unaproximadamente normal, se puede utilizar un tamaño de muestra de menos de 15.tamaño de muestra de menos de 15. Estimación de intervalo deEstimación de intervalo de la media de una Población :la media de una Población : σ conocidaconocida Dr Jorge Ramírez Medina EGADE Business School
    35. 35. • Ejemplo: DiscoSuena Estimación de intervalo deEstimación de intervalo de la media de una Población :la media de una Población : σ conocidaconocida n=36 U= $31,100 S= $4,500 Intervalo de confianza del 95% x σ Dr Jorge Ramírez Medina EGADE Business School
    36. 36. 95% de las medias muestrales, están dentro de un + 1.96 de la media poblacional µ.σ x El margen de error es: Estimación de intervalo deEstimación de intervalo de la media de una Población :la media de una Población : σ conocidaconocida La estimación del intervalo para µ es: $31,100 + $1,470 o $29,630 to $32,570 470,1 36 500,4 96.12/ =      = n z σ α Dr Jorge Ramírez Medina EGADE Business School
    37. 37. Para el ejemplo de los autos Dr. Jorge Ramírez Medina EGADE Business School
    38. 38. • Si no se puede tener un estimado de la desviación estándar de la población σ se utiliza la desviación estándar s de la muestra para estimar σ . • En este caso, la estimación del intervalo para µ está basada en la distribución t. Estimación de intervalo deEstimación de intervalo de la media de una Población :la media de una Población : σ desconocidadesconocida Dr Jorge Ramírez Medina EGADE Business School
    39. 39. La distribución t es una familia de distribuciones deLa distribución t es una familia de distribuciones de probabilidad similares.probabilidad similares. Una distribución t específica depende de unUna distribución t específica depende de un parámetro conocido como grados de libertad.parámetro conocido como grados de libertad. Los grados de libertad se refieren a el número deLos grados de libertad se refieren a el número de piezas independientes de información que se usanpiezas independientes de información que se usan en el cálculo de s.en el cálculo de s. Distribución t Dr Jorge Ramírez Medina EGADE Business School
    40. 40. Conforme la distribución t tiene más grados deConforme la distribución t tiene más grados de libertad, ésta tiene menos dispersión.libertad, ésta tiene menos dispersión. Conforme se incrementan los grados de libertad,Conforme se incrementan los grados de libertad, la diferencia entre la distribución t y la distribuciónla diferencia entre la distribución t y la distribución de probabilidad normal estandarizada se hace másde probabilidad normal estandarizada se hace más pequeña.pequeña. Distribución t William Sealy Gosset Dr Jorge Ramírez Medina EGADE Business School
    41. 41. Distribución t distribución normal estándar DistribuciónDistribución tt (20 grados(20 grados de libertad)de libertad) Distribución t (10 grados de libertad) 0 z, t Dr Jorge Ramírez Medina EGADE Business School
    42. 42. Para más de 100 grados de libertad, el valor de zPara más de 100 grados de libertad, el valor de z normal estandarizado, da una buena aproximaciónnormal estandarizado, da una buena aproximación del valor t.del valor t. Los valores z normal estandarizados, se puedenLos valores z normal estandarizados, se pueden encontrar en la tabla t, con infinito grados de libertad.encontrar en la tabla t, con infinito grados de libertad. Distribución t Dr Jorge Ramírez Medina EGADE Business School
    43. 43. Degrees Area in Upper Tail of Freedom .20 .10 .05 .025 .01 .005 . . . . . . . 50 .849 1.299 1.676 2.009 2.403 2.678 60 .848 1.296 1.671 2.000 2.390 2.660 80 .846 1.292 1.664 1.990 2.374 2.639 100 .845 1.290 1.660 1.984 2.364 2.626 .842 1.282 1.645 1.960 2.326 2.576∞ Valores z normal estandarizados Distribución t Dr Jorge Ramírez Medina EGADE Business School
    44. 44. Pruebas de hipótesisPruebas de hipótesis • Una cola – Cola superior – Cola inferior σ conocida σ desconocida • Dos colas σ conocida σ desconocida Dr Jorge Ramírez Medina EGADE Business School α = .10 Reject H0 Do Not Reject H0 zz
    45. 45. Hipótesis nula y alternativa  Hypothesis testing can be used to determine whether a statement about the value of a population parameter should or should not be rejected.  The null hypothesis, denoted by H0 , is a tentative assumption about a population parameter.  The alternative hypothesis, denoted by Ha, is the opposite of what is stated in the null hypothesis.  The alternative hypothesis is what the test is attempting to establish. Dr Jorge Ramírez Medina EGADE Business School
    46. 46. • Testing Research Hypotheses Planteamiento de Hipótesis • The research hypothesis should be expressed as the alternative hypothesis. • The conclusion that the research hypothesis is true comes from sample data that contradict the null hypothesis. Dr Jorge Ramírez Medina EGADE Business School
    47. 47. Errores Dr Jorge Ramírez Medina EGADE Business School
    48. 48. Type I and Type II Errors Correct Decision Type II Error Correct DecisionType I Error Reject H0 (Conclude µ > 12) Accept H0 (Conclude µ < 12) H0 True (µ < 12) H0 False (µ > 12)Conclusion Population Condition Dr Jorge Ramírez Medina EGADE Business School ErroresErrores
    49. 49. Error Tipo I  Because hypothesis tests are based on sample data, we must allow for the possibility of errors. A Type I error is rejecting H0 when it is true. The probability of making a Type I error when the null hypothesis is true as an equality is called the level of significance. Applications of hypothesis testing that only control the Type I error are often called significance tests. Dr Jorge Ramírez Medina EGADE Business School
    50. 50. A Type II error is accepting H0 when it is false. It is difficult to control for the probability of making a Type II error. Statisticians avoid the risk of making a Type II error by using “do not reject H0” and not “accept H0”. Error Tipo II Dr Jorge Ramírez Medina EGADE Business School
    51. 51. One-tailed (lower-tail) One-tailed (upper-tail) Two-tailed Summary of Forms for Null and Alternative Hypotheses about a Population Mean The equality part of the hypotheses always appears in the null hypothesis.  In general, a hypothesis test about the value of a population mean µ must take one of the following three forms (where µ0 is the hypothesized value of the population mean). Dr Jorge Ramírez Medina EGADE Business School 0 0:H µ µ≥ 0:aH µ µ< 0 0:H µ µ≤ 0:aH µ µ> 0 0:H µ µ= 0:aH µ µ≠
    52. 52.  The rejection rule:The rejection rule: RejectReject HH00 if theif the pp-value-value << αα ..  Compute theCompute the pp-value-value using the following three steps:using the following three steps: 3. Double the tail area obtained in step 2 to obtain3. Double the tail area obtained in step 2 to obtain thethe pp –value.–value. 2. If2. If zz is in the upper tail (is in the upper tail (zz > 0), find the area under> 0), find the area under the standard normal curve to the right ofthe standard normal curve to the right of zz.. IfIf zz is in the lower tail (is in the lower tail (zz < 0), find the area under< 0), find the area under the standard normal curve to the left ofthe standard normal curve to the left of zz.. 1. Compute the value of the test statistic1. Compute the value of the test statistic zz.. p-Value para la prueba de Hipótesis de dos colas Dr Jorge Ramírez Medina EGADE Business School
    53. 53. he critical values will occur in both the lower andhe critical values will occur in both the lower and pper tails of the standard normal curve.pper tails of the standard normal curve. The rejection rule is:The rejection rule is: RejectReject HH00 ifif zz << --zzαα/2/2 oror zz >> zzαα/2/2..  Use the standard normal probability distributionUse the standard normal probability distribution table to findtable to find zzαα/2/2 (the(the zz-value with an area of-value with an area of αα/2 in/2 in the upper tail of the distribution).the upper tail of the distribution). p-Value para la prueba de Hipótesis de dos colas Dr Jorge Ramírez Medina EGADE Business School
    54. 54. Step 1.Step 1. Develop the null and alternative hypotheses.Develop the null and alternative hypotheses. Step 2.Step 2. Specify the level of significanceSpecify the level of significance αα.. Step 3.Step 3. Collect the sample data and compute the testCollect the sample data and compute the test statistic.statistic. pp-Value Approach-Value Approach Step 4.Step 4. Use the value of the test statistic to compute theUse the value of the test statistic to compute the pp-value.-value. Step 5.Step 5. RejectReject HH00 ifif pp-value-value << αα.. Pasos de la prueba de Hipótesis Dr Jorge Ramírez Medina EGADE Business School
    55. 55. Critical Value ApproachCritical Value Approach Step 4.Step 4. Use the level of significanceUse the level of significance to determineto determine the critical value and the rejection rule.the critical value and the rejection rule. Step 5.Step 5. Use the value of the test statistic and theUse the value of the test statistic and the rejectionrejection rule to determine whether to rejectrule to determine whether to reject HH00.. Pasos de la prueba de Hipótesis Dr Jorge Ramírez Medina EGADE Business School
    56. 56. Ejemplo: Pasta de dientes • Two-Tailed Test About a Population Mean:Two-Tailed Test About a Population Mean: σσ KnownKnown oz. GlowGlow Quality assurance procedures call forQuality assurance procedures call for the continuation of the filling process if thethe continuation of the filling process if the sample results are consistent with the assumption thatsample results are consistent with the assumption that the mean filling weight for the population of toothpastethe mean filling weight for the population of toothpaste tubes is 6 oz.; otherwise the process will be adjusted.tubes is 6 oz.; otherwise the process will be adjusted. The production line for Glow toothpasteThe production line for Glow toothpaste is designed to fill tubes with a mean weightis designed to fill tubes with a mean weight of 6 oz. Periodically, a sample of 30 tubesof 6 oz. Periodically, a sample of 30 tubes will be selected in order to check thewill be selected in order to check the filling process.filling process. Dr Jorge Ramírez Medina EGADE Business School
    57. 57. Two-Tailed Test About a Population Mean:Two-Tailed Test About a Population Mean: σσ KnownKnown oz. GlowGlow Perform a hypothesis test, at the .03Perform a hypothesis test, at the .03 level of significance, to help determinelevel of significance, to help determine whether the filling process should continuewhether the filling process should continue operating or be stopped and corrected.operating or be stopped and corrected. Assume that a sample of 30 toothpasteAssume that a sample of 30 toothpaste tubes provides a sample mean of 6.1 oz.tubes provides a sample mean of 6.1 oz. The population standard deviation isThe population standard deviation is believed to be 0.2 oz.believed to be 0.2 oz. Ejemplo: Pasta de dientes Dr Jorge Ramírez Medina EGADE Business School
    58. 58. 1. Determine the hypotheses.1. Determine the hypotheses. 2. Specify the level of significance2. Specify the level of significance.. 3. Compute the value of the test statistic.3. Compute the value of the test statistic. αα = .03= .03  p –Value and Critical Value Approachesp –Value and Critical Value Approaches GlowGlow HH00:: µµ = 6= 6 HHaa:: 6µ ≠ Prueba de dos colas de µ: σ conocida Dr Jorge Ramírez Medina EGADE Business School 74.2 302. 61.6 = − = n xz / 0 σ µ−=
    59. 59. GlowGlow 5. Determine whether to reject H5. Determine whether to reject H00..  p –Value Approachp –Value Approach 4. Compute the p –value.4. Compute the p –value. ForFor zz = 2.74, cumulative probability = .9969= 2.74, cumulative probability = .9969 pp–value = 2(1–value = 2(1 −− .9969) = .0062.9969) = .0062 BecauseBecause pp–value = .0062–value = .0062 << αα = .03, we reject= .03, we reject HH00.. We are at least 97% confident that the meanWe are at least 97% confident that the mean filling weight of the toothpaste tubes is not 6 oz.filling weight of the toothpaste tubes is not 6 oz. Prueba de dos colas de µ: σ conocida Dr Jorge Ramírez Medina EGADE Business School
    60. 60. GlowGlow α/2 = .015 0 zα/2 = 2.17 z α/2 = .015  p-Value Approachp-Value Approach -zα/2 = -2.17 z = 2.74z = -2.74 1/2 p -value = .0031 1/2 p -value = .0031 Prueba de dos colas de µ: σ conocida Dr Jorge Ramírez Medina EGADE Business School
    61. 61. Prueba de dos colas de µ: σ conocida Dr Jorge Ramírez Medina EGADE Business School  Critical Value ApproachCritical Value Approach GlowGlow 5. Determine whether to reject H5. Determine whether to reject H00.. We are at least 97% confident that the meanWe are at least 97% confident that the mean filling weight of the toothpaste tubes is not 6 oz.filling weight of the toothpaste tubes is not 6 oz. Because 2.47Because 2.47 >> 2.17, we reject2.17, we reject HH00.. ForFor αα/2 = .03/2 = .015,/2 = .03/2 = .015, zz.015.015 = 2.17= 2.17 4. Determine the critical value and rejection rule.4. Determine the critical value and rejection rule. RejectReject HH00 ifif zz << -2.17 or-2.17 or zz >> 2.172.17
    62. 62. Prueba de dos colas de µ: σ conocida Dr Jorge Ramírez Medina EGADE Business School α/2 = .015 0 2.17 Reject H0Do Not Reject H0 z Reject H0 -2.17 GlowGlow  Critical Value ApproachCritical Value Approach Sampling distribution of α/2 = .015 n xz / 0 σ µ−=
    63. 63. Prueba de Hipótesis de µ: σ desconocida • Test StatisticTest Statistic Dr Jorge Ramírez Medina EGADE Business School This test statistic has aThis test statistic has a tt distributiondistribution withwith nn - 1 degrees of freedom.- 1 degrees of freedom. t x s n = − µ0 /
    64. 64. Rejection Rule: p -Value ApproachRejection Rule: p -Value Approach HH00:: µµ << µµ00 RejectReject HH00 ifif tt >> ttαα RejectReject HH00 ifif tt << --ttαα RejectReject HH00 ifif tt << -- ttα/2α/2 oror tt >> ttα/2α/2 HH00:: µµ >> µµ00 HH00:: µµ == µµ00 Rejection Rule: Critical Value ApproachRejection Rule: Critical Value Approach RejectReject HH00 ifif pp –value–value << αα Prueba de Hipótesis de µ: σ desconocida Dr Jorge Ramírez Medina EGADE Business School
    65. 65. Asignación para la siguiente sesión Dr. Jorge Ramírez Medina EGADE Business School
    66. 66. Fin Sesión Cuatro

    ×