Your SlideShare is downloading. ×
Estaditica deber varios
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Estaditica deber varios

603

Published on

estadistica deber chi cuadrado

estadistica deber chi cuadrado

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
603
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
19
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI ESCUELA DE COMERCIO EXTERIOR ESTADISTICA INFERENCIAL MSC: JORGE POZO DIANA ERAZO SEXTO ―A‖ Tulcán – Ecuador 2012
  • 2. TEMA: Prueba De Hipótesis, T De Student Y Chi CuadradoProblema. El desconocimiento de prueba de hipótesis, t de student y chicuadrado no permite un buen desempeño en la realización de ejerciciosrelacionados al entorno.Objetivo General:Aplicar los conocimientos de una forma adecuada resolviéndolos problemasque se presentanObjetivos Específicos: Realizar una investigación de los temas mencionados Resolver problemas de comercio exterior Conocer los diferentes temas de estadística inferencial.Justificación.-La estadística inferencial es muy importantes dentro del comerciointernacional, puesto que existen diferentes problemas relacionados alcomercio exterior, por medio de la correlación lineal y regresión y otros temasrelacionados permite dar solución a los mismos.A través de la ejecución de los ejercicios enriqueceremos nuestrosconocimientos, los que a futuro serán aplicados en el campo laboral acorde alcomercio exterior.Además se genera un amplio interés al realizar este trabajo, puesto queposeeremos más conocimientos sobre Estadística inferencial para poderlosaplicar en nuestra carrera profesional.
  • 3. MARCO TEORICO T DE STUDENTEs una distribución de probabilidad que surge del problemade estimar la media de una población normalmente distribuida cuandoel tamaño de la muestra es pequeño.Aparece de manera natural al realizar la prueba t de Student para ladeterminación de las diferencias entre dos medias muestrales y para laconstrucción del intervalo de confianza para la diferencia entre las medias dedos poblaciones cuando se desconoce la desviación típica de una población yésta debe ser estimada a partir de los datos de una muestra.La distribución t de Student es la distribución de probabilidad del cocientedondeZ tiene una distribución normal de media nula y varianza 1V tiene una distribución ji-cuadrado con grados de libertadZ y V son independientesSi μ es una constante no nula, el cociente es una variable aleatoriaque sigue la distribución t de Student no central con parámetro de no-centralidad .Aparición y especificaciones de la distribución t de StudentSupongamos que X1,..., Xn son variables aleatorias independientes distribuidasnormalmente, con media μ yvarianza σ2. Sea
  • 4. la media muestral. Entoncessigue una distribución normal de media 0 y varianza 1.Sin embargo, dado que la desviación estándar no siempre es conocida deantemano, Gosset estudió un cociente relacionado,dondees la varianza muestral y demostró que la función de densidad de T esdonde es igual a n − 1.La distribución de T se llama ahora la distribución-t de Student.El parámetro representa el número de grados de libertad. La distribucióndepende de , pero no de o , lo cual es muy importante en la práctica.Intervalos de confianza derivados de la distribución t de StudentEl procedimiento para el cálculo del intervalo de confianza basado en la t deStudent consiste en estimar la desviación típica de los datos S y calcular elerror estándar de la media , siendo entonces el intervalo de confianzapara la media = .Es este resultado el que se utiliza en el test de Student: puesto que ladiferencia de las medias de muestras de dos distribuciones normales se
  • 5. distribuye también normalmente, la distribución t puede usarse para examinarsi esa diferencia puede razonablemente suponerse igual a cero. PRUEBA DE HIPÓTESISLa estadística inferencial es el proceso de usar la información de una muestrapara describir el estado de una población. Sin embargo es frecuente queusemos la información de una muestra para probar un reclamo o conjeturasobre la población. El reclamo o conjetura se refiere a una hipótesis. Elproceso que corrobora si la información de una muestra sostiene o refuta elreclamo se llama prueba de hipótesis (Tenorio Bahena, Jorge, 2006).Los términos prueba de hipótesis y probar una hipótesis s utilizanindistintamente. La prueba de hipótesis comienza como una afirmación, osuposición sobre un parámetro de la población, como la media poblacional(Tamayo y Tamayo, Mario, 2010).Una prueba de hipótesis consiste en contratar dos hipótesis estadísticas. Talcontraste involucra la toma de decisión acerca de las hipótesis. La decisiónconsiste en rechazar o no una hipótesis a favor de otra. (Lincoln L., 2008)Hipótesis Nula (Ho).- Se refiere siempre a un valor específico del parámetrode la población, no a una estadística de muestra. La letra H significa hipótesis yel subíndice cero no hay diferencia por lo general hay un ―no‖ en la hipótesisnula que indica que ―no hay cambio‖ podemos rechazar o aceptar ―Ho‖. (Pick,Susan y López, Ana Luisa., 2009).Hipótesis Alternativa (Ha).- Es cualquier hipótesis que sea diferente de lanula es una afirmación que se acepta si los datos muéstrales proporcionan
  • 6. evidencia suficiente de que la hipótesis nula es falsa, se le conoce tambiéncomo hipótesis de investigación el planteamiento de hipótesis alternativa nuncacontiene un signo de igualdad con respecto al valor especificado del parámetro(Pick, Susan y López, Ana Luisa., 2009).Ejemplo.EJEMPLO 1:Para evaluar el nivel mental de los ingresantes de la Universidad seestandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual)promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la pruebaa una muestra de 60 ingresantes de esta universidad se calculó que el C.I.promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel mental delos ingresantes es superior al término medio?Variable de estudio: La habilidad mental de los X estudiantes.µ = rendimiento mental promedio de los ingresantes.X = rendimiento promedio de la muestra.Solución: 1) Ho: µ= 101,2 Ha: µ > 101,2 2) Prueba unilateral de acuerdo a Ha. 3) Realizar la prueba de los niveles de significación de 5% y 1%. 4) Se admite que la variable aleatoria de la prueba es la media de los coeficientes de inteligencia Xi. 5) Como n > 30 podemos usar una distribución normal de probabilidades para calcular los valores críticos y elaborar el esquema grafico de la prueba 99%.
  • 7. 6) Calculo estadístico de la prueba. 7) Toma de decisiones:A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z=2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muysignificativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivelmental de los ingresantes es superior al término medio. CHI-CUADRADOEl llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer unacomparación global de grupos de frecuencias. Para este problema el métodoes diferente, pues el test que se utiliza se denomina Chi-Cuadrado de Pearson,y con ese test lo que queremos determinar es si la frecuencia observada de unfenómeno es significativamente igual a la frecuencia teórica prevista, o sí, porel contrario, estas dos frecuencias acusan una diferencia significativa para, porejemplo, un nivel de significación del 5%. Las posibles aplicaciones sonmuchas: elección de un cartel turístico publicitario presentado a grupos declientes; comparar la rentabilidad de un proyecto hotelero en dos espacios
  • 8. turísticos; determinar las preferencias o gustos de los turistas por determinadosespacios geográficos, o por determinados servicios hoteleros, etc.El método que se sigue es el siguiente:1) Se designan las frecuencias observadas con letras minúsculas y con letrasmayúsculas las frecuencias esperadas o teóricas.2) Las frecuencias se presentan en cuadros o tablas con un cierto número decolumnas y de filas. Pueden ser tablas de 1 x 2, o de 2 x 2 etc. Aplicaremos elmétodo con una tabla 1 x 2; y después con una tabla 2 x 2. Supongamos quese ha comprobado fallas leves (atributos) en dos proyectos turísticos que nohan satisfecho plenamente a la clientela.Estas fallas han ocurrido en los sitios turísticos A y B. O sea, de un total de 102fallas, 59 han tenido lugar en el sitio A y 43 fallas en el sitio B. Formulamos lahipótesis nula que no existe relación entre el número de fallas y el hecho deque hayan ocurrido en los sitios A y B. Si la hipótesis nula no se rechaza,quiere decir que cada sitios es independiente del hecho y entonces no existerazón para suponer que por ejemplo A es menos predispuesto a fallas que B.Si se rechaza la hipótesis nula, entonces alguno de los dos sitios si estápropenso a mayor número de fallas. Para este análisis se aplica el test Chi-cuadrado de Pearson. Vamos a observar los datos empíricos (59 y 43= 102) ylos datos esperados o sea una repartición por igual de las fallas entre elproyecto A y el B (51 y 51 = 102). a = 59 b = 43 A = 51 B = 51 La fórmula quepermite obtener el Chi-cuadrado incluye una corrección igual a O.50 por sermuestras pequeñas y su valor estimado con la fórmula es 2,206.Al ir a la tabla del encontramos que para un grado de libertad, el valor del Chi-cuadrado debe ser igual o mayor que 3,841 para un nivel de significación del5%. Dado que el valor encontrado en el anterior cálculo es igual a : 2,206,podemos admitir que la hipótesis nula es correcta, pues no existe razón parasuponer que se produzcan más fallas en el espacio turísticoA que en el espacio B. Si la tabla es de 2 x 2 De nuevo el fin del test escomparar las frecuencias observadas empíricamente de dos muestras, con lasfrecuencias esperadas o teóricas. Dos procedimientos de refrigeración ("x" e
  • 9. "y") se han ensayado en el Dpto. de Alimentos y Bebidas de un Hotel con el finde aumentar la duración de las materias primas perecederas. Los resultadosson según atributos cualitativos los siguientes: Primero veremos las frecuenciasempíricas u observadas: Refrigeración X : fracasos =77; éxitos =63 y el total140. Y para la Refrigeración Y: fracasos = 54; éxitos = 66 y el total 120. Lostotales de las tres columnas son: 131,129 y 260. En seguida veremos lasfrecuencias teóricas o esperadas: Refrigeración X : fracasos = 70,54;éxitos=69,46 y el total 140. Refrigeración Y : fracasos =60,46; éxitos = 59,54 yel total 120. Todos los totales de las tres columnas son; 131,129 y 260. Lasfrecuencias teóricas fueron estimadas de esta manera:a1 = 131 x 140 / 260 =70,54; b1 = 129 x 140 / 260 = 69,46; a2 = 131 x 120 / 260 = 60,46; b2 = 129 x120 / 260 = 59,54.Cuando las muestras son pequeñas se aplica en la fórmula una correcciónigual a 0,50. Y al aplicar la fórmula del Chi-cuadrado obtenemos el valor de:2,200. De nuevo se compara el resultado 2,20 con el de la tabla para un gradode libertad y para el nivel de significación del 5% con un valor de 3,841. Ladiferencia entre las dos muestras no es significativa y no se puede llegar aninguna conclusión razonada sobre los dos procedimientos de refrigeración.Distribución Chi-cuadrado de PearsonTabla de la función de distribución:P(n≤ z) = pz: valor tabuladop: probabilidad acumuladan: grados de libertadPara ver el cuadro seleccione la opción "Descargar" del menú superior
  • 10. ABSTRACTT OF STUDENTIs a probability distribution that arises the problem of estimating the mean of anormally distributed population when the sample size is small.Occurs naturally when performing the Student t test to determine differencesbetween two sample means and to build the confidence interval for thedifference between the means of two populations is unknown when thestandard deviation of a population and it must be estimated from data of asample. HYPOTHESIS TESTINGInferential statistics is the process of using information from a sample todescribe the status of a population. However, it is often use information from asample to prove a claim or conjecture on the population. The claim orconjecture refers to a hypothesis. The process that confirms whether theinformation from a sample stands or refute the claim is called hypothesistesting.
  • 11. The terms of hypothesis testing and test a hypothesis s used interchangeably.Hypothesis testing begins as a statement or assumption about a populationparameter, as the population mean.A hypothesis test is to hire two statistical hypotheses. This contrast involvesmaking decisions about the hypothesis. The decision is to reject or not ahypothesis in favor of another. CHI-SQUAREThe so-called Chi-square test is very common the need to make an overallcomparison of groups of frequencies. For this problem the method is different,the test used is called Chi-square test, and with that we want to test is whetherthe observed frequency of a phenomenon is significantly equal to the expectedtheoretical frequency, or yes, on the contrary, these two frequencies show asignificant difference, for example, a significance level of 5%. The possibleapplications are many: Choosing a tourist poster advertising presented to clientgroups, to compare the profitability of a hotel project in two tourist areas,determine the preferences or tastes of tourists from certain geographical areasor for certain hotel services, etc.Ejercicios.  La calificación de un grupo de estudiantes en el examen parcial (x) y en el examen final (y), fueron las siguientes. x y x Y X y x y 12 15 18 20 15 17 13 14 8 10 12 14 12 15 10 13 10 12 10 12 11 12 12 15 13 14 12 10 12 13 13 14 9 12 14 16 11 12 12 13 14 15 9 11 10 13 16 18 11 16 10 13 14 12 15 17
  • 12. a) Determinar la ecuación de regresión lineal de Y en XX y xy X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)212 15 180 144 225 0 0 -1 18 10 80 64 100 4 17 4 1510 12 120 100 144 2 4 2 313 14 182 169 196 -1 1 0 09 12 108 81 144 3 9 2 314 15 210 196 225 -2 4 -1 111 16 176 121 256 1 1 -2 518 20 360 324 400 -6 35 -6 3812 14 168 144 196 0 0 0 010 12 120 100 144 2 4 2 312 10 120 144 100 0 0 4 1514 16 224 196 256 -2 4 -2 59 11 99 81 121 3 9 3 810 13 130 100 169 2 4 1 115 17 255 225 289 -3 9 -3 1012 15 180 144 225 0 0 -1 111 12 132 121 144 1 1 2 312 13 156 144 169 0 0 1 111 12 132 121 144 1 1 2 310 13 130 100 169 2 4 1 114 12 168 196 144 -2 4 2 313 14 182 169 196 -1 1 0 010 13 130 100 169 2 4 1 112 15 180 144 225 0 0 -1 113 14 182 169 196 -1 1 0 012 13 156 144 169 0 0 1 116 18 288 256 324 -4 15 -4 1715 17 255 225 289 -3 9 -3 10 338 388 4803 4222 5528 142 151
  • 13.  El gerente de personal de la empresa P&C quiere estudiar la relación entre el ausentismo y la edad de sus trabajadores. Tomo una muestra aleatoria de 10 trabajadores de la empresa y encontró los siguientes datos. Edad (año) 25 46 58 37 55 32 41 50 23 60 Ausentismo (días por 18 12 8 15 10 13 7 9 16 6 año) a) Use el método de mínimos cuadrados para hallar la ecuación muestral que relaciona las dos variables.Edad(años) Ausentismo x Y XY X2 Y2 (xi- ) (xi- )2 (yi- ) (yi- )2 25 18 450 625 324 -17,7 313,29 6,6 43,56 46 12 552 2116 144 3,3 10,89 0,6 0,36 58 8 464 3364 64 15,3 234,09 -3,4 11,56 37 15 555 1369 225 -5,7 32,49 3,6 12,96 55 10 550 3025 100 12,3 151,29 -1,4 1,96 32 13 416 1024 169 -10,7 114,49 1,6 2,56 41 7 287 1681 49 -1,7 2,89 -4,4 19,36
  • 14. 50 9 450 2500 81 7,3 53,29 -2,4 5,76 23 16 368 529 256 -19,7 388,09 4,6 21,16 60 6 360 3600 36 17,3 299,29 -5,4 29,16427 114 4452 19833 1448 1600,1 148,4
  • 15. b) Calcule el coeficiente de determinación. De su comentario sobre el ajuste de la línea de regresión a los datos de la muestra.En la gráfica se puede observar que se obtiene una regresión lineal negativa ylos puntos de dispersión no se encuentran tan dispersos a la línea.
  • 16.  En un estudio para determinar la relación entre edad (X) y presión sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los siguientes resultados. x 54 40 70 35 62 45 55 50 38 y 148 123 155 115 150 126 152 144 114a) Encuentre la ecuación de regresión de Y en X y estime la presión sanguíneapara una mujer de 75 años.b) Utilizando t-Student pruebe la hipótesis B=0.9, contra la hipótesis B > 0,9 alnivel de significación a=0.05c) Pruebe la hipótesis nula Ho: p=0,9 contra H1: p > 0.9Número Edad(X) Presión (Y) X2 Y2 X*Y (X-X)2 (Y-Y)2 1 54 148 2916 21904 7992 16,90 136,11 2 40 123 1600 15129 4920 97,79 177,78 3 70 155 4900 24025 10850 404,46 348,44 4 35 115 1225 13225 4025 221,68 455,11 5 62 150 3844 22500 9300 146,68 186,78 6 45 126 2025 15876 5670 23,90 106,78 7 55 152 3025 23104 8360 26,12 245,44 8 50 144 2500 20736 7200 0,01 58,78 9 38 114 1444 12996 4332 141,35 498,78 449 1227 23479 169495 62649 1078,89 2214,00
  • 17. Ecuación lineal de las dos variables.Diagrama de dispersión en el plano cartesiano
  • 18. 80 70 60 50 40 Series1 30 20 10 0 0 200 400 600 800 1000 1200 1400PASOS DE UNA PRUEBA DE HIPOTESISPrimer paso formular la hipótesis nula y la hipótesis alternativaHipótesis nulaHo = β=0La hipótesis alternativaHa= β<0; β>0Segundo paso determinar si la prueba es unilateral o bilateralBilateralTercer paso Asumir el nivel se significación de la prueba99% 2.58Cuarto paso determinar la distribución muestral que se usara en la prueba
  • 19. Quinto paso elaborar el esquema de la prueba -2.58 +2.58Sexto paso calcular el estadístico de la prueba
  • 20.  En un estudio para determinar la relación entre edad (X) y presión sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los siguientes resultados: X 54 40 70 35 62 45 55 50 38 Y 148 123 155 115 150 126 152 144 114 a) Halle la ecuación de regresión de Y en X y estime la presión sanguínea para una mujer de 75 años. b) Utilizando t-Student pruebe la hipótesis , contra la hipótesis .9 al nivel de significación . c) Pruebe la hipótesis contra a) Determinar la ecuación lineal de las dos variables.Desarrollo X Y XY X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2 54 148 7992 2916 21904 4,11 16,90 11,67 136,11 40 123 4920 1600 15129 -9,89 97,79 -13,33 177,78 70 155 10850 4900 24025 20,11 404,46 18,67 348,44 35 115 4025 1225 13225 -14,89 221,68 -21,33 455,11 62 150 9300 3844 22500 12,11 146,68 13,67 186,78 45 126 5670 2025 15876 -4,89 23,90 -10,33 106,78 55 152 8360 3025 23104 5,11 26,12 15,67 245,44 50 144 7200 2500 20736 0,11 0,01 7,67 58,78 38 114 4332 1444 12996 -11,89 141,35 -22,33 498,78 449 1227 62649 23479 169495 0,00 1078,89 0,00 2214Primer casoX=Y=
  • 21. Para una persona de 75 años vamos a encontrar la presión sanguínea.
  • 22.  El gerente de ventas de una cadena de tiendas obtuvo información de los pedidos por internet y del número de ventas realizadas por esa modalidad. Como parte de su presentación en la próxima reunión de vendedores al gerente le gustaría dar información específica sobre la relación entre el número de pedidos y el número de ventas realizadas.TIENDA 1 2 3 4 5 6 7 8 9 10NÚMERO 15 DE 50 56 60 68 65 50 79 35 42PEDIDOSNÚMERO 12 DE 45 55 50 65 60 40 75 30 38VENTAS a) Use el método de mínimos cuadrados para expresar la relación entre estas dos variables. b) Haga un análisis de los coeficientes de regresión. c) ¿Proporcionan los datos suficiente evidencia para indicar que las unidades producidas aportan información para producir los gastos generales? d) Realice un análisis de la bondad del ajuste de la ecuación de regresión lineal. e) ¿Qué puede usted concluir acerca de la correlación poblacional entre gastos generales y unidades producidas?
  • 23. Desarrollo NÚMERO NÚMERO TIENDA DE DE XY X2 X-X (X-X)2 Y2 Y-X (Y-X)2 PEDIDOS VENTAS 1 50 45 2250 2500 -2 4 2025 -2 4 2 56 55 3080 3136 4 16 3025 8 64 3 60 50 3000 3600 8 64 2500 3 9 4 68 65 4420 4624 16 256 4225 18 324 5 65 60 3900 4225 13 169 3600 13 169 6 50 40 2000 2500 -2 4 1600 -7 49 7 79 75 5925 6241 27 729 5625 28 784 8 35 30 1050 1225 -17 289 900 -17 289 9 42 38 1596 1764 -10 100 1444 -9 81 10 15 12 180 225 -37 1369 144 -35 1225 TOTAL 520 470 27401 30040 0 3000 25088 0 2998X=Y=
  • 24. -4,324Ecuación lineal de las dos variables.
  • 25. PASOS DE UNA PRUEBA DE HIPOTESIS 1. Formular la hipótesis nula y la hipótesis alternativaHipótesis nulaHo = β=0La hipótesis alternativaHa= β<0; β>0 2. Determinar si la prueba es unilateral o bilateralBilateral 3. Asumir el nivel se significación de la prueba95% 1,96 4. Determinar la distribución muestral que se usara en la pruebaComo n es menor que 30 utilizaremos la T de estudent 5. Elaborar el esquema de la prueba -1.96 +1.96 6. Calcular el estadístico de la prueba (0,00987)
  • 26. En este caso la hipótesis nula se acepta. Es decir si existe relación entre el número de pedidos y las ventas que se realizan en las tiendas.  Con los siguientes datos muestralesCoeficiente de inteligencia: IQ 135 115 95 100 110 120 125 130 140Notas de un examen 16 13 12 12 14 14 15 15 18 a) Halle la ecuación de regresión muestral b) Interprete la pendiente de parcial. c) Utilizando t-Student pruebe la hipótesis = 0, contra la hipótesis >0 al nivel de significación α=0,05. ¿Se puede aceptar que =1? d) El grado de asociación entre las dos variables. e) Utilizando t-Student pruebe la hipótesis p=0 contra la hipótesis p>0 al nivel de significación α= 0,05
  • 27. Coeficiente de Notas de uniteligencia IQ exámen (Y)(X) 135 16 2160 18225 256 16,11 259,57 115 13 1495 13225 169 -3,89 15,12 95 12 1140 9025 144 -23,89 570,68 100 12 1200 10000 144 -18,89 356,79 110 14 1540 12100 196 -8,89 79,01 120 14 1680 14400 196 1,11 1,23 125 15 1875 15625 225 6,11 37,35 130 15 1950 16900 225 11,11 123,46 140 18 2520 19600 324 21,11 445,68 1070 129 15560 129100 1879 1888,89
  • 28. 1) Ho= 0 Ha>02) Es unilateral con cola derecha3) NC= 95%
  • 29. Nivel de significación α=0,05 Z= 1,65 4) n < 30 9 < 30 t—Student 5) Zona de rechazo Zona de aceptación Z= 1,65X Y XY X2 Y2 X1- (X1- )2 Y1- (Y1- )20 64 0 0 4096 -1,0 1,0 -10,8 117,01 69 69 1 4761 0,0 0,0 -5,8 33,82 94 188 4 8836 1,0 1,0 19,2 368,10 55 0 0 3025 -1,0 1,0 -19,8 392,61 60 60 1 3600 0,0 0,0 -14,8 219,52 92 184 4 8464 1,0 1,0 17,2 295,30 70 0 0 4900 -1,0 1,0 -4,8 23,21 80 80 1 6400 0,0 0,0 5,2 26,92 89 178 4 7921 1,0 1,0 14,2 201,20 84 0 0 7056 -1,0 1,0 9,2 84,41 82 82 1 6724 0,0 0,0 7,2 51,62 99 198 4 9801 1,0 1,0 24,2 584,90 73 0 0 5329 -1,0 1,0 -1,8 3,31 76 76 1 5776 0,0 0,0 1,2 1,42 95 190 4 9025 1,0 1,0 20,2 407,40 77 0 0 5929 -1,0 1,0 2,2 4,81 56 56 1 3136 0,0 0,0 -18,8 354,02 80 160 4 6400 1,0 1,0 5,2 26,90 50 0 0 2500 -1,0 1,0 -24,8 615,81 50 50 1 2500 0,0 0,0 -24,8 615,8
  • 30. 2 89 178 4 7921 1,0 1,0 14,2 201,2 0 70 0 0 4900 -1,0 1,0 -4,8 23,2 1 65 65 1 4225 0,0 0,0 -9,8 96,3 2 90 180 4 8100 1,0 1,0 15,2 230,6 0 64 0 0 4096 -1,0 1,0 -10,8 117,0 1 67 67 1 4489 0,0 0,0 -7,8 61,1 2 80 160 4 6400 1,0 1,0 5,2 26,9 ∑27 ∑2020 ∑2221 ∑45 ∑156310 ∑0,0 ∑18,0 ∑0,0 ∑5184,1Determine la ecuación de regresión de gastos sobre ingresosDESVIACIÓN
  • 31. ECUACIÓN 120 100 Gastos en educación 80 60 40 20 0 0 0.5 1 1.5 2 2.5 Nivel Socioeconomico
  • 32.  Las cantidades de un compuesto químico (Y) que se disuelve en 100 gramos de agua a diferentes temperaturas (X) se registraron en la tabla que sigue: X (ºC) Y gramos 0 10 8 10 9 11 15 15 12 14 16 18 30 27 23 25 24 26 45 33 30 32 35 34 60 46 40 43 42 45 75 50 52 53 54 55 a) Encuentre la ecuación de regresión de Y en X b) Estime la varianza de la regresión poblacional c) Determine el coeficiente de regresión estandarizado beta d) Calcule el error estándar de la pendiente b. Además desarrolle un intervalo de confianza del 95% para β. ¿Se puede aceptar que β=0.6? e) Determine un intervalo de confianza del 95% para la cantidad promedio de producto químico que se disolverá en 100 gramos de agua a 50ºC. f) Determine un intervalo de predicción del 95% para la cantidad de producto químico que se disolverá en 100 gramos de agua a 50ºC.Desarrollo: X (°C) Y gramos 0 10 8 10 9 11 11,8 15 15 12 14 16 18 15 30 27 23 25 24 26 25 45 33 30 32 35 34 32,8 60 46 40 43 42 45 43,2 75 50 52 53 54 55 52,8 225 180,6
  • 33. Y X (°C) gramos 0 11,8 0 0 139,24 1406,25 139,24 15 15 225 225 225 225 225 30 25 750 900 625 900 625 45 32,8 1476 2025 1075,84 2025 1075,84 60 43,2 2592 3600 1866,24 3600 1866,24 75 52,8 3960 5625 2787,84 5625 2787,84SEGUNDO MÉTODO
  • 34. Primer paso formular la hipótesis nula y la hipótesis alternativaHipótesis nulaHo = β=0.6La hipótesis alternativaHa= β<0.6; β>0.6Segundo paso determinar si la prueba es unilateral o bilateralBilateralTercer paso Asumir el nivel se significación de la prueba95% 1.96Cuarto paso determinar la distribución muestral que se usará en la prueba
  • 35. Quinto paso elaborar el esquema de la prueba -1.96 +1.96CONCLUSIONES La Estadística Inferencial nos ayudan a una correcta forma de emplear el mecanismo en cuanto a encontrar valores de las variables. Los ejercicios vinculados al comercio exterior ayudan a una mejor comprensión. El realizar ejercicios de reforzamiento ayudan a un fácil manejo de la Estadística Inferencial. RECOMENDACIONES Auto educarnos realizando ejercicios que nos ayuden a nuestro desarrollo Investigar término desconocidos acerca del tema Proponer un intercambio de ideas con los compañeros para aclarar dudas Reforzar nuestros conocimientos mediante nuestra investigación.ANEXOS  Un estudio en el departamento de investigación de logística acerca de la aceptabilidad de la creación de la empresa de transporte pesado se ha aplicado una encuesta a las diferentes entidades de transporte, exportadores, importadores de la localidad, obteniéndose los resultados que presenta la siguiente tabla.
  • 36. CREAR EMPRESA DE TRANSPORTE PESADOGrado de Transportistas Empresas de Exportadores Importadores TOTALperjuicio transporteAceptable 220 230 75 40 565 No 150 250 50 30 480aceptable TOTAL 370 480 125 70 1045 El nivel de significancia es de α=0.10 determinar las variables de la aceptabilidad de la creación de la empresa de transporte pesado y el lugar de la creación de la empresa. 1). la aceptabilidad y el lugar de la creación de la empresa de transporte pesado. Existe aceptabilidad en la localidad. 2). La prueba es unilateral y la cola es derecha. 3). Asumimos el nivel de significancia de α=0.10 4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos variables son cualitativas. 5). Esquema de la prueba α=0.10 2,62 6). Calculo del estadístico de la prueba
  • 37. CREAR EMPRESA DE TRANSPORTE PESADO Grado de Transportistas Empresas de Exportadores Importadores TOTAL perjuicio transporte Aceptable 200,05 230 259,52 75 67,58 40 37,85 565 220No aceptable 169,95 250 220,48 50 57,42 30 32,15 480 150 TOTAL 480 125 70 1045 370  Una empresa bananera ECUABANANO realiza exportaciones hacia América Latina, sin embargo está considerando ampliar el destino de sus exportaciones hacia Norte América, debido a que las exportaciones han crecido notablemente en los dos anteriores años se han presentado los siguientes datos: Sur América Centro México Total américa 2010 5000 7000 8500 20500 2011 6500 8000 9500 24000 Total 11500 15000 18000 44500 (valor en cajas) El nivel de significancia es de α=0.10 determinar las variables de la aceptabilidad de la ampliación de las exportaciones de ECUABANANO hacia norte américa. Desarrollo: 1). les aceptable la ampliación de las exportaciones de ECUABANANO No Existe aceptabilidad de la ampliación de las exportaciones de ECUABANANO
  • 38. 2). La prueba es unilateral y la cola es derecha.3). Asumimos el nivel de significancia de α=0.104). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dosvariables son cualitativas.5). Esquema de la pruebaα=0.106). Calculo del estadístico de la prueba 6,251 Grado de perjuicio Importadores Exportadores Transportistas TOTAL 5297,75 6910,11 8292,13 Aceptable 5000 7000 8500 20500 6202,25 8089,89 9707,86 No aceptable 6500 8000 9500 24000 TOTAL 11500 15000 18000 445007. Se acepta la Ha debido a que está en zona de rechazo, es decir que estabananera no debería ampliar las exportaciones en el 2012 y 2013, debeasegurar el crecimiento d exportaciones para poder tomar esta decisión.
  • 39.  En una empresa exportadora en un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era interesante ir anotando periódicamente el tiempo medio (medido en minutos) que se utiliza para realizar una pieza (variable Y) y el número de días desde que empezó dicho proceso de fabricación (variable X). Con ello, se pretende analizar cómo los operarios van adaptándose al nuevo proceso, mejorando paulatinamente su ritmo de producción conforme van adquiriendo más experiencia en él. A partir de las cifras recogidas, que aparecen en la tabla adjunta, se decide ajustar una función exponencial que explique el tiempo de fabricación en función del número de días que se lleva trabajando con ese método. X Y 10 35 20 28 30 23 40 20 50 18 60 15 70 13Tiempo en N° de días XY X2min. (X) (Y)10 35 350 100 -30 90020 28 560 400 -20 40030 23 690 900 -10 10040 20 800 1.600 0 050 18 900 2.500 10 10060 15 900 3.600 20 40070 13 910 4.900 30 900 280 152 5.110 14.000 0 2.800 a) Determinar la ecuación lineal de las dos variables
  • 40. Ecuaciónb) Trace el diagrama de dispersión en el plano cartesiano 40 35 30 N° de días (Y) 25 20 15 10 5 0 0 20 40 60 80 Tiempo en minutos (X)c) ¿Qué tiempo se predeciría para la fabricación del artículo cuando se lleven 100 días?d) ¿Qué tiempo transcurriría hasta que el tiempo de fabricación que se prediga sea de 10 minutos?
  • 41.  En la comercialización de manzanas, una empresa exportadora envía semanalmente lotes de 50 cajas al exterior, cada caja tiene un peso aproximado de 20 kilos. Las cajas son previamente almacenadas. Para el control de calidad se examinan al azar, si en alguna caja encuentran por lo menos una manzana malograda, esta es calificada mala. Para que pase el control mediante la inspección de la muestra no debe haber caja malograda, si solo e x i s t e u n a c a j a e s t a s e r á c a m b i a d a , s i h a y m á s d e 1 e n las 5 inspeccionadas, inspeccionaran las cincuenta cajas. Según las estadísticas pasadas de un total de 40 envíos, registro lo siguiente: Se puede afirmar que la variable número de cajas malogradas en la muestra de 5 sigue una distribución Binomial?. manzanas rojas verdes ambos Grandes 3 5 5 13 Medianas 5 4 8 17 pequeñas 7 9 6 22 total 15 18 19 521) H0: La variable número de cajas sigue una distribución Binomial. Ha: No siguen una Binomial.2) La prueba es unilateral y de una cola derecha3) Nivel de significación 0.104) Utilización del chi cuadrado5) Esquema de la prueba Gl = (c-1) (f-1) = (3-1) (3-1)
  • 42. =4 α = 0.10 En la tabla de chi cuadrada obtenemos X2 (4) = 7.7796) Calculo del estadístico de la prueba Calculo de las pruebas esperadas. manzanas Rojas verdes ambos Grandes 3.75 4.5 4.75
  • 43. 13 3 5 5 Medianas 4.90 5.88 6.21 5 4 8 17 pequeñas 6.35 7.62 8.04 7 9 6 22 total 15 18 19 52 = 0.15+ 0.06+ 0.01+ 0.002+0.60+0.52+ 0.07+ 0.25+ 0.52 =2.1827) ZA ZR 2.182 7.779 ZA= aceptamos la hipótesis nula porque La variable número de cajas sigue una distribución Binomial. En un estudio realizado en Tulcán acerca si es factible la creación de la Zona Franca en la ciudad, para la cual se aplicó una encuesta a las
  • 44. personas que se dedican al comercio exterior según su actividad, obteniéndose los resultados que se presentan a continuación: Actividad de Comercio Exterior Factibilidad Importadores Exportadores Agentes de Total Aduana Si 18 20 38 76 No 12 8 14 34 Total 30 28 52 110Al nivel de significación α= 0.05, determinar que las variables factibilidad decreación de Zona Franca y actividad de comercio exterior son independientes. a)Ho= factibilidad de creación de Zona Franca y la actividad de comercio exteriorson independientes;H1=existe dependencia entre las dos variables. b) La prueba es unilateral y de cola derecha. c) Asumimos el nivel de significación de α= 0.05 d) Utilizaremos la distribución muestral de Chi-cuadrado porque las dos variables son cualitativas e)gl= (C-1)(F-1)gl= (3-1)(2-1) = 2α= 0.05x2(2)=5.991 f) Actividad de Comercio Exterior Factibilidad Importadores Exportadores Agentes de Total Aduana Si E11 E12 E13 76 No E21 E22 E23 34
  • 45. Total 30 28 52 110 Ei 20,73 19,35 35,93 Oi 18 20 38 9,27 8,65 16,07 12 8 14g) Vemos que el valor se encuentra en la zona de aceptación por lo tanto aceptamos la Ho. Un grupo de estudiantes quiere determinar si la creación de una empresa de alquiler de contenedores para el trasporte de mercancías entre Colombia y Ecuador, se obtiene los siguientes datos.
  • 46. EMPRESA DE ALQUILER DE CONTENEDORESGrado de Transportistas Empresas de Exportadores Importadores TOTALperjuicio transporteEstán de 392 222 331 123 1068acuerdoNo Están 122 324 122 323 891 deacuerdo TOTAL 514 546 453 446 1959El nivel de significancia es de α=0.05 determinar las variables de laaceptabilidad de la creación de la empresa.1). la aceptabilidad de la creación de la empresas. Existe aceptabilidad.2). La prueba es unilateral y la cola es derecha.3) Asumimos el nivel de significancia de α=0.054) Utilizaremos la distribución maestral de Ji-Cuadrado porque las dos variablesson cualitativas.5) Esquema de la prueba6) Calculo del estadístico de la prueba
  • 47. EMPRESA DE DE ALQUILER DE CONTENEDORESGrado de Empresas deperjuicio Transportistas transporte Exportadores Importadores TOTAL 280.22 331 246.96 297,66 243,14Están deacuerdo 392 222 123 1068 206,03No Están 233,77 248,33 202,85deacuerdo 122 324 122 323 891TOTAL 514 546 453 446 1959 6,62 7,815  El concesionario Imbauto realiza una importación consistente en vehículos marca Toyota RAN, dicha empresa encargo un estudio para determinar la relación entre los gastos de publicidad semanal por televisión y la venta de los vehículos. En el estudio se obtuvieron los siguientes resultados. Semanas Gasto publicidad Ventas 1 200 29500 2 150 14750 3 300 59000 4 290 73750 5 350 88500 6 270 132750 7 400 44250 8 350 44250 9 400 177000
  • 48. Semana Volumen Valor x Y xy 1 200 29500 5900000 40000 870250000 -101,1 10223,23 -44250 1958062500,00 2 150 14750 2212500 22500 217562500 -151,1 22834,23 -59000 3481000000,00 3 300 59000 17700000 90000 3481000000 -1,1 1,23 -14750 217562500,00 4 290 73750 21387500 84100 5439062500 -11,1 123,43 0 0,00 5 350 88500 30975000 122500 7832250000 48,9 2390,23 14750 217562500,00 6 270 132750 35842500 72900 17622562500 -31,1 967,83 59000 3481000000,00 7 400 44250 17700000 160000 1958062500 98,9 9779,23 -29500 870250000,00 8 350 44250 15487500 122500 1958062500 48,9 2390,23 -29500 870250000,00 9 400 177000 70800000 160000 31329000000 98,9 9779,23 103250 10660562500,00 2710 663750 218005000 874500 70707812500 58488,89 21756250000,00 = = = 301,11 = = = 73750Prime Método 279,82x – 84257,11 -10507,11 + 279,82 xr=r=r=r=
  • 49. r=r= 0,51 Sy= 49166,67Sx= 80,61 a) Determinar la ecuación lineal de las 2 variables -10507,11 + 279,82 x b) Trace un diagrama de dispersión en el plano cartesiano. 200000 180000 160000 140000 Axis Title 120000 100000 80000 Y 60000 Linear (Y) 40000 20000 0 0 100 200 300 400 500 Axis Title c) Estime el gasto que corresponde a una venta semanal de 28750$ -10507,11 + 279,82 x
  • 50. d) Si la venta es de $26027,72 que gasto puede realizar dicho obrero en la semana -10507,11 + 279,82 x -10507,11 + 279,82 (26027,72) 7283076,61 e) Si el gasto es de $450 cuál es su venta. -10507,11 + 279,82 x =xX= 39,16  Si la vida media de operación de una pila de linterna es de 24 horas y está distribuida nor malmente con una desviación de 3 horas. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 pilas tenga una media que se desvíe por más de 30 minutos del Promedio?SOL UCIÓN
  • 51. σ = 3 horas n= 100 pilas  Establecer la relación entre el número de pólizas de seguros contratados durante la semana anterior ―X‖ y el número de vehículos con seguro que salieron con mercancía de exportación desde el Ecuador ―Y‖. Calcular la ecuación. 2 2X Y XY X Y10 12 120 100 -6,14 37,73 144,00 -7,14 51,0212 13 156 144 -4,14 17,16 169,00 -6,14 37,7315 15 225 225 -1,14 1,31 225,00 -4,14 17,1616 19 304 256 -0,14 0,02 361,00 -0,14 0,0218 20 360 324 1,86 3,45 400,00 0,86 0,7320 25 500 400 3,86 14,88 625,00 5,86 34,3122 30 660 484 5,86 34,31 900,00 10,86 117,88 113 134 2325 1933 108,86 2824,00 258,86
  • 52. Primera forma de cálculo

×