Manual spss
Upcoming SlideShare
Loading in...5
×
 

Manual spss

on

  • 2,566 views

exposicion

exposicion

Statistics

Views

Total Views
2,566
Views on SlideShare
2,566
Embed Views
0

Actions

Likes
0
Downloads
88
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft Word

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Manual spss Manual spss Document Transcript

  • FACULTAD DE: COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMÍA EMPRESARIAL ESCUELA DE:COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL ESTADISTICA INFERENCIAL ESTUDIANTE: Deicy Cumbal DOCENTE: MSC. JORGE POZO NIVEL: 6to “A” Com.Ext 2012-07-12
  • TEMA: Utilización de un programa informático para la aplicación de losestadísticos de la estadística inferencial.PROBLEMA: El desconocimiento del contexto de losestadísticos no hapermitido la resolución de problemas prácticos aplicados al Comercio Exterior.OBJETIVO GENERAL Manejar correctamente un programa informático que permita determinar de manera veraz los diferentesestadísticos (Correlación, Regresión Lineal, Prueba de Hipótesis, T- Student, Chi- Cuadrado) en problemas prácticos del comercio exterior.OBJETIVOS ESPECIFICOS Fundamentar científicamente Correlación, Regresión Lineal, Prueba de Hipótesis, T- Student, Chi- Cuadrado y Programas GRAPH y SPSS. Resolver problemas prácticos con la aplicación del programa informático GRAPH y SPSS Analizar los resultados obtenidos en los programas GRAPH Y SPSSJUSTIFICACIÓNSe ha decidido investigar este problema porque tiene una gran relación con lacarrera de Comercio Exterior, no solo nos permitirá obtener conocimientos en elámbito educativo y cumplir con una tarea asignada sino que será de gran ayudapara un mejor manejo de los programas informáticos.Además esta investigación se la realiza con el fin de poder realizar problemasprácticos aplicando la estadística inferencial con la utilización de programasinformáticos como el GRAPH y SSPSS, que estén vinculados con el comercioexterior, en especial en lo referente la comercialización de productos yaelaborados, así como también en los gastos que esto incurre. Para la presenteinvestigación se utilizará el método analítico ya que a través de un breve
  • análisis se realizarán problemas prácticos con la utilización de un programainformático para una mejor comprensión del tema.El proyecto será factible debido a que no necesita demasiados recursoseconómicos, con la información conseguida, la tecnología requerida y el tiempodistribuido de la manera adecuada podremos proseguir a la investigaciónnecesaria para poder dar solución al problema propuesto.MARCO TEORICOESTADISTICOS1. CORRELACIÓNLa correlación es el grado de interconexión entre variables, que intentadeterminar con que precisión describe o explica la relación entre variables enuna ecuación lineal o de cualquier otro tipo. (HOWARD B., 2008)1.1. Correlación linealSi X y Y son las dos variables en cuestión, un diagrama de dispersión muestrala localización de los puntos (X,Y) sobre un sistema rectangular decoordenadas. Si todos los puntos del diagrama de dispersión parecen estar enuna recta la correlación se llama lineal. En tales casos, una ecuación lineal esadecuada a efectos de regresión o estimación. (HOWARD B., 2008) 6 5 4 3 2 1 0 0 1 2 3 4 a) Correlación lineal positiva
  • 3.5 3 2.5 2 1.5 1 0.5 0 0 1 2 3 4 b) Correlación lineal negativa 3.5 3 2.5 2 1.5 1 0.5 0 0 0.5 1 1.5 2 2.5 3 c) Sin correlaciónSi Y tiende a crecer cuando X crece, como en la figura a), la correlación se dicepositiva, o directa. Si Y tiende a decrecer cuando X crece como en la figura b),la correlación se dice negativa, o inversa. (HOWARD B., 2008)Si todos los puntos parecen estar sobre una cierta curva, la correlación se llamano lineal, y una ecuación no lineal será apropiada para la regresión. Es claroque la correlación no lineal puede ser positiva o negativa. (HOWARD B., 2008)Si no hay relación entre las variables, como en la figura c), decimos que no haycorrelación entre ellas.1.2. Propiedades del coeficiente de correlaciónEl coeficiente de correlación e es un número que indica qué tanto estánrelacionadas dos variables. Su valor varía entre -1 y 1. Si e =1 o e = -1, existe
  • una relación lineal perfecta entre x y y. Si e = 0, no existe relación lineal entre xy y. Si es positiva, decimos que la correlación es positiva. Es decir, unincremento en una de las variables va acompañado de un incremento en la otra.Si e es negativa, decimos que la correlación es negativa. Esto es, unincremento en una variable va acompañado por una disminución en la otra.(MURRAY R., 1991)1.3. Coeficiente de correlación de pearsonEs un número calculado de un conjunto de datos bivariable que estima lacorrelación e entre dos variables x y y. Calculamos el valor de r por la siguientefórmula para datos de nivel intervalo-proporción:2. REGRESIÓN LINEALEn estadística la regresión lineal o ajuste lineal es un método matemático quemodeliza la relación entre una variable dependiente Y, las variablesindependientes Xi y un término aleatorio.El término regresión se utilizó por primera vez en el estudio de variablesantropométricas: al comparar la estatura de padres e hijos, resultó que los hijoscuyos padres tenían una estatura muy superior al valor medio tendían aigualarse a éste, mientras que aquellos cuyos padres eran muy bajos tendían areducir su diferencia respecto a la estatura media; es decir, "regresaban" alpromedio. La constatación empírica de esta propiedad se vio reforzada mástarde con la justificación teórica de ese fenómeno.El término lineal se emplea para distinguirlo del resto de técnicas de regresión,que emplean modelos basados en cualquier clase de función matemática. Losmodelos lineales son una explicación simplificada de la realidad, mucho más
  • ágil y con un soporte teórico por parte de la matemática y la estadística muchomás extenso.Los análisis de regresión y correlación nos permiten determinar tanto lanaturaleza como la fuerza de una relación entre dos variables; de esta forma, sepuede pronosticar, con cierta precisión, el valor de una variable desconocidabasándonos en observaciones anteriores de ésa y otras variables.2.1. Ecuaciones normales y línea de regresión de los mínimos cuadradosLas ecuaciones normales son un conjunto de ecuaciones cuya solución produceun valor único para la pendiente b1 y la ordenada b0 asociada con los datosbivariables Obtenemos estas ecuaciones aplicando el principio de los mínimoscuadrados, con valores de b0 y b1, escogidos para minimizar el término al cual se le llama suma de cuadrados por falla (error).Las ecuaciones normales que resultan de la minimización, según este procesoson como sigue.Resolviendo estas dos ecuaciones para b0 y b1, obtenemosDonde y son las medidas de los conjuntos de valores X e YLuego sustituimos los números obtenidos en estas fórmulas en la fórmula a la cual se le llama línea de regresión de los mínimoscuadrados.
  • Supongamos que se tiene un conjunto de datos para el cual hemos trazado lagráfica de puntos dispersos. Nuestro propósito es encontrar un posible patrónen los datos. Si resulta que el diagrama presenta un patrón curvilíneo preciso,esta restricción puede parecer un poco ruda. Sin embargo, muchas veces esmuy razonable y práctico en tales casos tratar de ajustar una línea recta alpatrón curvilíneo sobre una sección básicamente lineal del Conjunto de datos.Por lo general se obtienen resultados útiles de tal consideración.3. PRUEBA DE HIPOTESISLa estadística inferencial es el proceso de usar la información de una muestrapara describir el estado de una población. Sin embargo es frecuente queusemos la información de una muestra para probar un reclamo o conjeturasobre la población. El reclamo o conjetura se refiere a una hipótesis. Elproceso que corrobora si la información de una muestra sostiene o refuta elreclamo se llama prueba de hipótesis (Tenorio Bahena, Jorge, 2006).Los términos prueba de hipótesis y probar una hipótesis s utilizanindistintamente. La prueba de hipótesis comienza como una afirmación, osuposición sobre un parámetro de la población, como la media poblacional(Tamayo y Tamayo, Mario, 2010).Una prueba de hipótesis consiste en contratar dos hipótesis estadísticas. Talcontraste involucra la toma de decisión acerca de las hipótesis. La decisiónconsiste en rechazar o no una hipótesis a favor de otra. (Lincoln L., 2008)3.1. Hipótesis Nula (Ho)Se refiere siempre a un valor específico del parámetro de la población, no a unaestadística de muestra. La letra H significa hipótesis y el subíndice cero no haydiferencia por lo general hay un “no” en la hipótesis nula que indica que “no hay
  • cambio” podemos rechazar o aceptar “Ho”.(Pick, Susan y López, Ana Luisa.,2009).3.2. Hipótesis Alternativa (Ha)Es cualquier hipótesis que sea diferente de la nula es una afirmación que seacepta si los datos muéstrales proporcionan evidencia suficiente de que lahipótesis nula es falsa, se le conoce también como hipótesis de investigación elplanteamiento de hipótesis alternativa nunca contiene un signo de igualdad conrespecto al valor especificado del parámetro (Pick, Susan y López, Ana Luisa.,2009).4. T- STUDENTEs una distribución de probabilidad que surge del problema de estimar la mediade una población normalmente distribuida cuando el tamaño de la muestra espequeño.Aparece de manera natural al realizar la prueba T de Student para ladeterminación de las diferencias entre dos medias muestrales y para laconstrucción del intervalo de confianza para la diferencia entre las medias dedos poblaciones cuando se desconoce la desviación típica de una población yésta debe ser estimada a partir de los datos de una muestra.La distribución T de Student es la distribución de probabilidad del cocienteDónde:Z tiene una distribución normal de media nula y varianza 1V tiene una distribución ji-cuadrado con grados de libertadZ y V son independientes
  • Si μ es una constante no nula, el cociente es una variable aleatoriaque sigue la distribución T - Student no central con parámetro de no-centralidad.4.1. Aparición y especificaciones de la distribución T-StudentSupongamos que X1,..., Xn son variables aleatorias independientes distribuidasnormalmente, con media μ y varianza σ2. SeaLa media muestral. EntoncesSigue una distribución normal de media 0 y varianza 1.Sin embargo, dado que la desviación estándar no siempre es conocida deantemano, Gosset estudió un cociente relacionado,Dónde:
  • 5. CHI-CUADRADOEl llamado Test de Chi-cuadrado es muy usual la necesidad de hacer unacomparación global de grupos de frecuencias. Para este problema el método esdiferente, pues el test que se utiliza se denomina Chi-Cuadrado de Pearson, ycon ese test lo que queremos determinar es si la frecuencia observada de unfenómeno es significativamente igual a la frecuencia teórica prevista, o sí, por elcontrario, estas dos frecuencias acusan una diferencia significativa para, porejemplo, un nivel de significación del 5%.El método que se sigue es el siguiente:1.Se designan las frecuencias observadas con letras minúsculas y con letrasmayúsculas las frecuencias esperadas o teóricas.2.Las frecuencias se presentan en cuadros o tablas con un cierto número decolumnas y de filas. Pueden ser tablas de 1 x 2, o de 2 x 2 etc. Aplicaremos elmétodo con una tabla 1 x 2; y después con una tabla 2 x 2. Supongamos que seha comprobado fallas leves (atributos) en dos proyectos turísticos que no hansatisfecho plenamente a la clientela.Formulamos la hipótesis nula que no existe relación entre el número de fallas yel hecho de que hayan ocurrido en los sitios A y B. Si la hipótesis nula no serechaza, quiere decir que cada sitios es independiente del hecho y entonces noexiste razón para suponer que por ejemplo A es menos predispuesto a fallasque B.Si se rechaza la hipótesis nula, entonces alguno de los dos sitios si estápropenso a mayor número de fallas. Para este análisis se aplica el test Chi-cuadrado de Pearson
  • 6. VARIANZALa varianza es la media aritmética del cuadrado de las desviaciones respecto ala media de una distribución estadística. Suele representarse comoEstá medida en unidades distintas de las de la variable. Por ejemplo, si lavariable mide una distancia en metros, la varianza se expresa en metros alcuadrado. La desviación estándar, es la raíz cuadrada de la varianza, es unamedida de dispersión alternativa expresada en las mismas unidades de losdatos de la variable objeto de estudio. La varianza tiene como valor mínimo 0.Hay que tener en cuenta que la varianza puede verse muy influida porlos valores atípicos y no se aconseja su uso cuando las distribuciones de lasvariables aleatorias tienen colas pesadas. En tales casos se recomienda el usode otras medidas de dispersión más robustas.
  • PROGRAMAS INFORMATICOSGRAPHEs un programa diseñado para representar gráficamente funcionesmatemáticas en un sistema de coordenadas. Es un programa afín a Windows,con menús y cuadros de diálogo, y capaz de dibujar funciones explícitas,paramétricas y polares, e igualmente, tangentes, rellenos, series de puntos,ecuaciones e inecuaciones. Asimismo, permite evaluar una gráfica en un puntodado u obtener una tabla de valores respecto a la función seleccionada, ymucho más.
  • SPSS STATISTICSEs un programa estadístico informático muy usado en las empresas deinvestigación de mercado. Originalmente SPSS fue creado como el acrónimode StatisticalPackageforthe Social Sciences aunque también se ha referidocomo "StatisticalProduct and ServiceSolutions".Sin embargo, en la actualidad la parte SPSS del nombre completo del software(IBM SPSS) no es acrónimo de nada.Como programa estadístico es muy popular su uso debido a la capacidad detrabajar con bases de datos de gran tamaño. Además, de permitir larecodificación de las variables y registros según las necesidades del usuario.El programa consiste en un módulo base y módulos anexos que se han idoactualizando constantemente con nuevos procedimientos estadísticos. Cadauno de estos módulos se compra por separado.Actualmente, compite no sólo con software licenciado como lo sonSAS, MATLAB, Statistica, Stata, sino también con software de código abierto ylibre, de los cuales el más destacado es el Lenguaje R. R.
  • Pasos para descargar el programa informático SPSSStatistics 1. Ingresamos a internet 2. Con la ayuda del buscador Googledescargamos el programa SPSS
  • 3. procedemos a descargar el programa4. Aparecerá la siguiente pantalla de aviso para poder instalar el programa.5. Clic en ejecutar para poder instalar el programa y aparece la siguiente pantalla.
  • 6. Aceptamos todas las condiciones y el programa se inicia a instalar
  • El mismo procedimiento se realizará para la descarga del programa estadísticoGRAPHABSTRAC1. CORRELATIONThe correlation is the interconnection grade among variables that he/she tries todetermine with which precision describes or he/she explains the relationshipamong variables in a lineal equation or of any other type.If X and Y they are the two variables in question, a dispersion diagram showsthe localization of the points (X,Y) on a rectangular system of coordinated. If allthe points of the dispersion diagram seem to be in a straight line the correlationhe/she calls himself lineal. In such cases, a linealequation is adapted toregression effects or estimate.2. LINEAL REGRESSIONIn statistic the lineal regression or lineal adjustment is a mathematical methodthat modeliza the relationship among a dependent variable AND, theindependent variables Xi and a random term.
  • The term regression was used for the first time in the study of variableantropométricas: when comparing the stature of parents and children, it was thatthe children whose parents had a very superior stature to the half value spreadto be equaled this, while those whose parents were very low spread to reducetheir difference regarding the half stature; that is to say, "they returned" to theaverage. The empiric verification of this property was reinforced later with thetheoretical justification of that phenomenon.The lineal term is used for to distinguish it of the rest of technical of regressionthat models use based on any kinds of mathematical function. The lineal modelsare a simplified explanation of the reality, much more agile and with a theoreticalsupport on the part of the mathematics and the much more extensive statistic.3. TEST OF HYPOTHESISThe statistical inferencial is the process of using the information of a sample todescribe the state of a population. However it is frequent that we use theinformation of a sample to prove a birdcall or conjecture on the population. Thebirdcall or conjecture refers to a hypothesis. The process that corroborates ifthe information of a sample sustains or it refutes the birdcall he/she calls himselfhypothesis test.The terms hypothesis test and to prove a hypothesis s uses indistinctly. Thehypothesis test begins like a statement, or supposition on the populationsparameter, as the populational stocking.4. T - STUDENTIt is a distribution of probability that arises of the problem of estimating thestocking of an usually distributed population when the size of the sample issmall.He/she appears between two from a natural way when carrying out the test T ofStudent for the determination of the differences stockings you show them andfor the construction of the interval of trust for the difference between the
  • stockings of two populations when you ignores the typical deviation of apopulation and this should be dear starting from the data of a sample.5. CHI-SQUAREThe call Test of Chi-square is very usual the necessity to make a globalcomparison of groups of frequencies. For this problem the method is different,because the test that is used is denominated Chi-square of Pearson, and withthat test what we want to determine is if the observed frequency of aphenomenon is significantly similar to the foreseen theoretical frequency, or yes,on the contrary, these two frequencies accuse a significant difference for, forexample, a level of significance of 5%.6. VARIANCEThe variance is the arithmetic stocking of the square of the deviations regardingthe stocking of a statistical distribution. It does usually representIt is measured in units different from those of the variable. For example, if thevariable measures a distance in meters, the variance is expressed in meters tothe square. The standard deviation, is the square root of the variance, it is ameasure of alternative dispersion expressed in the same units of the data of thevariable study object. The variance has as minimum value 0.It is necessary to keep in mind that the variance can it turns very influenced bythe atypical values and he/she doesnt seek advice its use when the distributionsof the random variables have heavy lines. In such cases the use of other morerobust dispersion measures is recommended.GRAPHIt is a program designed to represent functions mathematics graphically in asystem of coordinated. It is a kindred program to Windows, with menus anddialogue squares, and able to draw explicit, parametric and polar functions, andequally, tangents, fillers, series of points, equations and inequations. Also, it
  • allows to evaluate a graph in a given point or to obtain a chart of valuesregarding the selected function, and much more.SPSS STATISTICSIt is a computer statistical program very used in the companies of marketinvestigation. Originally SPSS was created as the acronym of StatisticalPackage for Social the Sciences although he/she has also referred as"Statistical Product and Service Solutions."However, at the present time the part SPSS of the complete name of thesoftware (IBM SPSS) it is not acronym of anything.As statistical program it is very popular their use due to the capacity to work withdatabases of great size. Also, of allowing the recodification of the variables andregistrations according to the users necessities.The program consists on a module it bases and annexed modules that haveconstantly left upgrading with new statistical procedures. Each one of thesemodules is bought for separate.At the moment, it not only competes with graduated software as they are it SAS,MATLAB, Statistica, Stata, but also with software of open and free code, ofwhich the most outstanding is the Language R. R.
  • MANUAL SPSS ESTADISTICOSCORRELACIÓNLa empresa “Madesa” quiere determinar si las exportaciones en el segundoaño están correlacionadas con las exportaciones del primero. Para facilitar seelige una muestra de ocho exportaciones realizadas en los diferentes años adistintos países las cuales aparecen en la siguiente tabla: PAISES EXPORTACIONES EXPORTACIONES (año 2008) (año 2009) 1 60 60 2 75 100 3 70 80 4 72 68 5 45 73 6 83 97 7 80 85 8 65 90 a) Construya una gráfica de dispersión utilizando los datos de las exportaciones del primer año como la variable X. 120 y = 0.664x + 35.93 100 80 Axis Title 60 40 20 0 0 10 20 30 40 50 60 70 80 90 Axis Title
  • b) calcule el valor de la r de Pearson. X Y X² Y² XY 60 60 3600 3600 3600 75 100 5625 10000 7500 70 80 4900 6400 5600 72 68 5184 4624 4896 45 73 2025 5329 3285 83 97 6889 9409 8051 80 85 6400 7225 6800 65 90 4225 8100 5850
  • CALCULO SPSS 1. En el programa SPSS ingresamos las 2 variables de estudio, que para el caso son: las exportaciones y las importaciones totales del Ecuador. 2. En la barra vista de variables, cambiamos los nombres a las 2 variables (sin espacios)
  • 3. En la barra de herramienta elegimos la opción Analizar, correlación y bivariadas4. Ubicamos la variable dependiente e independiente según corresponda
  • 5. En la pestaña Gráficos, en la opción Cuadro de diálogos antiguos seleccionamos las casillas Dispersión por Puntos6. En la pestaña Gráficos, en la opción Cuadro de diálogos antiguos seleccionamos las casillas Dispersión por Puntos, luego Dispersión simple y continuar
  • 7. Esperaremos a que se procesen y aparezcan la ventana de ResultadosANALISIS DE LOS RESULTADOS Correlaciones exportacion exportacion es2008 es2009 exportaciones2 Correlación de 1 ,575 008 Pearson Sig. (bilateral) ,136 N 8 8 exportaciones2 Correlación de ,575 1 009 Pearson Sig. (bilateral) ,136 N 8 8
  • Podemos darnos cuenta que existe una asociación positiva entre lasexportaciones realizadas en el año.REGRESIÓNSe desea saber si existe una relación lineal simple entre las exportacionestotales del Ecuador y las importaciones totales del Ecuador alcanzadas en losaños 2008- 2012. a. Representar gráficamente la asociación entre las exportaciones y las importaciones b. Determine la ecuación de regresión muestral. AÑO – MES Exportaciones x Importaciones y 2008-01 1576 1262 2008-02 1618 1055 2008-03 1446 1243 2008-04 1705 1396 2008-05 1999 1289 2008-06 1932 1590 2008-07 1858 1720 2008-08 1837 1646 2008-09 1553 1679 2008-10 1310 1804 2008-11 1062 1488 2008-12 918 1373 2009-01 873 1224 2009-02 800 1031 2009-03 993 1119 2009-04 1018 1019 2009-05 1113 1120 2009-06 1167 1090 2009-07 1237 1143 2009-08 1359 1082 2009-09 1212 1265 2009-10 1369 1284 2009-11 1249 1271
  • 2009-12 1467 14178 2010-01 1334 1429 2010-02 1286 1190 2010-03 1514 1428 2010-04 1576 1679 2010-05 1360 1501 2010-06 1469 1542 2010-07 1397 1699 2010-08 1328 1872 2010-09 1392 1564 2010-10 1613 1738 2010-11 1489 1857 2010-12 1726 1773 2011-01 1621 1619 2011-02 1690 1511 2011-03 2032 1888 2011-04 1831 1854 2011-05 2009 1942 2011-06 1863 1981 2011-07 1974 1803 2011-08 1772 2008 2011-09 1856 2075 2011-10 1827 2035 2011-11 1868 2135 2011-12 1975 2089 2012-01 2120 2011 2012-02 2021 1773 TOTAL GENERAL 76614 90367Fuente: PROECUADORElaboración:PROECUADOR
  • CÁLCULO DE FORMA MANUAL 2 2 2 2AÑO – MES Exportaciones X Importaciones Y XY X Y X1- (X1- ) Y1- (Y1- ) 2008-01 1576 1262 1988912 2483776 1592644 43,7 1911,4 -545,3 297395,7 2008-02 1618 1055 1706990 2617924 1113025 85,7 7347,9 -752,3 566015,5 2008-03 1446 1243 1797378 2090916 1545049 -86,3 7444,2 -564,3 318479,6 2008-04 1705 1396 2380180 2907025 1948816 172,7 29832,2 -411,3 169200,6 2008-05 1999 1289 2576711 3996001 1661521 466,7 217827,6 -518,3 268676,4 2008-06 1932 1590 3071880 3732624 2528100 399,7 159776,1 -217,3 47236,7 2008-07 1858 1720 3195760 3452164 2958400 325,7 106093,5 -87,3 7628,3 2008-08 1837 1646 3023702 3374569 2709316 304,7 92854,3 -161,3 26030,6 2008-09 1553 1679 2607487 2411809 2819041 20,7 429,3 -128,3 16471,2 2008-10 1310 1804 2363240 1716100 3254416 -222,3 49408,4 -3,3 11,2 2008-11 1062 1488 1580256 1127844 2214144 -470,3 221163,3 -319,3 101978,0 2008-12 918 1373 1260414 842724 1885129 -614,3 377339,9 -434,3 188651,2 2009-01 873 1224 1068552 762129 1498176 -659,3 434650,1 -583,3 340285,6 2009-02 800 1031 824800 640000 1062961 -732,3 536234,0 -776,3 602703,8 2009-03 993 1119 1111167 986049 1252161 -539,3 290822,9 -688,3 473812,0 2009-04 1018 1019 1037342 1036324 1038361 -514,3 264483,9 -788,3 621480,0 2009-05 1113 1120 1246560 1238769 1254400 -419,3 175795,7 -687,3 472436,3 2009-06 1167 1090 1272030 1361889 1188100 -365,3 133429,5 -717,3 514576,7 2009-07 1237 1143 1413891 1530169 1306449 -295,3 87190,3 -664,3 441347,6 2009-08 1359 1082 1470438 1846881 1170724 -173,3 30026,0 -725,3 526118,1 2009-09 1212 1265 1533180 1468944 1600225 -320,3 102579,3 -542,3 294132,7
  • 2009-10 1369 1284 1757796 1874161 1648656 -163,3 26660,4 -523,3 273884,82009-11 1249 1271 1587479 1560001 1615441 -283,3 80247,6 -536,3 287660,62009-12 1467 14178 20799126 2152089 201015684 -65,3 4261,5 12370,7 153033228,82010-01 1334 1429 1906286 1779556 2042041 -198,3 39315,0 -378,3 143141,22010-02 1286 1190 1530340 1653796 1416100 -246,3 60653,8 -617,3 381108,72010-03 1514 1428 2161992 2292196 2039184 -18,3 334,2 -379,3 143898,82010-04 1576 1679 2646104 2483776 2819041 43,7 1911,4 -128,3 16471,22010-05 1360 1501 2041360 1849600 2253001 -172,3 29680,4 -306,3 93844,22010-06 1469 1542 2265198 2157961 2377764 -63,3 4004,4 -265,3 70405,32010-07 1397 1699 2373503 1951609 2886601 -135,3 18300,7 -108,3 11737,62010-08 1328 1872 2486016 1763584 3504384 -204,3 41730,3 64,7 4180,92010-09 1392 1564 2177088 1937664 2446096 -140,3 19678,5 -243,3 59214,42010-10 1613 1738 2803394 2601769 3020644 80,7 6515,7 -69,3 4808,02010-11 1489 1857 2765073 2217121 3448449 -43,3 1873,2 49,7 2466,12010-12 1726 1773 3060198 2979076 3143529 193,7 37527,4 -34,3 1179,22011-01 1621 1619 2624399 2627641 2621161 88,7 7871,2 -188,3 35472,02011-02 1690 1511 2553590 2856100 2283121 157,7 24875,6 -296,3 87817,42011-03 2032 1888 3836416 4129024 3564544 499,7 249720,1 80,7 6506,02011-04 1831 1854 3394674 3352561 3437316 298,7 89233,6 46,7 2177,22011-05 2009 1942 3901478 4036081 3771364 476,7 227262,0 134,7 18133,32011-06 1863 1981 3690603 3470769 3924361 330,7 109375,7 173,7 30157,82011-07 1974 1803 3559122 3896676 3250809 441,7 195116,6 -4,3 18,82011-08 1772 2008 3558176 3139984 4032064 239,7 57465,7 200,7 40264,42011-09 1856 2075 3851200 3444736 4305625 323,7 104794,6 267,7 71641,9
  • 2011-10 1827 2035 3717945 3337929 4141225 294,7 86859,9 227,7 51829,1 2011-11 1868 2135 3988180 3489424 4558225 335,7 112707,9 327,7 107361,1 2011-12 1975 2089 4125775 3900625 4363921 442,7 196001,0 281,7 79332,4 2012-01 2120 2011 4263320 4494400 4044121 587,7 345414,8 203,7 41477,4 2012-02 2021 1773 3583233 4084441 3143529 488,7 238847,2 -34,3 1179,2TOTAL GENERAL 76614 90367 141539934 123138980 324719159 0,0 5744880,1 0,0 161395265,2
  • a. Representar gráficamente la asociación entre las exportaciones y las importaciones 16000 y = 0.534x + 987.8 R² = 0.010 14000 12000 10000 8000 6000 4000 2000 0 0 500 1000 1500 2000 2500b. Determine la ecuación de regresión muestral.COVARIANZAVARIANZA
  • ORDENADA AL ORIGENPENDIENTEECUACION
  • CALCULO SPSS 1. En el programa SPSS ingresamos las 2 variables de estudio, que para el caso son: las exportaciones y las importaciones totales del Ecuador. 8. En la barra vista de variables, cambiamos los nombres a las 2 variables (sin espacios)
  • 2. En la barra de herramienta elegimos la opción Analizar3. seleccionamos la opción regresión y lineal
  • 4. Ubicamos la variable dependiente e independiente según corresponda
  • 5. En la pestaña Opciones, en la casilla criterios de métodos por pasos, seleccionamos la opción Usar Probabilidad de F y clic en Continuar.6. Abrimos la pestaña Estadísticos y seleccionamos las Casillas Descriptivos y Correlaciones parciales y Semiparcialesy continuamos.
  • 7. En la pestaña Gráficos, en la opción Gráficos de residuos típica seleccionamos las casillas Histograma y Gráfico de prob. normal, clic en Continuar y Aceptar8. Esperaremos a que se procesen y aparezcan la ventana de Resultados
  • ANALISIS DE LOS RESULTADOS Estadísticos descriptivos Media Desviación típica N Importaciones 1807.3400 1814.87766 50 Exportaciones 1532.2800 342.40685 50Comparando los resultados obtenidos en la tabla de estadísticos descriptivosdel SPSS y los resultados obtenidos mediante las formulas estadísticaslogramos determinar que la media de la variable X=1532,28 y la media de lavariable Y=1807,34.PENDIENTEORDENADA AL ORIGEN
  • ECUACION a Coeficientes Coeficientes Coeficientes no estandarizados tipificados CorrelacionesModelo B Error típ. Beta t Sig. Orden cero Parcial Semiparcial1 (Constante) 987.870 1194.469 .827 .412 Exportaciones .535 .761 .101 .703 .486 .101 .101 .101a. Variable dependiente: Importaciones En el cuadro llamado Coeficientes, el modelo Constante viene siendo la ordenada al origen= 987,87 y el modelo Exportaciones viene siendo la pendiente= 0,535.Dados dichos resultados se puede obtener la ecuación remplazando en la formula estadística Siendo: a=ordenada al origen b=pendiente El coeficiente tipificado Beta viene siendo la r de Pearson, haciendo una comparación con la utilización de la formula estadística tenemos que r =0,101.
  • PRUEBA DE HIPOTESISUna compañía dedicada a la producción y exportación de quesos, adquiereleche de un establo cercano. Sin embargo, se sospecha de la adición de agua ala leche. Un método fácil para determinar la calidad de la leche, es evaluandosu punto de congelación, ya que este varia con respecto a del agua. Latemperatura promedio de congelación de la leche pura es de -0,545°C. Encambio la temperatura de congelación del agua puede modelarse con unanormal con medida de 0°C. Se tomaron 50 muestras de leche del establo y seles midió la temperatura de congelación, 20 de ellas demostraron tener agua.¿La temperatura de congelación de la leche puede modelarse con unadistribución normal, a un nivel de significancia de un 5%? ¿Muestran los datosevidencia estadística de que se le agrega agua a la leche destinada a laproducción y exportación de quesos?
  • a. Determinar si la temperatura de congelación de la leche puede modelarse con una distribución normal. utilizar un nivel de significancia del 5%.b. Establecer la hipótesis nula y alternativa Litros leche temperatura °C 1 -0,54 2 -0,41 3 -0,456 4 -0,439 5 -0,513 6 -0,508 7 -0,499 8 -0,515 9 -0,502 10 -0,527 11 -0,54 12 -0,41 13 -0,456 14 -0,439 15 -0,513 16 -0,508 17 -0,499 18 -0,515 19 -0,502 20 -0,527 21 -0,54 22 -0,41 23 -0,456 24 -0,439 25 -0,513 26 -0,508 27 -0,499 28 -0,515
  • 29 -0,502 30 -0,527 31 -0,54 32 -0,41 33 -0,456 34 -0,439 35 -0,513 36 -0,508 37 -0,499 38 -0,515 39 -0,502 40 -0,527 41 -0,54 42 -0,41 43 -0,456 44 -0,439 45 -0,513 46 -0,508 47 -0,499 48 -0,515 49 -0,502 50 -0,527CÁLCULO DE FORMA MANUAL1. PASO: hallar la hipótesis nula y alternativaHo: SI U ≤ a -0.545°C, es decir la temperatura media de congelación de laleche es menor o igual a -0.545°CHa: Si U> a -0.545, es decir la temperatura media de congelación de la lechees mayor a -0.545°C2. PASO: determinar la cola
  • 3. PASO: determinar el nivel de confianza y significanciaNC = 95%4. PASO: determinar si es prueba de hipótesis o T- Studentn> 3050 > 30Como n es mayor a 30 se utilizara Prueba de Hipótesis5. PASO: elaborar la campana de gauss6. PASO: determinar el valor z
  • 7. PASO: toma de decisionesError de tipo 2Hay evidencia estadística suficiente que indica, que la temperatura media de laleche es mayor a -0,545°C a un nivel de significancia de 5%, es decir lacompañía de quesos tiene razón y el establo donde adquiere la leche para laelaboración de sus quesos le está poniendo agua a la leche.Se rechaza la hipótesis nula y se acepta la alternativa, el valor de puntaje de zestá en la zona de rechazo, por lo tanto aceptamos la hipótesis alternativa.CÁLCULO SPSS1. En el programa SPSS ingresamos la variables de estudio, que para el caso es: la temperatura °C
  • 2. En la barra vista de variables, cambiamos el nombre a lavariable (sin espacios)3. En la barra de herramienta elegimos la opción Analizar y seleccionamos Prueba T para una muestra
  • 4. En la siguiente pantalla pasamos la variable temperatura a la variable para contrastar y ubicamos el valor de prueba que para el caso es -0.545 y aceptamos.5. Esperamos a que se procese y se abra la ventana de resultado
  • ANALISIS DE RESULTADOS Estadísticos para una muestra Error típ. de la N Media Desviación típ. media Temperatura 50 -.49090 .040052 .005664 Prueba para una muestra Valor de prueba = -0545 95% Intervalo de confianza para la Diferencia de diferencia T gl Sig. (bilateral) medias Inferior Superior Temperatura 96131.226 49 .001 544.509100 544.49772 544.52048 Como significación de la tabla Prueba para una muestra es bilateral y en nuestro ejemplo solo tomamos en cuenta una cola la dividimos para 2. Como 0,001< 0,05 se rechaza la Ho T-STUDENT Con los siguientes datos muestralesCoeficiente de inteligencia: IQ 135 115 95 100 110 120 125 130 140Notas de un examen 16 13 12 12 14 14 15 15 18 Pruebe la hipótesis = 0, contra la hipótesis >0 al nivel de significación α=0,05. ¿Se puede aceptar que =0?
  • CÁLCULO DE FORMA MANUALX Y XY X2 Y2 X1- ( X1- )2 Y1- (Y1- )2 135 16 2160 18225 256 16,11 259,57 1,67 2,78 115 13 1495 13225 169 -3,89 15,12 -1,33 1,78 95 12 1140 9025 144 -23,89 570,68 -2,33 5,44 100 12 1200 10000 144 -18,89 356,79 -2,33 5,44 110 14 1540 12100 196 -8,89 79,01 -0,33 0,11 120 14 1680 14400 196 1,11 1,23 -0,33 0,11 125 15 1875 15625 225 6,11 37,35 0,67 0,44 130 15 1950 16900 225 11,11 123,46 0,67 0,44 140 18 2520 19600 324 21,11 445,68 3,67 13,44∑1070 ∑129 ∑15560 ∑129100 ∑1879 ∑0,00 ∑1888,89 ∑0,00 ∑30,00 1. PASO: hallar hipótesis nula y alternativa Ho= 0 Ha>0 2. PASO: determinar la cola Es unilateral con cola derecha 3. PASO: determinar el nivel de confianza y significancia N= 95% α=0,05 z= 1,65 4. PASO: determinar si es prueba de hipótesis o T- Student n< 30 9 < 30 T—Student Gl=K-1 Gl=9-1=8
  • 5. PASO: graficar campana de gauss Zona de rechazo Zona de aceptación Z= 1,656. CÁLCULOS
  • 7. toma de decisiones Se rechaza la hipótesis nula debido a que z se encuentra en la zona de rechazo, lo cual implica que se acepte la hipótesis alternativa la cual indica que >0CÁLCULO SPSS1. Ingresamos las variables de estudio2. En pestaña vista de variables cambiamos los nombres de las variables, recordando siempre que el programa no acepta espacios.
  • 3. En la barra de herramientas elegimos la opción Analizar, Comparar medias y Prueba T para una muestra.
  • 4. En la siguiente ventana se trasladan únicamente las variables y si en caso lo amerita, en la casilla opciones cambiamos el nivel de confianza; y aceptamos.ANALISIS DE LOS RESULTADOS Estadísticos para una muestra Error típ. de la N Media Desviación típ. media coeficiente 9 118.8889 15.36591 5.12197 notas 9 14.3333 1.93649 .64550 Prueba para una muestra Valor de prueba = 0 95% Intervalo de confianza para la diferencia Diferencia de t gl Sig. (bilateral) medias Inferior Superiorcoeficiente 23.212 8 .000 118.88889 107.0776 130.7002notas 22.205 8 .000 14.33333 12.8448 15.8219
  • Se puede determinar que como la significancia es 0,00 y este valor es menor ala significancia de 0,05, la hipótesis nula se rechaza, y se acepta la alternativa.CHI-CUADRADOEn un estudio realizado en el Departamento de Investigación del ESAN acercadel prejuicio étnico hacia el negro en los universitarios de Lima se aplicó unaencuesta a los universitarios según su lugar de procedencia, obteniéndose losresultados que presenta la Tabla siguiente: LUGAR DE RESIDENCIA Grado de Barriadas Barrios Barrios Total Prejuicio Populares Residenciales (intermedios) Alto 32 225 50 307 Bajo 28 290 79 397 Total 60 515 129 704A nivel de significación determinar que las variables perjuicio étnicohacia el negro y lugar de residencia son independientes.1. Ho: El perjuicio étnico y el lugar de residencia son independientes Ha: Existe dependencia entre variables2. La prueba es unilateral y de cola derecha3. Asumimos el nivel de significación de4. Utilizaremos la distribución Muestral de Chi- Cuadrado, porque las dos variables son cualitativas.
  • 5. Esquema de la prueba6. Cálculo del estadístico de la PruebaPara determinar las frecuencias esperadas emplearemos a misma tabla,manteniendo invariables las frecuencias marginales de las dos variables. Grado de Barriadas Barrios Barrios Total Prejuicio Populares Residenciales (intermedios) Alto E11 E12 E13 307 Bajo E21 E22 E23 397 Total 60 515 129 704Cuando dos variables X y Y son independientes, la frecuencia de cada celda esigual al producto de sus frecuencias marginales correspondientes dividido por eltamaño de la muestra.
  • Grado de Barriadas Barrios Barrios Total Prejuicio Populares Residenciales (intermedios) Alto 22.16 224.58 56.25 307 32 225 50 Bajo 33.84 290.4 72.75 397 28 290 79 2 Total 704 60 515 129Debido a que X se encuentra en la zona de rechazo se acepta la hipótesisalternativa.
  • CÁLCULO SPSS1. Ingresamos las variables de estudio2. Cambiamos en nombre a las variables
  • 3. En la opción analizar elegimos la casilla Pruebas no paramétricas, y Chi- cuadrado.
  • 4. Ubicamos las variables a contrastar y aceptamos.ANALISIS DE RESULTADOS Estadísticos de contraste Barriadas Barriosp Barriosr Total a a a a Chi-cuadrado 6.000 6.000 6.000 6.000 gl 2 2 2 2 Sig. asintót. 1.000 1.000 1.000 1.000 a. 3 casillas (100,0%) tienen frecuencias esperadas menores que 5. La frecuencia de casilla esperada mínima es 1,0.Debido a que el nivel de significancia es 0,05 y los grados de libertad 2 seanaliza que x es igual a 5,991 y el valor de chi- cuadrado es de 6 lo que implicaque se encuentre en la zona de rechazo y se acepte la hipótesis alternativa
  • VARIANZARobert Shade es vicepresidente de mercadeo en First City Bank, en Alemania.Los recientes esfuerzos promocionales para atraer nuevos mercados incluyenalgunos descuentos y promocionesShade está convencido de que diferentestipos de descuentos y promociones premios atraerían a diferentes grupos deingreso. Las grandes empresas prefieren descuentos, mientras que las otrasempresas pueden sentirse más atraídas por las promociones. Shade decideutilizar el monto de las exportaciones como una medida representativa delingreso. El desea determinar si existe una diferencia en el nivel promedio deexportaciones entre los meses del año. Si se halla alguna diferencia, Shadeofrecerá una diversidad de premios promocionales.En la tabla aparecen los meses de año seleccionados aleatoriamente. Elnúmero total de observaciones es n= rc=20 ENERO FEBRERO MARZO ABRIL MAYO 1576 1999 1553 873 1113 1618 1932 1310 800 1167 1446 1858 1062 993 1237 1705 1837 918 1018 1359 1586,25 1906,5 1210,75 921 1219 Meses Exportaciones 1 1576.00 1 1618.00 1 1446.00 1 1705.00 2 1999.00 2 1932.00
  • 2 1858.00 2 1837.00 3 1553.00 3 1310.00 3 1062.00 3 918.00 4 873.00 4 800.00 4 993.00 4 1018.00 5 1113.00 5 1167.00 5 1237.00 5 1359.00CÁLCULO DE FORMA MANUALShade desea probar hipotesis al nivel del 5% queH0; U1=U2=U3=U4Ha; No todas las meses son igualesUtilizando las formulas de suma de cuadrados total, suma de cuadrados de lostratamientos, suma del cuadrado del error se tendria que 2688892.21
  • Las formulas cuadrado medio del tratamiento y cuadrado media del errorCalculamos la F para una prueba de medias con la formula
  • La tabla ANOVA resume estas cifras así Fuente de Suma de Grados de Cuadrados Valor F variación cuadrados libertad mediosEntre 2337401.71 4 24.94muestras(tratamiento)Dentro de 351490.5 15muestras(error)Variación 2688892.21totalH0; U1=U2=U3=U4Ha; No todas las medias son igualesRegla de decisión:no rechazar si F menor o igual 3.01 rechazar si F > 3.01Conclusión: debido a que F= 24,937> 3.01 se rechaza la hipótesis nula
  • Debido a que F= 24,937Shade debe rechazar la hipótesis nula. Puede estar95% seguro de que las exportaciones en los meses no son iguales.CÁLCULO SPSS1. En el programa SPSS ingresamos 1 factor y 1 variable de estudio, que para el caso son: las exportaciones y los meses.2. Dentro de la pestaña vista de variable cambiamos los nombres a las variables
  • 3. En la barra de herramientas seleccionamos la opción Analizar, Estadísticos descriptivos y Explorar.4. En la siguiente pantalla ubicamos las variables en la lista de dependientes y factores según corresponda
  • 5. En la pestaña Gráficos seleccionamos la casilla gráficos con pruebas de normalidad y desactivamos las casillas de diagramas de cajas; continuamos y aceptamos.6. Esperamos a que se procese y se abra la pantalla de resultados
  • ANALISIS DE RESULTADOS Pruebas de normalidad a Kolmogorov-Smirnov Shapiro-Wilk Meses Estadístico Gl Sig. Estadístico Gl Sig.exportaciones 1.00 .212 4 . .981 4 .908 2.00 .244 4 . .933 4 .611 3.00 .203 4 . .972 4 .852 4.00 .259 4 . .914 4 .504 5.00 .188 4 . .964 4 .806a. Corrección de la significación de Lilliefors
  • ANOVA Exportaciones Suma de cuadrados Gl Media cuadrática F Sig. Inter-grupos 2337401.700 4 584350.425 24.937 .000 Intra-grupos 351490.500 15 23432.700 Total 2688892.200 19Debido a que F= 24,937> 3.01 se rechaza la hipótesis nulaDebido a que F= 24,937Shade debe rechazar la hipótesis nula. Puede estar95% seguro de que las exportaciones en los meses no son iguales.Como P=0,000 < 0,05 se rechaza la hipótesis nula y se acepta la alternativa.CONCLUSIONES  Correlación comprende el análisis de los datos muestrales para saber qué es y cómo se relacionan entre si dos o más variables en una población.  La correlación es una técnica que comprende una forma de estimación.  El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación.  La regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio.  El término lineal se emplea para distinguirlo del resto de técnicas de regresión, que emplean modelos basados en cualquier clase de función matemática.
  • RECOMENDACIONES  Aplicar de manera adecuada la regresión lineal el cual es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio.  Emplear correctamente el término lineal que se emplea para distinguirlo del resto de técnicas de regresión, que emplean modelos basados en cualquier clase de función matemática.  Tomar en cuenta que el análisis de regresión nos permiten determinar tanto la naturaleza como la fuerza de una relación entre dos variables.BIBLIOGRAFIAHOWARD B., C. (2008). Estadistica paso a paso. México: Miembro de la Cámara Nacional de la Industria Editorial.Lincoln L. (2008). Introduccion a la estadistica ED. CECSA. Argentina: .MURRAY R., S. (1991). Estadistica Segunda edicion. México: Camara Nacional de la Industria Editorial.Pick, Susan y López, Ana Luisa. (2009). Resolucion total de probabilidad y estadistica. México: Ed. Trillas S.A.Tamayo y Tamayo, Mario. (2010). EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA. México: Ed. Limusa S.A.Tenorio Bahena, Jorge. (2006). INVESTIGACIÓN DOCUMENTA.MÉXICO: Ed. Mac Graw - Hill.
  • CRONOGRAMA DE ACTIVIDADES JULIO ACTIVIDAD 3 4 5 6Organización XInvestigación del Tema XAnálisis del Tema XResolución de ejercicios X