ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN EL PERIODO 2000- 2009

3,007 views

Published on

Análisis estadístico, y su interpretación económica, del analfabetismo en el salvador, según los datos de la Encuesta de Hogares de Propósitos Múltiples de la Digestyc

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
3,007
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
0
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN EL PERIODO 2000- 2009

  1. 1. FACULTAD DE CIENCIAS ECONÓMICAS DEPARTAMENTO DE CIENCIAS Y HUMANIDADES ASIGNATURA: ESTADÍSTICA 2. CICLO 02 2011 TAREA: ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN EL PERIODO 2000- 2009 Docente: Lic. Saúl Quintanilla. Alumnos: Vilma Alejandra Montti García MG08012 (representante) Oscar Wilfredo Cañas Belloso CB09048 José Marvin Orellana Córdova OC08001 Samael Aarón García Meléndez GM11008 CIUDAD UNIVERSITARIA, 29 DE NOVIEMBRE DE 2011.
  2. 2. CONTENIDO 1. OBJETIVOS DE LA INVESTIGACIÓN.................................................................................................. 1 1.1 Objetivo general ........................................................................................................................... 1 1.2 Objetivos específicos. ................................................................................................................... 1 2. CONCEPTOS BÁSICOS..................................................................................................................... 2 2.1 Analfabetismo y alfabetismo. ......................................................................................................... 2 2.2 Las remesas familiares.................................................................................................................. 2 2.3 Población económicamente activa.................................................................................................. 2 2.4 Pobreza. ...................................................................................................................................... 2 3. ESPECIFICACIÓN DEL MODELO DE REGRESIÓN......................................................................... 3 3.1 Planteamiento de hipótesis............................................................................................................ 4 4. FUENTE DE DATOS Y DESCRIPCIÓN DE VARIABLES..................................................................... 5 4.1 Analfabetismo y Alfabetismo.......................................................................................................... 5 4.2 Población económicamente activa.................................................................................................. 6 4.3 Remesas familiares....................................................................................................................... 7 4.5 Hogares en condición de Pobreza.................................................................................................. 8 5. RELACIÓN ENTRE VARIABLES..................................................................................................... 8 5.1 Analfabetismo versus PEA............................................................................................................. 9 5.2 Analfabetismo versus remesas familiares...................................................................................... 11 5.3 Analfabetismo versus Pobreza..................................................................................................... 12 5.4 Relación variables independientes y dependiente. ......................................................................... 13 6. RESULTADOS DE REGRESIÓN................................................................................................... 14 7. DETERMINACIÓN DE INTERVALOS DE CONFIANZA PARA LOS COEFICIENTES ESTIMADOS (TEST SOBRE SUPUESTOS DE MODELOS).................................................................................................... 19 7.1 Normalidad: Test de Jarque-Bera............................................................................................ 20 7.2 Test de significancia global del modelo prueba f.................................................................... 25 7.3 Test de significancia de coeficientes (prueba t)...................................................................... 26 8. PROYECCIONES DE LA REGRESIÓN OBTENIDA.......................................................................... 27 ANEXOS................................................................................................................................................ i i. BITÁCORA DE ACTIVIDADES. ........................................................................................................ i ii. TEORÍA SOBRE MODELOS DE REGRESIÓN LINEAL.................................................................. i ii.i Modelo de Regresión........................................................................................................... i ii.ii Linealidad de las variables .................................................................................................. ii ii.iii Linealidad en los parámetros............................................................................................... ii ii.iv Error estocástico. ...............................................................................................................iii ii.v Regresión Muestral ............................................................................................................iv ii.vi Mínimos cuadrados ordinarios. ........................................................................................... v ii.vii Error estándar de los mínimos cuadrados.............................................................................vi
  3. 3. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 1 iii. TEST SUPUESTOS: ..................................................................................................................ix iii.i Normalidad: Test de Jarque Bera.............................................................................................ix iii.ii Test significancia global del modelo: prueba F .......................................................................x iii.iii Determinación de intervalos de confianza para los coeficientes estimados ..............................xi iii.iv Test de significancia de coeficientes: prueba T......................................................................xi iv. BASE DE DATOS Y DICCIONARIO DE LA BASE DE DATOS............................................................xii TABLA DE ILUSTRACIONES. Gráfica 1: Analfabetismo y alfabetismo en El Salvador, periodo 1998-2010 ................................................. 6 Gráfica 2: Flujo de remesas hacia El Salvador en el periodo 1998-2010...................................................... 7 Gráfica 3: Analfabetismo vs PNO........................................................................................................... 10 Gráfica 4: Analfabetismo versus Remesas Familiares.............................................................................. 11 Gráfica 5: Analfabetismo vs No Pobres .................................................................................................. 13 Gráfica 6: Cuadro resumen de la selección de variables independientes vs variable dependiente................ 14 Gráfica 7: Normal PENO.................................................................................................................... 21 Gráfica 8: Histograma PENO ............................................................................................................. 22 Gráfica 9: Normal Remesas Familiares.............................................................................................. 23 Gráfica 10: Histograma Remesas Familiares..................................................................................... 23 Gráfica 11: Normal HNP .................................................................................................................... 24 Gráfica 12: Histograma HNP.............................................................................................................. 24 Gráfica 13: curva de proyección de la ecuación de regresión .......................................................... 28 GUÍA DE TABLAS. Tabla 1: El analfabetismo y el alfabetismo en El Salvador, periodo 1998-2010............................................. 5 Tabla 2: Población económicamente Activa PEA en El Salvador, periodo 2000-2009................................... 6 Tabla 3: Flujo de remesas hacia El Salvador, periodo 1998-2010 ............................................................... 7 Tabla 4: Hogares en condición de pobreza en El Salvador periodo 2000-2009............................................. 8 Tabla 5: Selección de datos Analfabetismo versus PNO .......................................................................... 10 Tabla 6: Selección de datos Analfabetismo vs Remesas Familiares.......................................................... 11 Tabla 7: Selección de datos de analfabetismo vs No Pobres.................................................................... 12 Tabla 8: Resultados de estadísticos descriptivos..................................................................................... 14 Tabla 9: Resultados de Coeficientes SA................................................................................................. 15 Tabla 10: Cotejo de test JB................................................................................................................ 25 Tabla 11: Proyección a partir de regresión. ...................................................................................... 27 Tabla 12: Caso supuesto.................................................................................................................... 28
  4. 4. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 1 1. OBJETIVOS DE LA INVESTIGACIÓN 1.1 Objetivo general Analiza el comportamiento del analfabetismo en El Salvador en el periodo 2000- 2009 a partir de las variables independientes Población económicamente no Activa, Remesas Familiares y Hogares No Pobres. 1.2 Objetivos específicos. 1. Medir el nivel de relación del analfabetismo en El Salvador contra Población económicamente no activa en el periodo 2000-2009. 2. Medir el nivel de relación del analfabetismo en El Salvador contra Remesas Familiares en el periodo 2000-2009. 3. Medir el nivel de relación del analfabetismo en El Salvador contra Hogares No Pobres en el periodo 2000-2009. 4. Medir el nivel de relación del analfabetismo en El Salvador contra las variables anteriormente mencionadas, a través de una regresión lineal múltiple. 5. Aprender a utilizar las diversas herramientas estadísticas disponibles en software como SPSS, Excel y Matlab. 6. Estimar una tendencia del comportamiento del analfabetismo en El Salvador, a partir de datos estadísticos anuales registrados por la Dirección de Estadísticas y Censos.
  5. 5. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 2 2. CONCEPTOS BÁSICOS 2.1 Analfabetismo y alfabetismo. La definición estándar de analfabetismo, es de aquellas personas que no saben leer ni escribir, aunque también se incluye el analfabetismo parcial, el cual es la capacidad disfuncional de leer y escribir. 2.2 Las remesas familiares. Las remesas se les denomina a aquellas transacciones de dinero internacionales, de personas naturales hacia personas naturales. En el Salvador, dado las condiciones propias del sistema económico, político y social, las migraciones hacia el exterior (principalmente EEUU y Canadá) van en aumento. Aquellas personas que radican en el exterior, envían cantidades de dinero a sus familias y amigos residentes aun en el territorio nacional, para aliviar y subsanar las debilidades y vicisitudes económicas que enfrentan. 2.3 Población económicamente activa También denominado como PEA, hace referencia a aquella población en edad de trabajar, que posee un trabajo actual, o está en busca de uno; es decir, es la condición de empleo, y la condición potencia de tener empleo. Dado la naturaleza social y económica en El Salvador, la DIGESTYC incluye en este tipo de indicador, a todas aquellas personas mayores de 10 años. 2.4 Pobreza. Económicamente, se definen varios tipos de pobreza.  Extrema pobreza: Condición en que familias sobreviven con menos de $1.00 al día, y no logran tener ingresos que cubran la canasta básica de alimentos.  Pobreza relativa: Condición en que los ingresos familiares cubren la canasta básica de alimentos, más no la canasta de misceláneos.  No Pobres: Condición en que los ingresos familiares cubren tanto la canasta básica, como la canasta de misceláneos.
  6. 6. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 3 3. ESPECIFICACIÓN DEL MODELO DE REGRESIÓN Para el caso; El analfabetismo en El Salvador, depende de muchas variables (independientes) pero para el objetivo del análisis, estudiaremos cuatro de las más significativas como lo son la población económicamente No ocupada, las remesas familiares, y la Población No pobre. Suponiendo que el Modelo de Regresión Lineal Múltiple tomará la siguiente forma: Donde; ̂ Valor de la variable dependiente, (El analfabetismo en El Salvador) Son parámetros del Modelo Valor de las variables independientes (población económicamente no Ocupada, las remesas familiares, y la Población No pobre, respectivamente). Sin embargo, es importante hacer mención que desafortunadamente, los valores de los parámetros no suelen conocerse, por lo tanto no se podría utilizar la ecuación antes mencionada. Pero a partir de datos muéstrales podríamos conocer y utilizarlos como estimadores puntuales de dichos parámetros. Obteniendo de esta forma un valor estimado ̂ para la variable dependiente. Obteniendo así una nueva ecuación (Ecuación De Regresión Múltiple Estimada). ̂ ̂ Valor estimado de Analfabetismo : Parámetros estimadores del Modelo Un aspecto muy importante dentro del Modelo Lineal Múltiple es cualquier transformación o variabilidad en “Y” (representada por ) ̂ Donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar. (De ahí su carácter estocástico del Modelo). “Sin embargo, esta variable no será tomada en el análisis de este estudio”.
  7. 7. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 4 3.1 Planteamiento de hipótesis. Las variables que se miden en el Análisis de Regresión son las que inciden en el Comportamiento de la variable Dependiente. Es decir, lo que tratamos de probar es; si las variables independientes en conjunto, tienen alguna relación sea significativa o no en el comportamiento de la variable independiente, y si el Modelo utilizado en este caso Modelo de Regresión Lineal Múltiple es el adecuado, para el análisis de dicho estudio. De acuerdo a esto, podemos definir las Hipótesis correspondientes del Modelo, aplicadas a nuestro tema de Investigación: Ho: No se encuentran diferencias estadísticamente significativas entre la variable dependiente Analfabetismo y las variables independientes Población Económicamente No Ocupada, Remesas familiares, y Población No Pobre. Ha: Se encuentran diferencias estadísticamente significativas entre la variable dependiente Analfabetismo y las variables independientes PEA (Población Económicamente Activa), densidad poblacional y Remesas. El modelo de regresión se define de la siguiente manera: Identificado el correspondiente planteamiento el cual es denominado prueba de Significancia Global, se analizara por medio de la prueba F y mediante los resultados correspondientes se estará concluyendo el rechazo o aceptando las hipótesis formuladas. Si encontramos que hay diferencias estadísticamente significativas en la prueba F, no es suficiente esto para conocer la relación de las variables del Modelo en forma global, sino que también es importante realizar cada una de las relaciones de los coeficientes de la ecuación de regresión para conocer si efectivamente el modelo de regresión empleado es el adecuado o no. Prueba t Si se rechazarán las hipótesis correspondientes, todos los parámetros son estadísticamente significativos si no se puede rechazar cada una de las hipótesis el modelo puede no ser el adecuado.
  8. 8. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 5 4. FUENTE DE DATOS Y DESCRIPCIÓN DE VARIABLES. 4.1 Analfabetismo y Alfabetismo Las y los analfabetas se definen como aquellas personas de 10 años o más, que no saben leer ni escribir. A partir de la Encuesta de hogares de propósitos múltiples, que desarrolla la DIGESTYC anualmente, se ha resumido en la siguiente tabla el conteo de personas en condición de alfabetismo y en condición de analfabetismo. Tabla 1: El analfabetismo y el alfabetismo en El Salvador, periodo 1998-2010 Fuente: Encuesta de hogares de propósitos múltiples, DIGESTYC. En la tabla anterior, se interpreta que el analfabetismo tiene un crecimiento negativo en el periodo 1998-2010, es decir, la cantidad de personas en condición de analfabetismo va disminuyendo, y su contraparte, la tasa de alfabetismo, ha ido en incremento (crecimiento positivo). Nótese que para el año 2007 existió un cambio significativo en las cifras, en comparación a su año anterior 2006. Aunque, vuelven a incrementar en 2008. Se explica este fenómeno, a una posible causa de tipo de estudio realizado por la DIGESTYC (estimación de datos de nuestra fuente). Gráficamente, se observa: Masculino Femenino Total Crec. Anual Masculino Femenino Total Crec. Anual 1998 518,072 678,206 1196,278 - 2016,944 1889,260 3906,204 - 1999 499,347 646,348 1145,695 -4.23% 2130,448 1970,796 4101,244 4.99% 2000 482,847 642,910 1125,757 -1.74% 2195,120 2058,239 4253,359 3.71% 2001 464,453 639,222 1103,675 -1.96% 2318,448 2144,519 4462,967 4.93% 2002 490,625 646,459 1137,084 3.03% 2365,848 2154,753 4520,601 1.29% 2003 477,423 642,281 1119,704 -1.53% 2381,284 2231,362 4612,646 2.04% 2004 472,221 629,885 1102,106 -1.57% 2470,554 2326,972 4797,526 4.01% 2005 441,612 645,426 1087,038 -1.37% 2573,785 2365,128 4938,913 2.95% 2006 444,305 629,066 1073,371 -1.26% 2662,100 2420,751 5082,851 2.91% 2007 345,745 492,945 838,690 -21.86% 2049,552 2250,533 4300,085 -15.40% 2008 371,285 519,642 890,927 6.23% 2374,698 2190,534 4565,232 6.17% 2009 363,115 510,118 873,233 -1.99% 2441,865 2210,459 4652,324 1.91% 2010 357,096 501,948 859,044 -1.62% 2445,535 2243,028 4688,563 0.78% Año AlfabetismoAnalfabetismo
  9. 9. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 6 Gráfica 1: Analfabetismo y alfabetismo en El Salvador, periodo 1998-2010 Fuente: DIGESTYC. A pesar de ser ambas condiciones reciprocas entre sí, el nivel de alfabetismo crece en mayor proporción, que su contraparte, el analfabetismo, que decrece en menor proporción. Esto se debe a que en estudio se incluyen a personas mayores de 10 años, lo que asocia la condición de alfabetismo al crecimiento poblacional. Es decir, a aquellas personas en edad apta de escolaridad, reciben la educación básica que las clasifique en condición de alfabetismo, en cambio, los que están en condición de analfabetismo, son aquellas que en su mayoría son adultos, no pueden asistir periódicamente a enseñanza académica, y no han podido cambiar su condición. 4.2 Población económicamente activa. La población económicamente activa PEA, equivale a la sumatoria de la población ocupada (empleada) y no ocupada (desempleada), lo que se puede verificar en la siguiente tabla: Tabla 2: Población económicamente Activa PEA en El Salvador, periodo 2000-2009 Fuente: Cuadro resume de la actividad económica 2000-2009 DIGESTYC. Ocupada No Ocupada Total 2000 2198,938 164,415 2363,353 - 2001 2275,169 170,298 2445,467 3.47% 2002 2219,603 147,366 2366,969 -3.21% 2003 2280,654 169,427 2450,081 3.51% 2004 2253,645 164,025 2417,670 -1.32% 2005 2283,552 177,634 2461,186 1.80% 2006 2337,091 164,237 2501,328 1.63% 2007 2337,091 156,079 2493,170 -0.33% 2008 2349,050 146,858 2495,908 0.11% 2009 2364,579 187,088 2551,667 2.23% Año Población Económicamente Activa Crecimiento anual
  10. 10. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 7 Es necesario destacar, que en la cifra de la PEA, únicamente se incluyen a aquellas personas mayores de 10 años, en condición y decisión de buscar empleo, o que gozan de alguno. No incluye a aquellas personas que no trabajan por decisión o condición propia, tales como jubilados, estudiantes, enfermos, etc. 4.3 Remesas familiares. Según datos del informe para el desarrollo humano del PNDU de 2006, la mayor proporción de migrantes hacia Estados Unidos, se dio en la Postguerra, y su mayor apogeo en el nuevo milenio, dada las vicisitudes económicas que sufren las familias en El Salvador. La siguiente tabla, resumen de la DIGESTYC, confirma la observación: Tabla 3: Flujo de remesas hacia El Salvador, periodo 1998-2010 Fuente: DIGESTYC. Observe el siguiente gráfico: Gráfica 2: Flujo de remesas hacia El Salvador en el periodo 1998-2010 Fuente: DIGESTYC. Remesas USD 1998 $112500,000 - 1999 $97200,000 -13.60% 2000 $142700,000 46.81% 2001 $157800,000 10.58% 2002 $143400,000 -9.13% 2003 $172800,000 20.50% 2004 $210100,000 21.59% 2005 $250400,000 19.18% 2006 $284900,000 13.78% 2007 $312200,000 9.58% 2008 $299500,000 -4.07% 2009 $259000,000 -13.52% 2010 $269800,000 4.17% Año Crecimiento anual
  11. 11. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 8 El mayor comportamiento de crecimiento positivo es visualmente obvio en el periodo 2002-2006, frenando en 2007-2008 a causa de la crisis económica que afecto a todo el mundo capitalista en dichos años. Se observa una leve mejora en los años posteriores a 2009. 4.5 Hogares en condición de Pobreza. La DIGESTYC realizo un estudio la última década, para determinar la proporción de hogares según su condición de pobreza: Tabla 4: Hogares en condición de pobreza en El Salvador periodo 2000-2009 Fuente: Cuadro resumen de encuesta de hogares de propósitos múltiples, DIGESTYC. Nota: proporción estimada de personas por hogar es de 4.3 5. RELACIÓN ENTRE VARIABLES Se considera que las principales causas del analfabetismo, en forma general en el país es:  El trabajo infantil  Los niños deben trabajar porque la familia no percibe suficientes ingresos  Los niños deben trabajar para sobrevivir (estado de abandono)  Los niños deben de trabajar, porque es la regla de la familia  Los niños al llegar a adultos, se siente frustrados por no haber estudiado  La adecuación a percibir ingresos fáciles (remesas)  Para que estudiar, si se vive cómodamente  Desintegración familiar  Los niños, perciben el ambiente en sus hogares.  Surgen problemas para mantener asistencia a clases  Mudanzas  Nivel de ingresos económicos TOTAL POBREZA EXTREMA POBREZA RELATIVA NO POBRES 2000 1361,556 217,577 310,571 833,408 2001 1367,462 220,708 310,004 836,750 2002 1400,492 220,858 294,103 885,531 2003 1438,897 206,913 312,528 919,455 2004 1450,507 182,039 319,692 948,777 2005 1472,625 181,722 324,567 963,244 2006 1497,547 143,016 317,180 1037,351 2007 1518,713 163,262 362,061 993,390 2008 1529,483 189,656 421,373 918,455 2009 1548,108 185,618 398,947 963,542 Año HOGARES EN CONDICION DE POBREZA
  12. 12. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 9  La extrema pobreza en el país  La necesidad de trabajar  Baja escolaridad de los padres  Hijos siguen el ejemplo de sus padres  Padres inculcan el ejemplo a sus hijos  Resignación a la condición académica y laboral  El que no logro estudiar de joven, frustra sus deseos de hacerlo de viejo.  Al alta densidad poblacional, etc.  Los centros de estudio se ubican en las mayores concentraciones poblacionales  Quienes viven en zonas difícilmente accesibles, deben de caminar kilómetros para ir al centro de estudios.  Personas desisten del estudio dado la lejanía.  Otros Concentrando las causas, podemos definir 3 posibles variables (cuyo comportamiento se asumirá independiente para fines académicos) que afectan la proporción nacional de analfabetismo en El Salvador (considerado un comportamiento dependiente con respecto a las demás variables). Para definir las variables necesarias, debe de evaluarse la condición social y económica de la realidad: 5.1 Analfabetismo versus PEA Dado que la PEA equivale a la fuerza laboral que dispone un país, no puede representar por sí misma una relación con el analfabetismo. En cambio el desempleo sí. Bajo la hipótesis que si el desempleo (no ocupados) es alto, muchas personas no disponen de los ingresos necesarios para sobrevivir, por lo que la alimentación se hace más prioritaria que la educación, lo que favorece al incremento del analfabetismo. Esto se traduce a una relación directa positiva. Si tomamos los datos necesarios, de la Tabla 1 y tabla 2 tenemos:
  13. 13. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 10 Tabla 5: Selección de datos Analfabetismo versus PNO Origen: Tabla 1 y Tabla 2 Gráfica 3: Analfabetismo vs PNO Fuente: Tabla 5 Utilizando las librerías de grafico disperso de MS Excel, se obtiene la ecuación representativa de la relación Analfabetismo versus No Ocupados. ̂ Nótese que cumple la hipótesis propuesta para esta relación, es decir, un comportamiento directo y positivo. Analfabetismo No Ocupados (Miles de personas) (Miles de personas) 2000 1,125.76 164.42 2001 1,103.68 170.30 2002 1,137.08 147.37 2003 1,119.70 169.43 2004 1,102.11 164.03 2005 1,087.04 177.63 2006 1,073.37 164.24 2007 838.69 156.08 2008 890.93 146.86 2009 873.23 187.09 Año
  14. 14. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 11 5.2 Analfabetismo versus remesas familiares. Se formula la siguiente relación: dado los bajos ingresos familiares, se prioriza alimentación contra educación, lo que propicia el crecimiento del analfabetismo. Pero, si alguno de los miembros de la familia migran hacia el exterior, y envían dinero para ayudar a la situación económica familiar, entonces, existe mejor posibilidad de retomar la importancia de la educación, lo que reduce el analfabetismo. Es decir, se propone una relación directa negativa. Mientras más ingresos perciban las familias gracias a las remesas, menor será el analfabetismo en el país. Si se toman los datos adecuados de la tabla 1 y tabla 3 se tiene: Tabla 6: Selección de datos Analfabetismo vs Remesas Familiares Origen: Tabla 1 y tabla 2 Gráfica 4: Analfabetismo versus Remesas Familiares. Fuente: Tabla 6 Analfabetismo Remesas (Miles de Personas) (Millones de dólares) 2000 1,125.76 142.70 2001 1,103.68 157.80 2002 1,137.08 143.40 2003 1,119.70 172.80 2004 1,102.11 210.10 2005 1,087.04 250.40 2006 1,073.37 284.90 2007 838.69 312.20 2008 890.93 299.50 2009 873.23 259.00 Año
  15. 15. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 12 Con las librerías automatizadas de MS Excel, se obtiene que la ecuación de regresión de la relación Analfabetismo vs Remesas familiares es: ̂ Lo que satisface la propuesta, de una relación directa y negativa. 5.3 Analfabetismo versus Pobreza. La propuesta para esta relación, es que la pobreza impacta de forma directa en el analfabetismo. Ya que a mayor pobreza (extrema más relativa), se dificultan las condiciones para el estudio, por lo que la prioridad de las familias se enfoca en la supervivencia diaria (lo que origina el trabajo infantil, el abandono familiar, etc.), incrementando el analfabetismo. Para fines académicos, se enfocara la Pobreza, a partir de los No Pobres, es decir, se hará el supuesto, que a mayor cantidad de hogares en condición de No pobreza, se reduce el analfabetismo, lo que intuye una relación directa y negativa (se prefiere así, ya que el comportamiento propio del analfabetismo es hacia la baja con el paso de los años). Tomando los datos necesarios de la tabla 1 y 3, se tiene: Tabla 7: Selección de datos de analfabetismo vs No Pobres Origen: Tabla 1 y tabla 3 Analfabetismo No Pobres (Miles de personas) (Miles de hogares) 2000 1,125.76 833.41 2001 1,103.68 836.75 2002 1,137.08 885.53 2003 1,119.70 919.46 2004 1,102.11 948.78 2005 1,087.04 963.24 2006 1,073.37 1,037.35 2007 838.69 993.39 2008 890.93 918.45 2009 873.23 963.54 Año
  16. 16. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 13 Gráfica 5: Analfabetismo vs No Pobres Fuente: Tabla 7 Utilizando las herramientas de regresión de MS Excel, se obtiene la ecuación de regresión: ̂ Lo que satisface la propuesta, de una tendencia negativa. 5.4 Relación variables independientes y dependiente. Para nuestra investigación, hemos definido que el modelo de regresión a seguir es: Y: Analfabetismo. X1: Población Económicamente No Ocupada (PENO). X2: Remesas Familiares. X3: Población No Pobre. En donde, por fines académicos se considera que las variables independientes son excluyentes entre sí, sin relación alguna. El cuadro resumen de las variables seleccionadas es:
  17. 17. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 14 Gráfica 6: Cuadro resumen de la selección de variables independientes vs variable dependiente Fuente: Tabla 5, tabla 6 y tabla 7, en base a datos publicados por DIGESTYC. 6. RESULTADOS DE REGRESIÓN En todo análisis estadístico es importante conocer datos generales de las variables en estudio, así se tendrá una mejor interpretación de los resultados. Para este caso, se presenta a continuación la Media y la desviación típica respecto a cada una de las variables: Media Desviación típica N Analfabetismo 1,035.1585 117.70748 10 No Ocupados 164.7427 12.54349 10 Remesas 223.2800 66.17168 10 No Pobres 929.9903 65.29659 10 Tabla 8: Resultados de estadísticos descriptivos. Origen: Análisis con SPSS. Los datos anteriores se toman en base a una muestra de diez elementos (correspondientes a los años 2000 a 2009). El analfabetismo que es tomada como variable dependiente muestra una media de 1, 035, 158,50 habitantes en dicho periodo con una desviación típica 117, 707,480 habitantes lo que nos indica un nivel de concentración de datos bastante alto, en relación a la media; por lo cual se puede concluir que la media obtenida es representativa y presenta un comportamiento más o menos normal de la serie. Analfabetismo No Ocupados Remesas No Pobres (millones de personas) (miles de personas) (millones de dólares) (miles de hogares) 2000 1125.76 164.42 142.70 833.41 2001 1103.68 170.30 157.80 836.75 2002 1137.08 147.37 143.40 885.53 2003 1119.70 169.43 172.80 919.46 2004 1102.11 164.03 210.10 948.78 2005 1087.04 177.63 250.40 963.24 2006 1073.37 164.24 284.90 1037.35 2007 838.69 156.08 312.20 993.39 2008 890.93 146.86 299.50 918.45 2009 873.23 187.09 259.00 963.54 Año
  18. 18. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 15 TABLA Nº2 COEFICIENTE SA Modelo Coeficientes no estandarizados Coeficientes tipificados t Sig. Intervalo de confianza de 95.0% para B B Error típ. Beta Límite inferior Límite superior 1 (Constante) 659,215 505,942 1,303 ,240 -578,781 1897,211 No Ocupados -,942 1,957 -,100 -,482 ,647 -5,730 3,845 Remesas -2,305 ,616 -1,296 -3,745 ,010 -3,811 -,799 No Pobres 1,125 ,629 ,624 1,787 ,124 -,416 2,665 Tabla 9: Resultados de Coeficientes SA Origen: Análisis con SPSS La tabla anterior permite desarrollar el análisis de regresión múltiple para las variables antes mencionadas, suponiendo que el modelo empleado es apropiado para la relación entre la variable dependiente y las variables independientes. A continuación se presenta La ecuación de Regresión Múltiple Estimada la cual se determina a partir de los datos previos obtenidos (coeficientes): ̂ Dónde: ̂ Es el valor estimado de El analfabetismo ( ) : Es el valor constante estimado que ocuparía la variable dependiente ̂ como El Analfabetismo, sin importar los valores de las variables independientes, en esencia: El Salvador siempre presentara un nivel de analfabetismo de habitantes sin importar que no aumente la población económicamente No ocupados ni él envió de remesas, ni los No Pobres. ( ) : Su signo es negativo por lo que se puede concluir que existe una variación inversamente proporcional entre El Analfabetismo y la Población económicamente No Ocupados ( ) , es decir una estimación del aumento esperado en el analfabetismo que corresponde a la disminución de la Población económicamente No Ocupados permaneciendo constantes “No Pobres, Remesas” es 0,942 habitantes. ( ) : Nos indica que habrá una variación negativa entre las variables, es decir una estimación del aumento esperado en el analfabetismo que corresponde a la disminución de las remesas permaneciendo constantes “No Pobres y Población económicamente No Ocupados es 2,305 habitantes. ( ) : A diferencia de nos indica que habrá una variación positiva entre las
  19. 19. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 16 variables, es decir una estimación del aumento esperado en el analfabetismo que corresponde a la aumento de No Pobres permaneciendo constantes “Población económicamente No Ocupados y Remesas” es 1,125 habitantes. Otra forma de hacer el respectivo análisis para rechazar o validar la Ho, es mediante el valor crítico y el valor de t (proporcionado en la tabla), Sin embargo desconocemos el valor crítico, por lo tanto se vuelve más práctico analizarlo de forma utilizada. Modelo cuadrado corregida Error típ. de la estimación Estadísticos de cambio Cambio en cuadrado Cambio en gl1 gl2 Sig. Cambio en F 1 ,870 ,757 ,636 71,00988 ,757 6,243 3 6 ,028 Tabla 11: Resumen de Modelo. Origen: Análisis con SPSS. Uno de los conceptos claves en el Análisis del Modelo de Regresión es la determinación del Coeficiente de Correlación Múltiple (R), ya que este indica el nivel de sensibilidad de la variable dependiente ante cambio en las variables independientes. Al inicio planteábamos que para nuestro caso de estudio (Analfabetismo) Las variables Población Económicamente No Ocupada y Hogares No Pobres son dos variables muy significativas a la hora de determinar el valor total de tales habitantes analfabetos y que La variable Remesas no tiene ninguna relación significativa respecto a las dos anteriores. De ahí que nuestro coeficiente de correlación es bajo (0.870), y este nos indica que cualquier variación, ya sea en la variable independiente, Población Económicamente No Ocupada, Remesas u Hogares No Pobres afectarán en casi la misma proporción el Analfabetismo. Es decir El nivel de Analfabetismo podrá ser mejor explicado utilizando solamente las variables Población Económicamente No Ocupada y Hogares No Pobres. El cuadro también nos dice, por medio del Coeficiente de Determinación (R2) que las predicciones del modelo se realizaran con un 75.7% de fiabilidad por lo tanto nos indica que no es bueno ya que las variables presentadas no explican de la mejor manera El Analfabetismo, por lo que debemos encontrar otras que definan mejor el modelo de regresión para la variable de estudio. Sin embargo muchas veces el valor de R2 tiende a subir cuando incluyen nuevas variables (Aunque
  20. 20. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 17 estas sean poco significativas o tenga poca relación con al variable dependiente). En este caso, si se añaden mas lo que hará es afectar mucho más la relación entre variables. Es por eso que la tabla también nos proporciona el Coeficiente de Correlación Corregido. Cabe destacar que baja a 0,636. analfabetism o No Ocupados Remesas No Pobres Correlación de Pearson analfabetismo 1.000 .018 -.793 -.429 No Ocupados .018 1.000 -.026 .136 Remesas -.793 -.026 1.000 .802 No Pobres -.429 .136 .802 1.000 Sig. (unilateral) analfabetismo . .480 .003 .108 No Ocupados .480 . .472 .354 Remesas .003 .472 . .003 No Pobres .108 .354 .003 . N analfabetismo 10 10 10 10 No Ocupados 10 10 10 10 Remesas 10 10 10 10 No Pobres 10 10 10 10 Tabla 12: Correlaciones Origen: Análisis con SPSS. El Coeficiente de Correlación de Pearson al igual que el coeficiente de Correlación mide la capacidad en que están relacionadas las variables, la diferencia es que este las evalúa de dos en dos (el rango en que los valores tienen que estar es Es muy importante considerar el signo y el valor de r ya que de esto depende la interpretación, Para el caso todas las correlaciones (X1, Y) grafica 6, (X2, Y) grafica 7, (X3, Y) grafica 8 presentan signo negativo entre las variables, es decir el disminuir la Población Económicamente No Ocupados, El Envió de Remesas y La Población No Pobre, la Variable dependiente Analfabetismo también presentara una tendencia decreciente. Cabe destacar que existe una relación negativa moderada con respecto a Remesas (-,793) ya que sobrepasa los 0,50 de r, mientras que No Ocupadas (,018) y No Pobres (-,429) poseen poca o casi nula relación debido a que tienden a cero.
  21. 21. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 18 Podemos observarlo gráficamente a continuación: Gráfica 6: (X1, Y) Fuente: Análisis a través SPSS Gráfica 7: (X2, Y) Fuente: Análisis a través SPSS Gráfica 8: (X3 Y) .000 .200 .400 .600 .800 1.000 1.200 0 0.5 1 1.5 2 2.5 Analfabetismo Poblacion Economicamente No Ocupados -1.000 -.500 .000 .500 1.000 1.500 0 0.5 1 1.5 2 2.5 Analfabetismo Remesas -1.000 -.500 .000 .500 1.000 1.500 0 0.5 1 1.5 2 2.5 Analfabetismo Población No Pobre
  22. 22. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 19 Fuente: Análisis a través SPSS Modelo No Pobres No Ocupados Remesas 1 Correlaciones No Pobres 1.000 -.263 -.814 No Ocupados -.263 1.000 .229 Remesas -.814 .229 1.000 Covarianzas No Pobres .396 -.324 -.315 No Ocupados -.324 3.828 .275 Remesas -.315 .275 .379 a. Variable dependiente: analfabetismo Tabla 13: Correlaciones de los coeficientesa. Origen: Análisis con SPSS. 7. DETERMINACIÓN DE INTERVALOS DE CONFIANZA PARA LOS COEFICIENTES ESTIMADOS (TEST SOBRE SUPUESTOS DE MODELOS) Luego de analizar el nivel de variación por cada uno de los coeficientes estimados, es importante conocer el alcance de la estimación que estamos realizando, estos generalmente se hacen en términos del margen de error. Sin embargo el cuadro anterior (tabla nº2) nos proporciona por defecto los limites dentro de los cuales estará comprendido el verdadero parámetro de cada uno de los coeficientes de la Ecuación de regresión múltiple (es decir CAMBIAR) dichos intervalos tienen un 95% de nivel de confianza. Para el caso: El intervalo seria [-578781 , 1897211]; Límite Inferior, Límite superior) Con un error de estimación de:  Error= 1,237,996 (1897211) - (-578781/2) Es decir el valor del Analfabetismo (sin incluir las variables independientes), estará entre -578,781 y 1, 897,211 habitantes a un error de 1, 237,996. Siendo un error y por ende una amplitud bastante grande. Sin embargo es importante tomar en cuenta el grafo de magnitud de la variable independiente. El intervalo seria [-5730, 3845]; (Límite Inferior, Límite superior) Con un error de estimación de:  Error= 4,787.5 (3845) – (-5730) /2)
  23. 23. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 20 Se observa que el valor de la Población Económicamente No Ocupados tendrá un impacto sobre el Analfabetismo con un intervalo de alcance de estimación entre -5730 y 3845 miles, sin embargo nos enfrentamos a un margen de error mayor, teniendo siempre una amplitud bastante grande. Pero se debe tomar en cuenta que dicha variable posee un papel muy importante para el análisis de la variable dependiente en estudio. El intervalo seria [-3811, -.799]; (Límite Inferior, Límite superior) Con un error de estimación de:  Error= -1,905.10 (-3811) – (-.799) /2) En cuanto a las remesas, su valor se encuentra entre los intervalos de -3811, y -,799 miles (El cual tiende siempre a valores negativos) desafiando un error de -1,905.10 miles, manteniéndose siempre una amplitud y error grande. El intervalo seria [-.416, 2665]; (Límite Inferior, Límite superior) Con un error de estimación de:  Error= 1,540.5 (2665) – (-.416) /2) El valor que nos brinda el modelo para esta variable, No Pobres, se encuentra en un intervalo entre - ,416 y 2,665 miles, (Se presenta como el margen más pequeño de todos, pero esto no quiere decir que sea el menos importante, puede significar igual o inclusive la más altas variación que los demás). Se enfrenta a un error positivo de 1,540.5 miles. 7.1 Normalidad: Test de Jarque-Bera El test de Jarque-Bera (desarrollado por Carlos Jarque y Anil Bera) es una prueba que mide la bondad de ajuste del modelo, identifica si existe simetría, el tipo de curtosis; en otras palabras, evaluar si la serie de datos cumple con la distribución normal. Para su uso, de debe definir las hipótesis que identifiquen la serie de datos: Ho: Las variables independientes Población Económicamente No Ocupada (PENO) (PNO), Remesas Familiares (RF) y Hogares No Pobres (HNP) (PNP) poseen una distribución normal. Ha: Las variables independientes Población Económicamente No Ocupada (PENO) (PNO), Remesas Familiares (RF) y Hogares No Pobres (HNP) (PNP) no siguen una distribución normal. La prueba J-B sigue una distribución Ji Cuadrada con 2 grados de libertad, y un nivel de significancia de 0.05; obteniendo un valor critico de 5.99. Evaluando para la variable independiente Población Económicamente No Ocupada se obtiene en Matlab:
  24. 24. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 21 >> [h,p,jbstat,critval] =jbtest(log(NoOcupados),0.05) Warning: P is greater than the largest tabulated value, returning 0.5. > In jbtest at 138 h = 0 p = 0.500000000000000 jbstat = 0.201654403375669 critval = 2.523900000000000 Gráfica 7: Normal PENO Origen: Matlab.
  25. 25. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 22 Gráfica 8: Histograma PENO Origen: matlab Obtenemos un valor de JB= 0.2016 Evaluando para la variable independiente Remesas Familiares se obtiene en Matlab: >> [h,p,jbstat,critval] =jbtest(log(Remesas),0.05) h = 0 p = 0.211785297880689 jbstat = 1.096029713315346 critval = 2.523900000000000
  26. 26. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 23 Gráfica 9: Normal Remesas Familiares Origen: Matlab. Gráfica 10: Histograma Remesas Familiares Origen: Matlab Obtenemos un valor de JB= 1.0960 Evaluando para la variable independiente Hogares No Pobres No Ocupada se obtiene en Matlab:
  27. 27. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 24 >> [h,p,jbstat,critval] =jbtest(log(NoPobres),0.05) Warning: P is greater than the largest tabulated value, returning 0.5. > In jbtest at 138 h = 0 p = 0.500000000000000 jbstat = 0.383061007668687 critval = 2.523900000000000 Gráfica 11: Normal HNP Origen: Matlab. Gráfica 12: Histograma HNP Origen: Matlab. Obtenemos un valor de 0.3830 Con los datos obtenidos, hacemos un cuadro de cotejo:
  28. 28. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 25 Variable Independiente JB Prueba JB Resultado Población económicamente No Ocupada 0.2016 <5.99 Hipótesis Ho Aceptada Remesas Familiares 1.0960 Hipotesis Ho Aceptada Hogares No Pobres 0.3830 Hipotesis Ho Aceptada Tabla 10: Cotejo de test JB En resumen, podemos concluir que todas las variables independientes escogidas para el modelo, siguen una distribución normal. Por lo que para un nivel de confianza del 95%, se acepta la hipótesis nula Ho: Las variables independientes Población Económicamente No Ocupada (PENO), Remesas Familiares (RF) y Hogares No Pobres (HNP) poseen una distribución normal. 7.2 Test de significancia global del modelo prueba f Mediante este modelo se concluirá si el Modelo de Regresión utilizado (Múltiple), es el adecuado o no, es decir, si existe una relación lineal entre las variables independientes con la dependiente o no exista tal relación. Esta prueba F trata de aportar si existe la Significancia Global de la Regresión, en esencia si existe una relación significante a nivel general. Por lo tanto, partimos de la Hipótesis formulada inicialmente, para que posteriormente se realice el análisis correspondiente mediante la observación de la tabla nº 3 = = Modelo Suma de cuadrados Gl Media cuadrática F Sig. 1 Regresión 94441.039 3 31480.346 6.243 .028a Residual 30254.420 6 5042.403 Total 124695.458 9 a. Variables predictoras: (Constante), No Pobres, No Ocupados, Remesas b. Variable dependiente: analfabetismo Tabla 10: Tabla ANOVA Origen: Análisis con SPSS De la misma manera que en la prueba t, el análisis de la se hará mediante las siguientes condiciones: La se rechazará, Si el valor-p ≤ α caso contrario se aceptará.
  29. 29. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 26 F= 6.243 Sig. = 0.028 1- α= 0.95 α= 0.05 F 0.028 ≤ 0.05 Lo cual indica que efectivamente la es rechazada: de manera que usando α= 0.05, el valor-p = 0.028 que puede observarse en la última columna de la tabla ANOVA indica que se puede rechazar debido a que el valor-p es menor a 0.028. Por lo tanto, concluimos que existe una relación lineal ya que esta explica una proporción significante de la variabilidad en el Nivel Total de Analfabetas. 7.3 Test de significancia de coeficientes (prueba t). Como ya lo mencionamos uno de los principales propósitos en este análisis de regresión es aceptar el supuesto planteado inicialmente, determinando si el modelo empleado en el estudio de las variables es el adecuado (es linéalo no lo es). Una de las formas para saber si es adecuado o no es determinando el nivel de significancia mediante la prueba t, para cada uno de los parámetros. (En base a esto fue formulada anteriormente la hipótesis del modelo. : : : Validaremos o rechazaremos dicha hipótesis en base al estudio de los datos de la tabla nº 2 la cual nos proporciona los siguientes valores de t: T  ( ) T  ( ) T  ( ) Unas de las formas mediante las cuales podemos estudiar la Ho. Es: La Ho se rechazará, Si: valor de P (Sig)
  30. 30. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 27 Lo cual nos indica que el parámetro con valor p: y con valor p: no son estadísticamente significativos en cuanto el parámetro con valor p: es estadísticamente significativo. Para un nivel de confianza de 95% se rechaza que: No existe relación estadísticamente significativa para remesas con respecto a las demás variables . (Aunque entre estas variables si existe relación estadísticamente significativas) En síntesis si existe una relación lineal Remesas con Y pero no en con Y. Por lo tanto el modelo utilizado en el Análisis de Regresión no es el adecuado. 8. PROYECCIONES DE LA REGRESIÓN OBTENIDA. Dada la proyección obtenida: ̂ En donde ̂ equivale a una función de densidad; por lo que la ecuación corresponde es un plano en el espacio. Dado que dicha densidad no tiene comprensión analítica, se procede a realizar la proyección con los datos de estudio previamente fijados. Tabla 11: Proyección a partir de regresión. Así es como obtenemos la cantidad de miles de personas en condición de analfabetismo, a partir de los datos ya registrados, en su respectivo año. Ahora gracias a las herramientas graficas de MS No Ocupados Remesas No Pobres Analfabetismo (miles de personas) (millones de dólares) (miles de hogares) (Miles de personas) 2000 164.42 142.70 833.41 1113.00 2001 170.30 157.80 836.75 1076.41 2002 147.37 143.40 885.53 1186.08 2003 169.43 172.80 919.46 1135.70 2004 164.03 210.10 948.78 1087.80 2005 177.63 250.40 963.24 998.36 2006 164.24 284.90 1037.35 1014.83 2007 156.08 312.20 993.39 910.13 2008 146.86 299.50 918.45 863.79 2009 187.09 259.00 963.54 969.97 Año
  31. 31. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 28 Excel podemos hacer la regresión en 2 dimensiones: Gráfica 13: curva de proyección de la ecuación de regresión Observe que el resultado, es una pendiente negativa, lo que intuye que el analfabetismo seguirá en decremento en los próximos años, si las variables independientes mantienen sus comportamientos previamente estudiados. Observemos el caso particular, en el que todas las variables fuesen cero: Tabla 12: Caso supuesto Note, que a partir de la ecuación de regresión, la proyección se mantiene constante, es decir, es el mínimo máximo de analfabetismo en El Salvador. No Ocupados Remesas No Pobres Analfabetismo (miles de personas) (millones de dólares) (miles de hogares) (Miles de personas) 2000 0.00 0.00 0.00 659.22 2001 0.00 0.00 0.00 659.22 2002 0.00 0.00 0.00 659.22 2003 0.00 0.00 0.00 659.22 2004 0.00 0.00 0.00 659.22 2005 0.00 0.00 0.00 659.22 2006 0.00 0.00 0.00 659.22 2007 0.00 0.00 0.00 659.22 2008 0.00 0.00 0.00 659.22 2009 0.00 0.00 0.00 659.22 Año
  32. 32. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 29 Esta suposición, bajo un análisis económico y social, no es válida, ya que las 3 variables independientes de estudio, no explican por completo la realidad. Estadísticamente, falta la variable , la cual representa a todas aquellas variables no tomadas en cuenta en el modelo. No hay que olvidar, que otras variables, como la salud, el trabajo infantil, la inversión en educación, etc., inciden y afectan en el comportamiento del Analfabetismo en el país. Aun así, puede hacerse una estimación muy buena sobre el comportamiento a futuro del analfabetismo, tomando la ecuación lineal calculada por Excel. ̂ La cual se basa a su vez, en la ecuación de regresión lineal de múltiples variables.
  33. 33. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 30 CONCLUSIONES  A partir de un modelo de regresión lineal multivariable, puede obtenerse la proyección estimada de la variable dependiente. Dicha proyección para el caso de nuestra investigación se basa en una regresión de 3 variables independientes, la cual equivale a una función de densidad (en libros de texto de cálculo suele emplearse función de masa o de volumen. Es cuando una función está asociada gráficamente a los 3 ejes x, y, z, por lo que la función [una 4ta dimensión] corresponde a una magnitud no graficable). Dicha función, no posee interpretación gráfica, aunque si lógica, pues su valor nominal refleja el comportamiento de la variable dependiente. Para facilitar su lectura, se aplicó una nueva regresión, a partir de la curva dibujada por la ecuación de la proyección, obteniendo un comportamiento de la variable dependiente en el tiempo, cuyo resultado, está asociado implícitamente a las variables independientes del estudio. Esto facilita su comprensión y análisis gráfico.  Cuando todas las variables independientes tienden a cero, la variable dependiente mantiene un valor constante, diferente de cero. En la realidad, esa condición no es válida, ya que existen otras variables (no tomadas en cuenta en la investigación) que modifican el comportamiento del analfabetismo, tales como la inversión en educación, las pandillas, la seguridad, el trabajo infantil, la mortalidad y salud de la población, la orfandad, etc.  Para fines académicos, se propuso que las variables independientes, son excluyentes entre sí, es decir, el comportamiento de una no afecta a la otra. En la realidad, no es así, ya que todas las variables desencadenan efectos sobres las otras, por ejemplo, el incremento de la población económicamente no activa, decrementa la proporción de hogares No Pobres; o el incremento de las remesas, puede incrementar la proporción de hogares No Pobres, etc.
  34. 34. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 31 RECOMENDACIONES.  Al hacer una regresión de múltiples variables, es muy recomendable, que todas las variables independientes estén definidas en el mismo intervalo. Esto ayuda a obtener datos más concisos, y no introducir errores en los cálculos.  Al utilizar un software en específico, debe de asegurar que este cumpla todas las tareas necesarias. En el caso de la investigación, para la prueba de Jarque Bera, SPSS en versión 19 no dispone de ese análisis, por lo que se recurrió a Matlab. Para el caso de las regresiones lineales y la relación entre el analfabetismo contra cada una de las variables independientes, resultaba más conveniente utilizar MS Excel, para el análisis gráfico, ecuación de regresión lineal.
  35. 35. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 i ANEXOS
  36. 36. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 i i. BITÁCORA DE ACTIVIDADES. ACTIVIDADES Octubre 2011 Noviembre 2011 ASISTENTES. OBSERVACIONES 21-23 25-27 30-31 09 14-15 16-20 22-25 26-28 29 Selección del tema Alejandra, Samael, Marvin Presentación de propuesta del tema, y selección del mismo. Reunión: Recolección de base de datos Alejandra, Samael, Oscar Marvin Establecimiento de los datos muéstrales para efectos de realizar la investigación. Reunión: Redacción del primer avance Alejandra, Samael, Oscar En Línea se estableció las bases de donde se obtienen los datos. Reunión: definición de objetivos Biblioteca Central UES. Alejandra, Samael, Oscar Discusión de cuál sería el objetivo de estudio de la investigación. Reunión: Elaboración de Marco conceptual ASECE Alejandra, Samael, Oscar Redacción de uno de los primeros puntos del reporte. Reunión: En línea (Facebook), recolección de datos Alejandra, Samael, Oscar, Marvin Reunión búsqueda de los dato y extracción de los mismos para ser presentados. Establecimiento de variables y presentación de base de datos Alejandra, Samael, Oscar Revisión de los datos a presentarse al docente para que se estableciera la base con la que se haría el estudio. Definición y descripción de las variables Alejandra, Samael, Oscar Definimos las variables objeto de estudio de la investigación. Evaluación de base de datos. Alejandra, Samael, Oscar Se presentaron ciertas dificultades luego de establecer la base de datos se evaluó el problema y se buscó su óptima solución. Elaboración de datos de Regresión Alejandra, Samael, Oscar Biblioteca Central, economía, se ingresan los datos al software SPSS. Análisis de los datos de la Regresión Alejandra, Samael, Oscar, Marvin Análisis de los resultados obtenidos en la regresión. Impresión del informe escrito Alejandra, Samael, Oscar, Marvin Revisión e Impresión del documento final.
  37. 37. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 i ii. TEORÍA SOBRE MODELOS DE REGRESIÓN LINEAL ii.i Modelo de Regresión El término regresión fue introducido por Francis Galton . En términos generales se puede decir que, se trata de un estudio de la dependencia de la variable dependiente, respecto a una o más variables (las variables explicativas), con el objeto de estimar y/o predecir la media o valor promedio poblacional de la primera en términos de los valores conocidos o fijos (en muestras repetidas) de las ultimas. Interpretación: La idea clave detrás del análisis de regresión es la dependencia estadística de una variable (variable dependiente) sobre una o más variables, las variables explicativas (variables independientes). El objetivo de tal análisis es estimar y/o predecir la media o el valor promedio de la variable dependiente con base en los valores conocidos o determinados de las variables explicativas. El éxito del análisis de regresión depende de la disponibilidad de la información apropiada. Ejemplo: Dado el modelo de regresión simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene: ( ) ̂ ( ) ( ) ( )_ Derivando respecto β0 y β1 e igualando a cero se obtiene: ( ̂ ) ( ̂ ) Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solución para ambos parámetros. ( ) ( ̅ )( ̅ ) ( ̅ ) ̅ ̅ La interpretación del parámetro β1 es que un incremento en Xi de una unidad Yi incrementará en β1. Así, por ejemplo, podríamos encontrar que la media de la PAS aumenta con la edad pero que ese aumento es mayor en el grupo de pacientes fumadores que en el de no fumadores, de tal manera que si representamos gráficamente la relación PAS, EDAD en cada uno de los grupos obtenemos unas rectas de regresión como la de la figura: La forma más simple de incorporar la presencia de interacción entre dos variables en una ecuación de regresión consiste en incluir en ésta el producto de ambas: ̂ ̂ ̂ ̂ ̂ Donde E es la variable edad y F fumador (0=no fumador, 1=fumador) Según esta ecuación el cambio medio de ̂ cuando la variable cambia 1-año es, es
  38. 38. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 ii decir que depende también del valor de F, lo que no ocurriría si b3=0. ii.ii Linealidad de las variables El primer significado y posiblemente el más “natural” de linealidad es aquel en que la esperanza condicional de Y es una función lineal de X0. Geométricamente, la curva de regresión en este caso es una línea recta. En esta interpretación, una función de regresión como R(Y/X1)= β1 + β2 X2 no es una función lineal porque la variable x aparece elevada a una potencia o índice de 2. Interpretación Se dice que una función Y= f(x) es lineal en X si X aparece elevado a una potencia o índice de 1 solamente y dicha variable no está multiplicada ni dividida por alguna otra variables (por ejemplo, X.Z o X/Z donde Z es otra variable) si Y depende solamente de X, otra forma de plantear que X está relacionada linealmente con X es que la tasa de cambio con respecto a X (es decir, la pendiente, o la derivada, de Y con respecto a X, dY/dX es independiente del valor de X. Así, si Y=4X, dY/dX=4, este valor es independiente del valor de X. Pero si Y=4, dY/dX=8X, este término no es independiente del valor tomado por X. Por consiguiente la función no es lineal en X. Ejemplo: Una función lineal de una única variable independiente x suele escribirse en la forma siguiente: Que se conoce como ecuación de la recta en el plano En la figura se ven dos rectas, que corresponden a las ecuaciones lineales siguientes: En esta recta el parámetro m= 1/2, esto es el crecimiento de la recta es ½, cuando aumentamos x en una unidad, y aumenta en ½, el valor de b es 2, luego la recta corta el eje y en el punto y=2 La ecuación La pendiente de la recta, el parámetro m=-1, indica que cuanto el valor de x aumenta en una unidad, el valor de y disminuye en una unidad, el corte con el eje y, lo tiene en y=5, dado que el valor de b=5 En el caso de una recta el valor de m se corresponde al ángulo de inclinación de la recta con el eje de las x a través de la expresión: ii.iii Linealidad en los parámetros La segunda interpretación de linealidad se presenta cuando la esperanza condicional de Y, (Y/X1)
  39. 39. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 iii es una función lineal de los parámetros, los β; pueden ser lineal en las variables X o pueden no serlo. Se dice que es una función lineal en el parámetro cuando β1 aparece elevado a una potencia de 1 solamente y no está multiplicando ni dividiendo por ningún otro parámetro. Interpretación La linealidad en los parámetros es relevante para el desarrollo de la teoría de regresión. Ejemplo: De acuerdo con esta interpretación (Y/X1) = β1+ β1 es un modelo de regresión lineal (en el parámetro) Para ver lo anterior, E(Y/X=3) β1+ 9 β2. Por lo tanto, todos los modelos presentados en la figura 2.3 son modelos de regresiones lineales, es decir modelos lineales en los parámetros. Por lo tanto, E(Y/X=3) β1+ 9 β2 ecuación que es obviamente lineal en β1 y β2. Por lo tanto, todos los modelos presentados en la figura 2.3 son modelos de regresiones lineales, es decir modelos lineales en los parámetros. ii.iv Error estocástico. Llamado también estocástica µi, es un sustitutivo para todas aquellas variables que son omitidas del modelo pero que, colectivamente afectan a Y. Interpretación Lo estocástico es la parte de la ecuación que NO SE RECOGE CON NINGUNA VARIABLE. Esto existe por varias razones: 1. Algunos datos no los puedes describir a través de alguna variable (por ejemplo, si hablamos d preferencias, no puedes medir las preferencias de las personas) 2. Son datos totalmente aleatorios (las personas actúan de forma inexplicable a veces que no se puede descifrar) 3. Omites variables (al momento de definir una ecuación econométrica, el mismo analista se “olvida” de poner otra variable que si exista pero no la tomas en cuenta. 4. Factores que ocurren sin ninguna frecuencia (terremotos, hechos que ocurren una sola vez) Ejemplo: Si por ejemplo se quiere explicar la inflación, se sabe que se mueve por el tipo de cambio, el producto, entre otras, pero NUNCA se va a poder explicar al 110% porque hay factores
  40. 40. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 iv inobservables que no se puede definir por varias razones: (no tienes datos, son factores aleatorios, etc.) No es que sirve o no para algo, es algo que está, en econometría el objetivo es estimar de tal forma que la perturbación sea mínima (a través de minimizar los errores al cuadrado). Cuanto se desarrolla un modelo se tiene una variable “Y” que quieres explicar su comportamiento a través de otras “X,W,Z” Y=B1*X + B2*Z + B3*W + U (U es la perturbación). ii.v Regresión Muestral Consiste en determinar los valores de “a” y “b” a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. Luego, la ecuación de regresión muestral estimada es que se interpretación como: a es estimador de A Es el valor estimado de la variable Y cuando la variable X=0 b es el estimador de b, es el coeficiente de regresión. Esta expresado en las mismas unidades de Y pro cada unidad de X. Indica el número de unidades en que varía Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresión). El valor negativo de b sería interpretado con la magnitud del decremento en Y por cada unidad de aumento en X. Interpretación: Generalmente es necesario trabajar con información muestral y no población, por lo tanto, se plantea una ecuación que permita estimar los valores de E(Y/Xi), b0, b1 y ui.; así que el objetivo es estimar la función de regresión poblacional con base en la función de regresión muestral: ̂ ̂ ̂ ̂ ̂ ̂ ̂ ( ) El caso más simple de regresión es cuando se tienen dos variables (una dependiente y una independiente o explicativa), es decir, n parejas de datos. Una vez especificadas las variables es necesario determinar la relación entre ellas, de la cual se puede tener una idea general, graficando las variables en un sistema de coordenadas, en donde, en el eje de las abscisas se ubica la variable independiente y en el de las ordenadas la variable dependiente; esta gráfica se llama nube de puntos. La relación más sencilla es la lineal, la función de regresión poblacional es: ̂ ̂ La cual no se puede observar directamente, por lo tanto, la estimamos a partir de la función de regresión muestral:
  41. 41. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 v ̂ ̂ ̂ ̂ ̂ Ejemplo: Debido a que los valores observados no forman exactamente una línea recta, es necesario elegir un método para estimar los coeficientes de regresión ( ) que haga mínima la diferencia entre los valores observados y los estimadores o ajustados, este método es el de los mínimos cuadrados. Representación gráfica de los coeficientes de regresión y ̂ ( ) (̅)(̅) ( ) ̂ ̅ ̂ (̅ ) ( ) ∑ ( ) ∑ (̅) Interpretación de los coeficientes de regresión: ̂ Es el valor promedio de la variable dependiente cuando la independiente vale cero. También se interpreta como el efecto promedio sobre la variable dependiente de todas las variables omitidas en el modelo de regresión. Cuando el valor del coeficiente de intersección (̂) sea negativo y su interpretación no sea lógica, se interpreta como cero, pero para efectos de proyección se deja el valor obtenido. Si la relación entre las variables es directa y mide el incremento de la variable dependiente por cada aumento de una unidad en la variable independiente. Si la relación entre las variables es inversa y mide el decremento de la variable dependiente por cada aumento de una unidad en la variable independiente o viceversa. ii.vi Mínimos cuadrados ordinarios. Se atribuye a Carl Friendrich Gauss, un matemático alemán. Bajo ciertos supuestos tiene algunas propiedades estadísticas muy atractivas que lo han convertido en uno de los más eficaces y populares del análisis de regresión. El método de los mínimos cuadrados ordinarios consiste en hacer minima la suma de los cuadrados
  42. 42. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 vi residuales, es decir lo que tenemos que hacer es hallar los estimadores que hagan que esta suma sea lo más pequeña posible. Interpretación: Se parte de representar las relaciones entre una variable económica endógena y una o más variables exógenas de forma lineal, de la siguiente manera: “Y” es la variable endógena, cuyo valor es determinado por las exógenas, hasta Las cuales son las variables elegidas depende de la teoría económica que se tenga en mente, y también de análisis estadísticos y económicos previos. El objetivo buscado sería obtener los valores de los parámetros desde hasta . A menudo este modelo se suele completar añadiendo un término más a la suma llamada término independiente, que es un parámetro más a buscar. Así: En el que es una constante, que también hay que averiguar. A veces resulta útil, por motivos estadísticos, suponer que siempre hay una constante en el modelo y contrastar la hipótesis de si es distinto o no de cero para reescribirlo con ello. Ejemplo: Suponga que se cometió un error de reporte con respecto al promedio de calificaciones del primer estudiante, habiéndose reportado una calificación de 1.0 en lugar de la cifra correcta de 4.0 si la línea fuera considerada como una posible línea de mínimos cuadrados, la desviación asociada con el primer punto de los datos sería muy grande y la desviación al cuadrado sería aún más grande. La penalidad grande asociada con los mínimos cuadrados ha forzado al proceso de estimación a poner mayor énfasis en la relación entre la línea recta y el primer punto de los datos. El resultado es que la dependiente de la recta de mínimos cuadrados es muy sensible a los puntos que se encuentran lejos de la verdadera línea de regresión. ii.vii Error estándar de los mínimos cuadrados Los mínimos cuadrados son función de los datos muéstrales y es probable que los datos cambien entre una y otra, los valores estimados cambiaran ipsofacto. Por consiguiente, lo que se requiere en alguna medida de confiabilidad o precisión de los estimadores .y . ( )̂ ( )̂ ( )̂ √ ( )̂ √ Interpretación: Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de medir la diferencia promedio entre lo observado y lo estimado o esperado de acuerdo al modelo, puede considerarse como un indicador del grado de precisión con que la ecuación de regresión, describe entre las dos variables. Ejemplo:
  43. 43. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 vii Un estimador con una varianza muy baja y un pequeño sesgo puede ser más deseable que un estimador insesgado con una varianza alta. Un criterio que es útil a este respecto es la meta de minimizar el error cuadrático medio, el cual se define como: Error cuadrático medio ( )̂ (̂ ̂) No es difícil demostrar que esta ecuación es equivalente a: 1 Error cuadrático medio = [ ( )̂ ] ( )̂ Por tanto, el criterio de minimizar el error cuadrático medio toma en cuenta la varianza y el cuadrado del sesgo del estimador. Cuando ( )̂ es insesgado, el error cuadrático medio y la varianza de ( )̂ son iguales.  Supuesto del modelo de regresión lineal (10 supuestos) En el análisis de regresión el objetivo no es solo obtener a y b1 y b2 sino también hace inferenca sobre los verdaderos B1 y B2 por ejemplo: si se desea sabe que tan cerca están b1 y b2 de sis contrapartes o que tan cerca esta Y de la verdadera E(Y) para este fin no solamente se debe especificar la forma funcional del modelo: ̂ ̂ sino también se deben hacer ciertos supuestos sobre la forma como las son generadas: Supuesto 1: Modelo de regresión lineal. El modelo de regresión lineal es lineal en los parámetros como se observa o sea ̂ ̂ Supuesto 2: Los valores de x son fijos en muestreos repetidos. Los valores que toma el regresor X son considerados fijos en muestreos repetidos, mas técnicamente X se supone no estocástica. Supuesto 3: El valor medio de la perturbación u, es igual a cero. Dado el valor de X la media o el valor esperado del término aleatorio de perturbación es cero. Técnicamente el valor de la media condicional de es cero simbólicamente, se tiene E( ) = 0 Supuesto 4: Homoscedasticidad o igual varianza de . Dado el valor de X, la varianza de , es la misma para todas las observaciones esto es, la varianza condicionales de son idénticas. Simbólicamente se tiene que: Var ( ) [ ( ) ] ( ) Por supuesto 3 Donde Var significa Varianza Supuesto 5: No existe auto correlación entre las perturbaciones. Dados dos valores cualquiera de X, y ( ) la correlación entre dos y ( ) es cero. Simbólicamente:
  44. 44. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 viii ( ) { ( ) } { ( ) } { } { } ¿Por qué? Donde i y j son dos observaciones diferentes y donde COV significa covarianza. Supuesto 6: La covarianza entre y es cero. O ( ) formalmente. Supuesto 7: El número de observaciones n debe ser mayor que el número de parámetros por estimar. Alternativamente, el número de observaciones n debe ser mayor que el número de variables explicativas. Supuesto 8: Variabilidad en los valores de X. No todos los valores de X en una muestra dada deben ser iguales. Técnicamente, Var(X) debe ser número positivo finito. Supuesto 9: El modelo de regresión esta correctamente especificado. Alternativamente no hay un sesgo de especificación o error en el modelo utilizado en el análisis empírico Supuesto 10: No hay multicolinealidad perfecta .Es decir, no hay relaciones perfectamente lineales entre las variables explicativas. Interpretación y ejemplificación: Si no se tiene linealidad se dice que tenemos un error de especificación. En el caso de que sean arias variables independientes. La independencia de la variable aleatoria “residuos” (específicamente importante si los datos se han obtenidos siguiendo una secuencia temporal). Homoscedasticidad o igualdad de varianzas de los residuos y los pronósticos. Esta condición se estudia utilizando las variables: pronósticos y residuos tipificados mediante:  Un gráfico de dispersión El supuesto de Homoscedasticidad implica que la variación de los residuos sea uniforme en todo el rango de valores de los pronósticos. Normalidad de los residuos tipificados. Podemos contrastarla mediante: Histograma: añade una curva y grafico de probabilidad normal: representa las proporciones acumuladas de la variable esperada respecto a las proporciones acumuladas de la variable observada. No – Colinealidad, es decir la inexistencia de Colinealidad. Esta puede ser:  Colinealidad perfecta si una de las variables independientes tiene una relación lineal con otras independientes.  Colinealidad parcial si entre las variables independientes existen altas correlaciones  Propiedades de los estimadores de mínimos cuadrados Los valores estimados de mínimos cuadrados poseen algunas propiedades ideales u optimas las cuales son:
  45. 45. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 ix 1. Es lineal, función de una variables aleatoria, tal como la variable independiente Y en el modelo de regresión. 2. Es insesgado, es decir, su valor promedio o esperado, E(β2), es igual al valor verdadero, β2. 3. Tiene varianza mínima dentro de la clase de todos los estimadores lineales insesgado; un estimador insesgado con varianza mínima es conocida como un estimador eficiente. Interpretación: Propiedad 1. Mantiene una consistencia conforme al tamaño de la muestra. Propiedad 2. Ausencia de sesgo esto quiere decir que la distribución del estimador tenga al valor parámetro como su valor medio. Entonces si se analizan datos nuevos se deben asegurar en el promedio correcto. Propiedad 3. Un estimador es más eficiente que otro si tiene su varianza menor. Esta eficiencia es deseable debido a que entre mayor sea la eficiencia asociada con un proceso de estimación son más fuertes las estimaciones estadísticas que pueden hacerse acerca de los parámetros estimados Ejemplo: La diferencia entre un estimador sesgado y uno insesgado puede verse en las figuras. Aunque es una propiedad deseable, no supone nada acerca de la dispersión del estimador alrededor del parámetro verdadero. En la gráfica se muestra un estimador relativamente eficiente y un estimador relativamente ineficiente. Es de suma importancia ya que entre mayor sea la eficiencia mejor serán las afirmaciones Un estimador es consistente si la distribución del estimador se plega a un solo punto conforme el tamaño de la muestra se hace arbitrariamente grande. En la figura se describe en forma gráfica: iii. TEST SUPUESTOS: iii.i Normalidad: Test de Jarque Bera A menudo es útil probar si una serie de datos dada se aproxima a la distribución normal, esto puede evaluarse de manera informal, estudiando si la media y la mediana son casi iguales, si el sesgo e aproximadamente cero y si la cutorsis está cerca de 3. Una prueba más formal de normalidad esta dad por la estadística Jarque Bera. Sta sigue una distribución normal Ji Cuadrada con 2 grados de libertad. Si la estadística Jarque Bera es mayor que el valor critico Ji Cuadrada, rechazamos la hipótesis nula de normalidad. Interpretación:
  46. 46. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 x La distribución normal es una distribución de probabilidad continua en forma de campana. Una distribución normal puede describirse, completamente por su media y por su varianza u no necesita preocuparse por otras propiedades como el sesgo y la cutorsis. Si dos o más variables aleatorias están distribuidas en forma normal con medias y varianzas idénticas, cualquier suma ponderada de estará distribuida en forma normal. Ejemplo: La distribución de los índices de salario por hora de una población de trabajadores está distribuida en forma aproximadamente normal con media 9.6 dólares y al desviación estándar es de 5.2 dólares que porcentaje de la población de empleados gana más de 20,000 dólares por hora? Y menos de cinco dólares por hora? Determinamos que 20,000 tiene una desviación estándar de 1.98 por encima de la media mientras que 5.00 de dólares tienen una desviación estándar de 0.88 por debajo de la media en la tabla de distribución normal estandarizada, encontramos que 2.39% de la distribución se encuentra a la derecha de 1.98, mientras que el 18.94% se encuentra a la izquierda de 0.88 desviaciones estándar por debajo iii.ii Test significancia global del modelo: prueba F La prueba F se usa para determinar si existe una relación de significancia entre la variable independiente y el conjunto de todas las variables independientes. A esta prueba F se le denomina prueba de significancia global. Si la prueba indica que hay significancia global se usa la prueba T para ver si cada una de las variables individuales es significativa. Para cada una de las variables independientes del modelo se realiza la prueba T (prueba de significancia individual) El modelo de regresión múltiple que definimos es La hipótesis de la prueba F comprende los parámetros del modelo de regresión múltiple Ho: Ha: (uno o más de los parámetros son distintos de cero) Cuando se rechaza Ho, la prueba proporciona evidencia estadística suficiente para conclusión que uno o más de los parámetros no es igual a cero y que la regresión global entre Y y el conjunto de las variables independiente X1, X2 es significativa. En cambio, si no se puede rechazar Ho no se tiene evidencia suficiente para concluir que tiene relación significativa Interpretación: La estadística de prueba se basa en la distribución F y se caracteriza por dos parámetros, estando el primero asociado con el número de parámetros asignados y el segundo con el número de grados de libertad, tiene una forma sesgada y varia en el valor de 0 al infinito. Y puede usarse para probar la igualdad de dos varianzas. Un valor grande de F implica que es improbable que las dos varianzas de error sean iguales. En la práctica, la prueba se lleva a cabo eligiendo un nivel de significancia y luego buscando el valor crítico de la distribución F en una tabla estándar de F. Ejemplo: Se desea saber la varianza de pruebas de matemáticas del SA difiere de la varianza de la prueba verbal del SAT. Se supone que de los 21 alumnos, todos respondieron la prueba verbal pero solo 16 respondieron la prueba de matemáticas. La varianza muestral de la prueba verbal es 80000. Al
  47. 47. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 xi asumir que las poblaciones de las puntuaciones de prueba están distribuidas en forma normal la estadística F es 1.25 con 20 y 15 gl. En vista de que el valor crítico del 5% de la distribución F es 2.33, no podemos descartar la posibilidad de que las varianzas reales son iguales. Ya que hemos elegido una proporción F mayor que uno en la cola superior de la distribución. iii.iii Determinación de intervalos de confianza para los coeficientes estimados Los intervalos de confianza proporcionan un recorrido o límites dentro de los cuales puede encontrarse el verdadero β con un coeficiente de confianza dado (90%, 95%, 99%), por lo tanto el intervalo de confianza proporciona un conjunto de hipótesis nulas posibles. Por consiguiente si 2 bajo HO se encuentra dentro del intervalo de confianza no se rechaza la Ho nula pero si este se encuentra fuera del intervalo se puede rechazar la Ho nula. Interpretación: Los intervalos de confianza pueden usarse para probar hipótesis mediante coeficientes de confianza que se proporcionan. Ejemplo: Para ver esto: se supone que deseamos probar la hipótesis de que la pendiente es 0. Entonces decimos que la hipótesis nula es que la pendiente 0. Sin embargo, en vista de que sabemos que 0 se encuentra afuera del intervalo de confianza del 95% concluimos con una confianza del 95% que podemos rechazar la hipótesis nula de una pendiente de cero. iii.iv Test de significancia de coeficientes: prueba T Como lo normal, la T es simétrica y que se aproxima a la normal para tamaños de muestras grandes, pero la T tiene colas más gruesas de lo normal, una ocurrencia que es pronunciada en especial para el tamaño de muestras de aproximadamente 30 o menos. Si la prueba F indica que la relación de regresión múltiple es significativa, se puede realizar una prueba T para determinar la significancia de cada uno de los parámetros. Para cualquier parámetro: β: Ho: β=0 Ha: β≠0 Interpretación: Por lo tanto, la distribución T puede usarse para probar si la media de una variable aleatoria es cualquier número particular, aun cuando se desconoce la varianza de la variable aleatoria. Para el caso de regresión lineal múltiple si se puede rechazar Ho: Ho: βi=0 y Ha: β2≠0 ambos parámetros son estadísticamente significativos de lo contrario no lo será.
  48. 48. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 xii iv. BASE DE DATOS Y DICCIONARIO DE LA BASE DE DATOS. Se puede observar en la siguiente tabla la base de datos que se ha utilizado en nuestra investigación: Se hace una descripción breve de los datos utilizados en la base de datos: : Población económicamente activa no ocupada: Es el total de personas que, perteneciendo a la población económicamente activa, no se encuentran trabajando pero está buscando empleo. Dentro de la población desempleada se encuentran quienes han perdido su empleo y aquellas personas que buscan trabajo por primera vez, es decir, quienes desean incorporarse al mercado de trabajo. Remesas: son fondos que los emigrantes envían a su país de origen, normalmente a sus familiares.se entiende también como las transferencias monetarias unilaterales enviadas desde el extranjero por particulares y recibidas por población residente en el país. En su mayor parte, las remesas son enviadas en nuestro país desde los Estados Unidos. : Hogares No pobres: es una situación o forma de vida de cierto grupo de personas, que surge como producto de la posibilidad de acceso a ciertos recursos para satisfacer las necesidades físicas y psíquicas básicas humanas que inciden en un desgaste del nivel y calidad de vida de las personas, tales como la alimentación, la vivienda, la educación, la asistencia sanitaria o el acceso al agua potable. Analfabetismo :No Ocupados Remesas No Pobres (millones de personas) (miles de personas) (millones de dólares) (miles de hogares) 1125.76 164.42 142.70 833.41 1103.68 170.30 157.80 836.75 1137.08 147.37 143.40 885.53 1119.70 169.43 172.80 919.46 1102.11 164.03 210.10 948.78 1087.04 177.63 250.40 963.24 1073.37 164.24 284.90 1037.35 838.69 156.08 312.20 993.39 890.93 146.86 299.50 918.45 873.23 187.09 259.00 963.54
  49. 49. Análisis del analfabetismo en El Salvador en el periodo 2000-2009 xiii

×