ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN EL PERIODO 2000- 2009

FACULTAD DE CIENCIAS ECONÓMICAS
DEPARTAMENTO DE CIENCIAS Y HUMANIDADES
ASIGNATURA: ESTADÍSTICA 2.
CICLO 02 2011
TAREA:
ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN
EL PERIODO 2000- 2009
Docente:
Lic. Saúl Quintanilla.
Alumnos:
Vilma Alejandra Montti García MG08012 (representante)
Oscar Wilfredo Cañas Belloso CB09048
José Marvin Orellana Córdova OC08001
Samael Aarón García Meléndez GM11008
CIUDAD UNIVERSITARIA, 29 DE NOVIEMBRE DE 2011.

CONTENIDO
1. OBJETIVOS DE LA INVESTIGACIÓN.................................................................................................. 1
1.1 Objetivo general ........................................................................................................................... 1
1.2 Objetivos específicos. ................................................................................................................... 1
2. CONCEPTOS BÁSICOS..................................................................................................................... 2
2.1 Analfabetismo y alfabetismo. ......................................................................................................... 2
2.2 Las remesas familiares.................................................................................................................. 2
2.3 Población económicamente activa.................................................................................................. 2
2.4 Pobreza. ...................................................................................................................................... 2
3. ESPECIFICACIÓN DEL MODELO DE REGRESIÓN......................................................................... 3
3.1 Planteamiento de hipótesis............................................................................................................ 4
4. FUENTE DE DATOS Y DESCRIPCIÓN DE VARIABLES..................................................................... 5
4.1 Analfabetismo y Alfabetismo.......................................................................................................... 5
4.2 Población económicamente activa.................................................................................................. 6
4.3 Remesas familiares....................................................................................................................... 7
4.5 Hogares en condición de Pobreza.................................................................................................. 8
5. RELACIÓN ENTRE VARIABLES..................................................................................................... 8
5.1 Analfabetismo versus PEA............................................................................................................. 9
5.2 Analfabetismo versus remesas familiares...................................................................................... 11
5.3 Analfabetismo versus Pobreza..................................................................................................... 12
5.4 Relación variables independientes y dependiente. ......................................................................... 13
6. RESULTADOS DE REGRESIÓN................................................................................................... 14
7. DETERMINACIÓN DE INTERVALOS DE CONFIANZA PARA LOS COEFICIENTES ESTIMADOS (TEST
SOBRE SUPUESTOS DE MODELOS).................................................................................................... 19
7.1 Normalidad: Test de Jarque-Bera............................................................................................ 20
7.2 Test de significancia global del modelo prueba f.................................................................... 25
7.3 Test de significancia de coeficientes (prueba t)...................................................................... 26
8. PROYECCIONES DE LA REGRESIÓN OBTENIDA.......................................................................... 27
ANEXOS................................................................................................................................................ i
i. BITÁCORA DE ACTIVIDADES. ........................................................................................................ i
ii. TEORÍA SOBRE MODELOS DE REGRESIÓN LINEAL.................................................................. i
ii.i Modelo de Regresión........................................................................................................... i
ii.ii Linealidad de las variables .................................................................................................. ii
ii.iii Linealidad en los parámetros............................................................................................... ii
ii.iv Error estocástico. ...............................................................................................................iii
ii.v Regresión Muestral ............................................................................................................iv
ii.vi Mínimos cuadrados ordinarios. ........................................................................................... v
ii.vii Error estándar de los mínimos cuadrados.............................................................................vi

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 1
iii. TEST SUPUESTOS: ..................................................................................................................ix
iii.i Normalidad: Test de Jarque Bera.............................................................................................ix
iii.ii Test significancia global del modelo: prueba F .......................................................................x
iii.iii Determinación de intervalos de confianza para los coeficientes estimados ..............................xi
iii.iv Test de significancia de coeficientes: prueba T......................................................................xi
iv. BASE DE DATOS Y DICCIONARIO DE LA BASE DE DATOS............................................................xii
TABLA DE ILUSTRACIONES.
Gráfica 1: Analfabetismo y alfabetismo en El Salvador, periodo 1998-2010 ................................................. 6
Gráfica 2: Flujo de remesas hacia El Salvador en el periodo 1998-2010...................................................... 7
Gráfica 3: Analfabetismo vs PNO........................................................................................................... 10
Gráfica 4: Analfabetismo versus Remesas Familiares.............................................................................. 11
Gráfica 5: Analfabetismo vs No Pobres .................................................................................................. 13
Gráfica 6: Cuadro resumen de la selección de variables independientes vs variable dependiente................ 14
Gráfica 7: Normal PENO.................................................................................................................... 21
Gráfica 8: Histograma PENO ............................................................................................................. 22
Gráfica 9: Normal Remesas Familiares.............................................................................................. 23
Gráfica 10: Histograma Remesas Familiares..................................................................................... 23
Gráfica 11: Normal HNP .................................................................................................................... 24
Gráfica 12: Histograma HNP.............................................................................................................. 24
Gráfica 13: curva de proyección de la ecuación de regresión .......................................................... 28
GUÍA DE TABLAS.
Tabla 1: El analfabetismo y el alfabetismo en El Salvador, periodo 1998-2010............................................. 5
Tabla 2: Población económicamente Activa PEA en El Salvador, periodo 2000-2009................................... 6
Tabla 3: Flujo de remesas hacia El Salvador, periodo 1998-2010 ............................................................... 7
Tabla 4: Hogares en condición de pobreza en El Salvador periodo 2000-2009............................................. 8
Tabla 5: Selección de datos Analfabetismo versus PNO .......................................................................... 10
Tabla 6: Selección de datos Analfabetismo vs Remesas Familiares.......................................................... 11
Tabla 7: Selección de datos de analfabetismo vs No Pobres.................................................................... 12
Tabla 8: Resultados de estadísticos descriptivos..................................................................................... 14
Tabla 9: Resultados de Coeficientes SA................................................................................................. 15
Tabla 10: Cotejo de test JB................................................................................................................ 25
Tabla 11: Proyección a partir de regresión. ...................................................................................... 27
Tabla 12: Caso supuesto.................................................................................................................... 28

1. OBJETIVOS DE LA INVESTIGACIÓN
1.1 Objetivo general
Analiza el comportamiento del analfabetismo en El Salvador en el periodo 2000- 2009 a partir de las
variables independientes Población económicamente no Activa, Remesas Familiares y Hogares No
Pobres.
1.2 Objetivos específicos.
1. Medir el nivel de relación del analfabetismo en El Salvador contra Población
económicamente no activa en el periodo 2000-2009.
2. Medir el nivel de relación del analfabetismo en El Salvador contra Remesas Familiares en el
periodo 2000-2009.
3. Medir el nivel de relación del analfabetismo en El Salvador contra Hogares No Pobres en el
periodo 2000-2009.
4. Medir el nivel de relación del analfabetismo en El Salvador contra las variables
anteriormente mencionadas, a través de una regresión lineal múltiple.
5. Aprender a utilizar las diversas herramientas estadísticas disponibles en software como
SPSS, Excel y Matlab.
6. Estimar una tendencia del comportamiento del analfabetismo en El Salvador, a partir de
datos estadísticos anuales registrados por la Dirección de Estadísticas y Censos.

2. CONCEPTOS BÁSICOS
2.1 Analfabetismo y alfabetismo.
La definición estándar de analfabetismo, es de aquellas personas que no saben leer ni escribir,
aunque también se incluye el analfabetismo parcial, el cual es la capacidad disfuncional de leer y
escribir.
2.2 Las remesas familiares.
Las remesas se les denomina a aquellas transacciones de dinero internacionales, de personas
naturales hacia personas naturales. En el Salvador, dado las condiciones propias del sistema
económico, político y social, las migraciones hacia el exterior (principalmente EEUU y Canadá) van
en aumento. Aquellas personas que radican en el exterior, envían cantidades de dinero a sus
familias y amigos residentes aun en el territorio nacional, para aliviar y subsanar las debilidades y
vicisitudes económicas que enfrentan.
2.3 Población económicamente activa
También denominado como PEA, hace referencia a aquella población en edad de trabajar, que
posee un trabajo actual, o está en busca de uno; es decir, es la condición de empleo, y la condición
potencia de tener empleo.
Dado la naturaleza social y económica en El Salvador, la DIGESTYC incluye en este tipo de
indicador, a todas aquellas personas mayores de 10 años.
2.4 Pobreza.
Económicamente, se definen varios tipos de pobreza.
 Extrema pobreza: Condición en que familias sobreviven con menos de $1.00 al día, y no
logran tener ingresos que cubran la canasta básica de alimentos.
 Pobreza relativa: Condición en que los ingresos familiares cubren la canasta básica de
alimentos, más no la canasta de misceláneos.
 No Pobres: Condición en que los ingresos familiares cubren tanto la canasta básica, como
la canasta de misceláneos.

3. ESPECIFICACIÓN DEL MODELO DE REGRESIÓN
Para el caso; El analfabetismo en El Salvador, depende de muchas variables (independientes)
pero para el objetivo del análisis, estudiaremos cuatro de las más significativas como lo son la
población económicamente No ocupada, las remesas familiares, y la Población No pobre.
Suponiendo que el Modelo de Regresión Lineal Múltiple tomará la siguiente forma:
Donde;
̂ Valor de la variable dependiente, (El analfabetismo en El Salvador)
Son parámetros del Modelo
Valor de las variables independientes (población económicamente no Ocupada, las
remesas familiares, y la Población No pobre, respectivamente).
Sin embargo, es importante hacer mención que desafortunadamente, los valores de los
parámetros no suelen conocerse, por lo tanto no se podría utilizar la ecuación antes
mencionada. Pero a partir de datos muéstrales podríamos conocer y utilizarlos como
estimadores puntuales de dichos parámetros. Obteniendo de esta forma un valor estimado ̂ para la
variable dependiente.
Obteniendo así una nueva ecuación (Ecuación De Regresión Múltiple Estimada).
̂
̂ Valor estimado de Analfabetismo
: Parámetros estimadores del Modelo
Un aspecto muy importante dentro del Modelo Lineal Múltiple es cualquier transformación o
variabilidad en “Y” (representada por )
̂
Donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no
controlables u observables y que por tanto se asocian con el azar. (De ahí su carácter estocástico
del Modelo). “Sin embargo, esta variable no será tomada en el análisis de este estudio”.

3.1 Planteamiento de hipótesis.
Las variables que se miden en el Análisis de Regresión son las que inciden en el Comportamiento
de la variable Dependiente. Es decir, lo que tratamos de probar es; si las variables independientes
en conjunto, tienen alguna relación sea significativa o no en el comportamiento de la variable
independiente, y si el Modelo utilizado en este caso Modelo de Regresión Lineal Múltiple es el
adecuado, para el análisis de dicho estudio.
De acuerdo a esto, podemos definir las Hipótesis correspondientes del Modelo, aplicadas a nuestro
tema de Investigación:
Ho: No se encuentran diferencias estadísticamente significativas entre la variable dependiente
Analfabetismo y las variables independientes Población Económicamente No Ocupada, Remesas
familiares, y Población No Pobre.
Ha: Se encuentran diferencias estadísticamente significativas entre la variable dependiente
Analfabetismo y las variables independientes PEA (Población Económicamente Activa), densidad
poblacional y Remesas.
El modelo de regresión se define de la siguiente manera:
Identificado el correspondiente planteamiento el cual es denominado prueba de Significancia Global,
se analizara por medio de la prueba F y mediante los resultados correspondientes se estará
concluyendo el rechazo o aceptando las hipótesis formuladas.
Si encontramos que hay diferencias estadísticamente significativas en la prueba F, no es suficiente
esto para conocer la relación de las variables del Modelo en forma global, sino que también es
importante realizar cada una de las relaciones de los coeficientes de la ecuación de regresión para
conocer si efectivamente el modelo de regresión empleado es el adecuado o no.
Prueba t
Si se rechazarán las hipótesis correspondientes, todos los parámetros son estadísticamente
significativos si no se puede rechazar cada una de las hipótesis el modelo puede no ser el
adecuado.

4. FUENTE DE DATOS Y DESCRIPCIÓN DE VARIABLES.
4.1 Analfabetismo y Alfabetismo
Las y los analfabetas se definen como aquellas personas de 10 años o más, que no saben leer ni
escribir. A partir de la Encuesta de hogares de propósitos múltiples, que desarrolla la DIGESTYC
anualmente, se ha resumido en la siguiente tabla el conteo de personas en condición de alfabetismo
y en condición de analfabetismo.
Tabla 1: El analfabetismo y el alfabetismo en El Salvador, periodo 1998-2010
Fuente: Encuesta de hogares de propósitos múltiples, DIGESTYC.
En la tabla anterior, se interpreta que el analfabetismo tiene un crecimiento negativo en el periodo
1998-2010, es decir, la cantidad de personas en condición de analfabetismo va disminuyendo, y su
contraparte, la tasa de alfabetismo, ha ido en incremento (crecimiento positivo). Nótese que para el
año 2007 existió un cambio significativo en las cifras, en comparación a su año anterior 2006.
Aunque, vuelven a incrementar en 2008. Se explica este fenómeno, a una posible causa de tipo de
estudio realizado por la DIGESTYC (estimación de datos de nuestra fuente).
Gráficamente, se observa:
Masculino Femenino Total Crec. Anual Masculino Femenino Total Crec. Anual
1998 518,072 678,206 1196,278 - 2016,944 1889,260 3906,204 -
1999 499,347 646,348 1145,695 -4.23% 2130,448 1970,796 4101,244 4.99%
2000 482,847 642,910 1125,757 -1.74% 2195,120 2058,239 4253,359 3.71%
2001 464,453 639,222 1103,675 -1.96% 2318,448 2144,519 4462,967 4.93%
2002 490,625 646,459 1137,084 3.03% 2365,848 2154,753 4520,601 1.29%
2003 477,423 642,281 1119,704 -1.53% 2381,284 2231,362 4612,646 2.04%
2004 472,221 629,885 1102,106 -1.57% 2470,554 2326,972 4797,526 4.01%
2005 441,612 645,426 1087,038 -1.37% 2573,785 2365,128 4938,913 2.95%
2006 444,305 629,066 1073,371 -1.26% 2662,100 2420,751 5082,851 2.91%
2007 345,745 492,945 838,690 -21.86% 2049,552 2250,533 4300,085 -15.40%
2008 371,285 519,642 890,927 6.23% 2374,698 2190,534 4565,232 6.17%
2009 363,115 510,118 873,233 -1.99% 2441,865 2210,459 4652,324 1.91%
2010 357,096 501,948 859,044 -1.62% 2445,535 2243,028 4688,563 0.78%
Año
AlfabetismoAnalfabetismo

Gráfica 1: Analfabetismo y alfabetismo en El Salvador, periodo 1998-2010
Fuente: DIGESTYC.
A pesar de ser ambas condiciones reciprocas entre sí, el nivel de alfabetismo crece en mayor
proporción, que su contraparte, el analfabetismo, que decrece en menor proporción. Esto se debe a
que en estudio se incluyen a personas mayores de 10 años, lo que asocia la condición de
alfabetismo al crecimiento poblacional. Es decir, a aquellas personas en edad apta de escolaridad,
reciben la educación básica que las clasifique en condición de alfabetismo, en cambio, los que están
en condición de analfabetismo, son aquellas que en su mayoría son adultos, no pueden asistir
periódicamente a enseñanza académica, y no han podido cambiar su condición.
4.2 Población económicamente activa.
La población económicamente activa PEA, equivale a la sumatoria de la población ocupada
(empleada) y no ocupada (desempleada), lo que se puede verificar en la siguiente tabla:
Tabla 2: Población económicamente Activa PEA en El Salvador, periodo 2000-2009
Fuente: Cuadro resume de la actividad económica 2000-2009 DIGESTYC.
Ocupada No Ocupada Total
2000 2198,938 164,415 2363,353 -
2001 2275,169 170,298 2445,467 3.47%
2002 2219,603 147,366 2366,969 -3.21%
2003 2280,654 169,427 2450,081 3.51%
2004 2253,645 164,025 2417,670 -1.32%
2005 2283,552 177,634 2461,186 1.80%
2006 2337,091 164,237 2501,328 1.63%
2007 2337,091 156,079 2493,170 -0.33%
2008 2349,050 146,858 2495,908 0.11%
2009 2364,579 187,088 2551,667 2.23%
Año
Población Económicamente Activa Crecimiento
anual

Es necesario destacar, que en la cifra de la PEA, únicamente se incluyen a aquellas personas
mayores de 10 años, en condición y decisión de buscar empleo, o que gozan de alguno. No incluye
a aquellas personas que no trabajan por decisión o condición propia, tales como jubilados,
estudiantes, enfermos, etc.
4.3 Remesas familiares.
Según datos del informe para el desarrollo humano del PNDU de 2006, la mayor proporción de
migrantes hacia Estados Unidos, se dio en la Postguerra, y su mayor apogeo en el nuevo milenio,
dada las vicisitudes económicas que sufren las familias en El Salvador.
La siguiente tabla, resumen de la DIGESTYC, confirma la observación:
Tabla 3: Flujo de remesas hacia El Salvador, periodo 1998-2010
Fuente: DIGESTYC.
Observe el siguiente gráfico:
Gráfica 2: Flujo de remesas hacia El Salvador en el periodo 1998-2010
Fuente: DIGESTYC.
Remesas
USD
1998 $112500,000 -
1999 $97200,000 -13.60%
2000 $142700,000 46.81%
2001 $157800,000 10.58%
2002 $143400,000 -9.13%
2003 $172800,000 20.50%
2004 $210100,000 21.59%
2005 $250400,000 19.18%
2006 $284900,000 13.78%
2007 $312200,000 9.58%
2008 $299500,000 -4.07%
2009 $259000,000 -13.52%
2010 $269800,000 4.17%
Año
Crecimiento
anual

El mayor comportamiento de crecimiento positivo es visualmente obvio en el periodo 2002-2006,
frenando en 2007-2008 a causa de la crisis económica que afecto a todo el mundo capitalista en
dichos años. Se observa una leve mejora en los años posteriores a 2009.
4.5 Hogares en condición de Pobreza.
La DIGESTYC realizo un estudio la última década, para determinar la proporción de hogares según
su condición de pobreza:
Tabla 4: Hogares en condición de pobreza en El Salvador periodo 2000-2009
Fuente: Cuadro resumen de encuesta de hogares de propósitos múltiples, DIGESTYC.
Nota: proporción estimada de personas por hogar es de 4.3
5. RELACIÓN ENTRE VARIABLES
Se considera que las principales causas del analfabetismo, en forma general en el país es:
 El trabajo infantil
 Los niños deben trabajar porque la familia no percibe suficientes ingresos
 Los niños deben trabajar para sobrevivir (estado de abandono)
 Los niños deben de trabajar, porque es la regla de la familia
 Los niños al llegar a adultos, se siente frustrados por no haber estudiado
 La adecuación a percibir ingresos fáciles (remesas)
 Para que estudiar, si se vive cómodamente
 Desintegración familiar
 Los niños, perciben el ambiente en sus hogares.
 Surgen problemas para mantener asistencia a clases
 Mudanzas
 Nivel de ingresos económicos
TOTAL POBREZA EXTREMA POBREZA RELATIVA NO POBRES
2000 1361,556 217,577 310,571 833,408
2001 1367,462 220,708 310,004 836,750
2002 1400,492 220,858 294,103 885,531
2003 1438,897 206,913 312,528 919,455
2004 1450,507 182,039 319,692 948,777
2005 1472,625 181,722 324,567 963,244
2006 1497,547 143,016 317,180 1037,351
2007 1518,713 163,262 362,061 993,390
2008 1529,483 189,656 421,373 918,455
2009 1548,108 185,618 398,947 963,542
Año
HOGARES EN CONDICION DE POBREZA

 La extrema pobreza en el país
 La necesidad de trabajar
 Baja escolaridad de los padres
 Hijos siguen el ejemplo de sus padres
 Padres inculcan el ejemplo a sus hijos
 Resignación a la condición académica y laboral
 El que no logro estudiar de joven, frustra sus deseos de hacerlo de viejo.
 Al alta densidad poblacional, etc.
 Los centros de estudio se ubican en las mayores concentraciones poblacionales
 Quienes viven en zonas difícilmente accesibles, deben de caminar kilómetros para ir al
centro de estudios.
 Personas desisten del estudio dado la lejanía.
 Otros
Concentrando las causas, podemos definir 3 posibles variables (cuyo comportamiento se asumirá
independiente para fines académicos) que afectan la proporción nacional de analfabetismo en El
Salvador (considerado un comportamiento dependiente con respecto a las demás variables).
Para definir las variables necesarias, debe de evaluarse la condición social y económica de la
realidad:
5.1 Analfabetismo versus PEA
Dado que la PEA equivale a la fuerza laboral que dispone un país, no puede representar por sí
misma una relación con el analfabetismo. En cambio el desempleo sí.
Bajo la hipótesis que si el desempleo (no ocupados) es alto, muchas personas no disponen de los
ingresos necesarios para sobrevivir, por lo que la alimentación se hace más prioritaria que la
educación, lo que favorece al incremento del analfabetismo. Esto se traduce a una relación directa
positiva.
Si tomamos los datos necesarios, de la Tabla 1 y tabla 2 tenemos:

Tabla 5: Selección de datos Analfabetismo versus PNO
Origen: Tabla 1 y Tabla 2
Gráfica 3: Analfabetismo vs PNO
Fuente: Tabla 5
Utilizando las librerías de grafico disperso de MS Excel, se obtiene la ecuación representativa de la
relación Analfabetismo versus No Ocupados.
̂
Nótese que cumple la hipótesis propuesta para esta relación, es decir, un comportamiento directo y
positivo.
Analfabetismo No Ocupados
(Miles de personas) (Miles de personas)
2000 1,125.76 164.42
2001 1,103.68 170.30
2002 1,137.08 147.37
2003 1,119.70 169.43
2004 1,102.11 164.03
2005 1,087.04 177.63
2006 1,073.37 164.24
2007 838.69 156.08
2008 890.93 146.86
2009 873.23 187.09
Año

5.2 Analfabetismo versus remesas familiares.
Se formula la siguiente relación: dado los bajos ingresos familiares, se prioriza alimentación contra
educación, lo que propicia el crecimiento del analfabetismo. Pero, si alguno de los miembros de la
familia migran hacia el exterior, y envían dinero para ayudar a la situación económica familiar,
entonces, existe mejor posibilidad de retomar la importancia de la educación, lo que reduce el
analfabetismo.
Es decir, se propone una relación directa negativa. Mientras más ingresos perciban las familias
gracias a las remesas, menor será el analfabetismo en el país.
Si se toman los datos adecuados de la tabla 1 y tabla 3 se tiene:
Tabla 6: Selección de datos Analfabetismo vs Remesas Familiares
Origen: Tabla 1 y tabla 2
Gráfica 4: Analfabetismo versus Remesas Familiares.
Fuente: Tabla 6
Analfabetismo Remesas
(Miles de Personas) (Millones de dólares)
2000 1,125.76 142.70
2001 1,103.68 157.80
2002 1,137.08 143.40
2003 1,119.70 172.80
2004 1,102.11 210.10
2005 1,087.04 250.40
2006 1,073.37 284.90
2007 838.69 312.20
2008 890.93 299.50
2009 873.23 259.00
Año

Con las librerías automatizadas de MS Excel, se obtiene que la ecuación de regresión de la relación
Analfabetismo vs Remesas familiares es:
̂
Lo que satisface la propuesta, de una relación directa y negativa.
5.3 Analfabetismo versus Pobreza.
La propuesta para esta relación, es que la pobreza impacta de forma directa en el analfabetismo. Ya
que a mayor pobreza (extrema más relativa), se dificultan las condiciones para el estudio, por lo que
la prioridad de las familias se enfoca en la supervivencia diaria (lo que origina el trabajo infantil, el
abandono familiar, etc.), incrementando el analfabetismo.
Para fines académicos, se enfocara la Pobreza, a partir de los No Pobres, es decir, se hará el
supuesto, que a mayor cantidad de hogares en condición de No pobreza, se reduce el
analfabetismo, lo que intuye una relación directa y negativa (se prefiere así, ya que el
comportamiento propio del analfabetismo es hacia la baja con el paso de los años).
Tomando los datos necesarios de la tabla 1 y 3, se tiene:
Tabla 7: Selección de datos de analfabetismo vs No Pobres
Origen: Tabla 1 y tabla 3
Analfabetismo No Pobres
(Miles de personas) (Miles de hogares)
2000 1,125.76 833.41
2001 1,103.68 836.75
2002 1,137.08 885.53
2003 1,119.70 919.46
2004 1,102.11 948.78
2005 1,087.04 963.24
2006 1,073.37 1,037.35
2007 838.69 993.39
2008 890.93 918.45
2009 873.23 963.54
Año

Gráfica 5: Analfabetismo vs No Pobres
Fuente: Tabla 7
Utilizando las herramientas de regresión de MS Excel, se obtiene la ecuación de regresión:
̂
Lo que satisface la propuesta, de una tendencia negativa.
5.4 Relación variables independientes y dependiente.
Para nuestra investigación, hemos definido que el modelo de regresión a seguir es:
Y: Analfabetismo.
X1: Población Económicamente No Ocupada (PENO).
X2: Remesas Familiares.
X3: Población No Pobre.
En donde, por fines académicos se considera que las variables independientes son excluyentes
entre sí, sin relación alguna.
El cuadro resumen de las variables seleccionadas es:

Gráfica 6: Cuadro resumen de la selección de variables independientes vs variable
dependiente
Fuente: Tabla 5, tabla 6 y tabla 7, en base a datos publicados por DIGESTYC.
6. RESULTADOS DE REGRESIÓN
En todo análisis estadístico es importante conocer datos generales de las variables en estudio, así
se tendrá una mejor interpretación de los resultados. Para este caso, se presenta a continuación la
Media y la desviación típica respecto a cada una de las variables:
Media Desviación típica N
Analfabetismo 1,035.1585 117.70748 10
No Ocupados 164.7427 12.54349 10
Remesas 223.2800 66.17168 10
No Pobres 929.9903 65.29659 10
Tabla 8: Resultados de estadísticos descriptivos.
Origen: Análisis con SPSS.
Los datos anteriores se toman en base a una muestra de diez elementos (correspondientes a los
años 2000 a 2009). El analfabetismo que es tomada como variable dependiente muestra una media
de 1, 035, 158,50 habitantes en dicho periodo con una desviación típica 117, 707,480 habitantes lo
que nos indica un nivel de concentración de datos bastante alto, en relación a la media; por lo cual
se puede concluir que la media obtenida es representativa y presenta un comportamiento más o
menos normal de la serie.
Analfabetismo No Ocupados Remesas No Pobres
(millones de personas) (miles de personas) (millones de dólares) (miles de hogares)
2000 1125.76 164.42 142.70 833.41
2001 1103.68 170.30 157.80 836.75
2002 1137.08 147.37 143.40 885.53
2003 1119.70 169.43 172.80 919.46
2004 1102.11 164.03 210.10 948.78
2005 1087.04 177.63 250.40 963.24
2006 1073.37 164.24 284.90 1037.35
2007 838.69 156.08 312.20 993.39
2008 890.93 146.86 299.50 918.45
2009 873.23 187.09 259.00 963.54
Año

TABLA Nº2 COEFICIENTE SA
Modelo
Coeficientes no
estandarizados
Coeficientes
tipificados
t Sig.
Intervalo de confianza
de 95.0% para B
B Error típ. Beta
Límite
inferior
Límite
superior
1
(Constante) 659,215 505,942 1,303 ,240 -578,781 1897,211
No Ocupados -,942 1,957 -,100 -,482 ,647 -5,730 3,845
Remesas -2,305 ,616 -1,296 -3,745 ,010 -3,811 -,799
No Pobres 1,125 ,629 ,624 1,787 ,124 -,416 2,665
Tabla 9: Resultados de Coeficientes SA
Origen: Análisis con SPSS
La tabla anterior permite desarrollar el análisis de regresión múltiple para las variables antes
mencionadas, suponiendo que el modelo empleado es apropiado para la relación entre la variable
dependiente y las variables independientes.
A continuación se presenta La ecuación de Regresión Múltiple Estimada la cual se determina a
partir de los datos previos obtenidos (coeficientes):
̂
Dónde: ̂ Es el valor estimado de El analfabetismo
( ) : Es el valor constante estimado que ocuparía la variable dependiente ̂
como El Analfabetismo, sin importar los valores de las variables independientes, en esencia: El
Salvador siempre presentara un nivel de analfabetismo de habitantes sin importar que no
aumente la población económicamente No ocupados ni él envió de remesas, ni los No Pobres.
( ) : Su signo es negativo por lo que se puede concluir que existe una variación
inversamente proporcional entre El Analfabetismo y la Población económicamente No Ocupados
( ) , es decir una estimación del aumento esperado en el analfabetismo que corresponde a la
disminución de la Población económicamente No Ocupados permaneciendo constantes “No Pobres,
Remesas” es 0,942 habitantes.
( ) : Nos indica que habrá una variación negativa entre las variables, es decir una
estimación del aumento esperado en el analfabetismo que corresponde a la disminución de las
remesas permaneciendo constantes “No Pobres y Población económicamente No Ocupados es
2,305 habitantes.
( ) : A diferencia de nos indica que habrá una variación positiva entre las

variables, es decir una estimación del aumento esperado en el analfabetismo que corresponde a la
aumento de No Pobres permaneciendo constantes “Población económicamente No Ocupados y
Remesas” es 1,125 habitantes.
Otra forma de hacer el respectivo análisis para rechazar o validar la Ho, es mediante el valor crítico y
el valor de t (proporcionado en la tabla), Sin embargo desconocemos el valor crítico, por lo tanto se
vuelve más práctico analizarlo de forma utilizada.
Modelo
cuadrado
corregida
Error típ. de
la
estimación
Estadísticos de cambio
Cambio en
cuadrado
Cambio
en gl1 gl2
Sig.
Cambio
en F
1 ,870 ,757 ,636 71,00988 ,757 6,243 3 6 ,028
Tabla 11: Resumen de Modelo.
Uno de los conceptos claves en el Análisis del Modelo de Regresión es la determinación del
Coeficiente de Correlación Múltiple (R), ya que este indica el nivel de sensibilidad de la variable
dependiente ante cambio en las variables independientes.
Al inicio planteábamos que para nuestro caso de estudio (Analfabetismo) Las variables Población
Económicamente No Ocupada y Hogares No Pobres son dos variables muy significativas a la hora
de determinar el valor total de tales habitantes analfabetos y que La variable Remesas no tiene
ninguna relación significativa respecto a las dos anteriores. De ahí que nuestro coeficiente de
correlación es bajo (0.870), y este nos indica que cualquier variación, ya sea en la variable
independiente, Población Económicamente No Ocupada, Remesas u Hogares No Pobres afectarán
en casi la misma proporción el Analfabetismo.
Es decir El nivel de Analfabetismo podrá ser mejor explicado utilizando solamente las variables
Población Económicamente No Ocupada y Hogares No Pobres.
El cuadro también nos dice, por medio del Coeficiente de Determinación (R2) que las predicciones
del modelo se realizaran con un 75.7% de fiabilidad por lo tanto nos indica que no es bueno ya que
las variables presentadas no explican de la mejor manera El Analfabetismo, por lo que debemos
encontrar otras que definan mejor el modelo de regresión para la variable de estudio.
Sin embargo muchas veces el valor de R2 tiende a subir cuando incluyen nuevas variables (Aunque

estas sean poco significativas o tenga poca relación con al variable dependiente). En este caso, si se
añaden mas lo que hará es afectar mucho más la relación entre variables. Es por eso que la tabla
también nos proporciona el Coeficiente de Correlación Corregido. Cabe destacar que baja a
0,636.
analfabetism
o
No
Ocupados Remesas No Pobres
Correlación de Pearson analfabetismo 1.000 .018 -.793 -.429
No Ocupados .018 1.000 -.026 .136
Remesas -.793 -.026 1.000 .802
No Pobres -.429 .136 .802 1.000
Sig. (unilateral) analfabetismo . .480 .003 .108
No Ocupados .480 . .472 .354
Remesas .003 .472 . .003
No Pobres .108 .354 .003 .
N analfabetismo 10 10 10 10
No Ocupados 10 10 10 10
Remesas 10 10 10 10
No Pobres 10 10 10 10
Tabla 12: Correlaciones
El Coeficiente de Correlación de Pearson al igual que el coeficiente de Correlación mide la
capacidad en que están relacionadas las variables, la diferencia es que este las evalúa de dos en
dos (el rango en que los valores tienen que estar es
Es muy importante considerar el signo y el valor de r ya que de esto depende la interpretación,
Para el caso todas las correlaciones (X1, Y) grafica 6, (X2, Y) grafica 7, (X3, Y) grafica 8 presentan
signo negativo entre las variables, es decir el disminuir la Población Económicamente No Ocupados,
El Envió de Remesas y La Población No Pobre, la Variable dependiente Analfabetismo también
presentara una tendencia decreciente.
Cabe destacar que existe una relación negativa moderada con respecto a Remesas (-,793) ya que
sobrepasa los 0,50 de r, mientras que No Ocupadas (,018) y No Pobres (-,429) poseen poca o casi
nula relación debido a que tienden a cero.

Podemos observarlo gráficamente a continuación:
Gráfica 6: (X1, Y)
Fuente: Análisis a través SPSS
Gráfica 7: (X2, Y)
Gráfica 8: (X3 Y)
.000
.200
.400
.600
.800
1.000
1.200
0 0.5 1 1.5 2 2.5
Analfabetismo
Poblacion Economicamente No Ocupados
-1.000
-.500
.000
.500
1.000
1.500
0 0.5 1 1.5 2 2.5
Analfabetismo
Remesas
-1.000
-.500
.000
.500
1.000
1.500
0 0.5 1 1.5 2 2.5
Analfabetismo
Población No Pobre

Modelo No Pobres No Ocupados Remesas
1 Correlaciones No Pobres 1.000 -.263 -.814
No Ocupados -.263 1.000 .229
Remesas -.814 .229 1.000
Covarianzas No Pobres .396 -.324 -.315
No Ocupados -.324 3.828 .275
Remesas -.315 .275 .379
a. Variable dependiente: analfabetismo
Tabla 13: Correlaciones de los coeficientesa.
7. DETERMINACIÓN DE INTERVALOS DE CONFIANZA PARA LOS COEFICIENTES
ESTIMADOS (TEST SOBRE SUPUESTOS DE MODELOS)
Luego de analizar el nivel de variación por cada uno de los coeficientes estimados, es importante
conocer el alcance de la estimación que estamos realizando, estos generalmente se hacen en
términos del margen de error. Sin embargo el cuadro anterior (tabla nº2) nos proporciona por defecto
los limites dentro de los cuales estará comprendido el verdadero parámetro de cada uno de los
coeficientes de la Ecuación de regresión múltiple (es decir CAMBIAR) dichos
intervalos tienen un 95% de nivel de confianza.
Para el caso:
El intervalo seria [-578781 , 1897211]; Límite Inferior, Límite superior)
Con un error de estimación de:  Error= 1,237,996 (1897211) - (-578781/2)
Es decir el valor del Analfabetismo (sin incluir las variables independientes), estará entre -578,781 y
1, 897,211 habitantes a un error de 1, 237,996. Siendo un error y por ende una amplitud bastante
grande. Sin embargo es importante tomar en cuenta el grafo de magnitud de la variable
independiente.
El intervalo seria [-5730, 3845]; (Límite Inferior, Límite superior)
Con un error de estimación de:  Error= 4,787.5 (3845) – (-5730) /2)

Se observa que el valor de la Población Económicamente No Ocupados tendrá un impacto sobre el
Analfabetismo con un intervalo de alcance de estimación entre -5730 y 3845 miles, sin embargo nos
enfrentamos a un margen de error mayor, teniendo siempre una amplitud bastante grande. Pero se
debe tomar en cuenta que dicha variable posee un papel muy importante para el análisis de la
variable dependiente en estudio.
El intervalo seria [-3811, -.799]; (Límite Inferior, Límite superior)
Con un error de estimación de:  Error= -1,905.10 (-3811) – (-.799) /2)
En cuanto a las remesas, su valor se encuentra entre los intervalos de -3811, y -,799 miles (El cual
tiende siempre a valores negativos) desafiando un error de -1,905.10 miles, manteniéndose siempre
una amplitud y error grande.
El intervalo seria [-.416, 2665]; (Límite Inferior, Límite superior)
Con un error de estimación de:  Error= 1,540.5 (2665) – (-.416) /2)
El valor que nos brinda el modelo para esta variable, No Pobres, se encuentra en un intervalo entre -
,416 y 2,665 miles, (Se presenta como el margen más pequeño de todos, pero esto no quiere decir
que sea el menos importante, puede significar igual o inclusive la más altas variación que los
demás). Se enfrenta a un error positivo de 1,540.5 miles.
7.1 Normalidad: Test de Jarque-Bera
El test de Jarque-Bera (desarrollado por Carlos Jarque y Anil Bera) es una prueba que mide la
bondad de ajuste del modelo, identifica si existe simetría, el tipo de curtosis; en otras palabras,
evaluar si la serie de datos cumple con la distribución normal.
Para su uso, de debe definir las hipótesis que identifiquen la serie de datos:
Ho: Las variables independientes Población Económicamente No Ocupada (PENO) (PNO), Remesas
Familiares (RF) y Hogares No Pobres (HNP) (PNP) poseen una distribución normal.
Ha: Las variables independientes Población Económicamente No Ocupada (PENO) (PNO), Remesas
Familiares (RF) y Hogares No Pobres (HNP) (PNP) no siguen una distribución normal.
La prueba J-B sigue una distribución Ji Cuadrada con 2 grados de libertad, y un nivel de
significancia de 0.05; obteniendo un valor critico de 5.99.
Evaluando para la variable independiente Población Económicamente No Ocupada se obtiene en
Matlab:

>> [h,p,jbstat,critval] =jbtest(log(NoOcupados),0.05)
Warning: P is greater than the largest tabulated value, returning 0.5.
> In jbtest at 138
h =
0
p =
0.500000000000000
jbstat =
0.201654403375669
critval =
2.523900000000000
Gráfica 7: Normal PENO
Origen: Matlab.

Gráfica 8: Histograma PENO
Origen: matlab
Obtenemos un valor de JB= 0.2016
Evaluando para la variable independiente Remesas Familiares se obtiene en Matlab:
>> [h,p,jbstat,critval] =jbtest(log(Remesas),0.05)
h =
0
p =
0.211785297880689
jbstat =
1.096029713315346
critval =
2.523900000000000

Gráfica 9: Normal Remesas Familiares
Origen: Matlab.
Gráfica 10: Histograma Remesas Familiares
Origen: Matlab
Obtenemos un valor de JB= 1.0960
Evaluando para la variable independiente Hogares No Pobres No Ocupada se obtiene en Matlab:

>> [h,p,jbstat,critval] =jbtest(log(NoPobres),0.05)
Warning: P is greater than the largest tabulated value, returning 0.5.
> In jbtest at 138
h =
0
p =
0.500000000000000
jbstat =
0.383061007668687
critval =
2.523900000000000
Gráfica 11: Normal HNP
Origen: Matlab.
Gráfica 12: Histograma HNP
Origen: Matlab.
Obtenemos un valor de 0.3830
Con los datos obtenidos, hacemos un cuadro de cotejo:

Variable Independiente JB Prueba JB Resultado
Población económicamente No Ocupada 0.2016
<5.99
Hipótesis Ho Aceptada
Remesas Familiares 1.0960 Hipotesis Ho Aceptada
Hogares No Pobres 0.3830 Hipotesis Ho Aceptada
Tabla 10: Cotejo de test JB
En resumen, podemos concluir que todas las variables independientes escogidas para el modelo,
siguen una distribución normal. Por lo que para un nivel de confianza del 95%, se acepta la
hipótesis nula
Ho: Las variables independientes Población Económicamente No Ocupada (PENO), Remesas
Familiares (RF) y Hogares No Pobres (HNP) poseen una distribución normal.
7.2 Test de significancia global del modelo prueba f
Mediante este modelo se concluirá si el Modelo de Regresión utilizado (Múltiple), es el adecuado o
no, es decir, si existe una relación lineal entre las variables independientes con la dependiente o no
exista tal relación.
Esta prueba F trata de aportar si existe la Significancia Global de la Regresión, en esencia si existe
una relación significante a nivel general.
Por lo tanto, partimos de la Hipótesis formulada inicialmente, para que posteriormente se realice el
análisis correspondiente mediante la observación de la tabla nº 3
=
=
Modelo
Suma de
cuadrados
Gl Media cuadrática F Sig.
1
Regresión 94441.039 3 31480.346 6.243 .028a
Residual 30254.420 6 5042.403
Total 124695.458 9
a. Variables predictoras: (Constante), No Pobres, No Ocupados, Remesas
b. Variable dependiente: analfabetismo
Tabla 10: Tabla ANOVA
Origen: Análisis con SPSS
De la misma manera que en la prueba t, el análisis de la se hará mediante las siguientes
condiciones: La se rechazará, Si el valor-p ≤ α caso contrario se aceptará.

F= 6.243 Sig. = 0.028 1- α= 0.95 α= 0.05
F 0.028 ≤ 0.05
Lo cual indica que efectivamente la es rechazada: de manera que usando α= 0.05, el valor-p =
0.028 que puede observarse en la última columna de la tabla ANOVA indica que se puede rechazar
debido a que el valor-p es menor a 0.028.
Por lo tanto, concluimos que existe una relación lineal ya que esta explica una proporción
significante de la variabilidad en el Nivel Total de Analfabetas.
7.3 Test de significancia de coeficientes (prueba t).
Como ya lo mencionamos uno de los principales propósitos en este análisis de regresión es aceptar
el supuesto planteado inicialmente, determinando si el modelo empleado en el estudio de las
variables es el adecuado (es linéalo no lo es).
Una de las formas para saber si es adecuado o no es determinando el nivel de significancia
mediante la prueba t, para cada uno de los parámetros. (En base a esto fue formulada anteriormente
la hipótesis del modelo.
: : :
Validaremos o rechazaremos dicha hipótesis en base al estudio de los datos de la tabla nº 2 la cual
nos proporciona los siguientes valores de t:
T  ( )
T  ( )
T  ( )
Unas de las formas mediante las cuales podemos estudiar la Ho. Es:
La Ho se rechazará, Si: valor de P (Sig)

Lo cual nos indica que el parámetro con valor p: y
con valor p: no son estadísticamente significativos en
cuanto el parámetro con valor p: es estadísticamente significativo. Para
un nivel de confianza de 95% se rechaza que: No existe relación estadísticamente significativa para
remesas con respecto a las demás variables . (Aunque entre estas variables si existe
relación estadísticamente significativas)
En síntesis si existe una relación lineal Remesas con Y pero no en con Y. Por lo tanto
el modelo utilizado en el Análisis de Regresión no es el adecuado.
8. PROYECCIONES DE LA REGRESIÓN OBTENIDA.
Dada la proyección obtenida:
̂
En donde ̂ equivale a una función de densidad; por lo que la ecuación corresponde es un plano
en el espacio.
Dado que dicha densidad no tiene comprensión analítica, se procede a realizar la proyección con
los datos de estudio previamente fijados.
Tabla 11: Proyección a partir de regresión.
Así es como obtenemos la cantidad de miles de personas en condición de analfabetismo, a partir
de los datos ya registrados, en su respectivo año. Ahora gracias a las herramientas graficas de MS
No Ocupados Remesas No Pobres Analfabetismo
(miles de personas) (millones de dólares) (miles de hogares) (Miles de personas)
2000 164.42 142.70 833.41 1113.00
2001 170.30 157.80 836.75 1076.41
2002 147.37 143.40 885.53 1186.08
2003 169.43 172.80 919.46 1135.70
2004 164.03 210.10 948.78 1087.80
2005 177.63 250.40 963.24 998.36
2006 164.24 284.90 1037.35 1014.83
2007 156.08 312.20 993.39 910.13
2008 146.86 299.50 918.45 863.79
2009 187.09 259.00 963.54 969.97
Año

Excel podemos hacer la regresión en 2 dimensiones:
Gráfica 13: curva de proyección de la ecuación de regresión
Observe que el resultado, es una pendiente negativa, lo que intuye que el analfabetismo seguirá
en decremento en los próximos años, si las variables independientes mantienen sus
comportamientos previamente estudiados.
Observemos el caso particular, en el que todas las variables fuesen cero:
Tabla 12: Caso supuesto
Note, que a partir de la ecuación de regresión, la proyección se mantiene constante, es decir, es el
mínimo máximo de analfabetismo en El Salvador.
No Ocupados Remesas No Pobres Analfabetismo
(miles de personas) (millones de dólares) (miles de hogares) (Miles de personas)
2000 0.00 0.00 0.00 659.22
2001 0.00 0.00 0.00 659.22
2002 0.00 0.00 0.00 659.22
2003 0.00 0.00 0.00 659.22
2004 0.00 0.00 0.00 659.22
2005 0.00 0.00 0.00 659.22
2006 0.00 0.00 0.00 659.22
2007 0.00 0.00 0.00 659.22
2008 0.00 0.00 0.00 659.22
2009 0.00 0.00 0.00 659.22
Año

Esta suposición, bajo un análisis económico y social, no es válida, ya que las 3 variables
independientes de estudio, no explican por completo la realidad. Estadísticamente, falta la
variable , la cual representa a todas aquellas variables no tomadas en cuenta en el modelo.
No hay que olvidar, que otras variables, como la salud, el trabajo infantil, la inversión en
educación, etc., inciden y afectan en el comportamiento del Analfabetismo en el país.
Aun así, puede hacerse una estimación muy buena sobre el comportamiento a futuro del
analfabetismo, tomando la ecuación lineal calculada por Excel.
̂
La cual se basa a su vez, en la ecuación de regresión lineal de múltiples variables.

CONCLUSIONES
 A partir de un modelo de regresión lineal multivariable, puede obtenerse la proyección
estimada de la variable dependiente. Dicha proyección para el caso de nuestra
investigación se basa en una regresión de 3 variables independientes, la cual equivale a
una función de densidad (en libros de texto de cálculo suele emplearse función de masa o
de volumen. Es cuando una función está asociada gráficamente a los 3 ejes x, y, z, por lo
que la función [una 4ta dimensión] corresponde a una magnitud no graficable). Dicha
función, no posee interpretación gráfica, aunque si lógica, pues su valor nominal refleja el
comportamiento de la variable dependiente.
Para facilitar su lectura, se aplicó una nueva regresión, a partir de la curva dibujada por la
ecuación de la proyección, obteniendo un comportamiento de la variable dependiente en
el tiempo, cuyo resultado, está asociado implícitamente a las variables independientes del
estudio. Esto facilita su comprensión y análisis gráfico.
 Cuando todas las variables independientes tienden a cero, la variable dependiente
mantiene un valor constante, diferente de cero. En la realidad, esa condición no es válida,
ya que existen otras variables (no tomadas en cuenta en la investigación) que modifican el
comportamiento del analfabetismo, tales como la inversión en educación, las pandillas, la
seguridad, el trabajo infantil, la mortalidad y salud de la población, la orfandad, etc.
 Para fines académicos, se propuso que las variables independientes, son excluyentes entre
sí, es decir, el comportamiento de una no afecta a la otra. En la realidad, no es así, ya que
todas las variables desencadenan efectos sobres las otras, por ejemplo, el incremento de
la población económicamente no activa, decrementa la proporción de hogares No Pobres;
o el incremento de las remesas, puede incrementar la proporción de hogares No Pobres,
etc.

RECOMENDACIONES.
 Al hacer una regresión de múltiples variables, es muy recomendable, que todas las
variables independientes estén definidas en el mismo intervalo. Esto ayuda a obtener
datos más concisos, y no introducir errores en los cálculos.
 Al utilizar un software en específico, debe de asegurar que este cumpla todas las tareas
necesarias. En el caso de la investigación, para la prueba de Jarque Bera, SPSS en versión
19 no dispone de ese análisis, por lo que se recurrió a Matlab. Para el caso de las
regresiones lineales y la relación entre el analfabetismo contra cada una de las variables
independientes, resultaba más conveniente utilizar MS Excel, para el análisis gráfico,
ecuación de regresión lineal.

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 i
ANEXOS

Análisis del analfabetismo en El Salvador en el periodo 2000-2009
i
i. BITÁCORA DE ACTIVIDADES.
ACTIVIDADES
Octubre 2011 Noviembre 2011
ASISTENTES. OBSERVACIONES
21-23
25-27
30-31
09
14-15
16-20
22-25
26-28
29
Selección del tema Alejandra, Samael, Marvin
Presentación de propuesta del tema, y
selección del mismo.
Reunión: Recolección de base de
datos
Alejandra, Samael, Oscar Marvin
Establecimiento de los datos muéstrales para
efectos de realizar la investigación.
Reunión: Redacción del primer
avance
Alejandra, Samael, Oscar
En Línea se estableció las bases de donde
se obtienen los datos.
Reunión: definición de objetivos
Biblioteca Central UES.
Discusión de cuál sería el objetivo de estudio
de la investigación.
Reunión: Elaboración de Marco
conceptual ASECE
Redacción de uno de los primeros puntos del
reporte.
Reunión: En línea (Facebook),
recolección de datos
Alejandra, Samael, Oscar, Marvin
Reunión búsqueda de los dato y extracción
de los mismos para ser presentados.
Establecimiento de variables y
presentación de base de datos
Revisión de los datos a presentarse al
docente para que se estableciera la base con
la que se haría el estudio.
Definición y descripción de las
variables
Definimos las variables objeto de estudio de
la investigación.
Evaluación de base de datos. Alejandra, Samael, Oscar
Se presentaron ciertas dificultades luego de
establecer la base de datos se evaluó el
problema y se buscó su óptima solución.
Elaboración de datos de Regresión Alejandra, Samael, Oscar
Biblioteca Central, economía, se ingresan los
datos al software SPSS.
Análisis de los datos de la Regresión Alejandra, Samael, Oscar, Marvin
Análisis de los resultados obtenidos en la
regresión.
Impresión del informe escrito Alejandra, Samael, Oscar, Marvin Revisión e Impresión del documento final.

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 i
ii. TEORÍA SOBRE MODELOS DE REGRESIÓN LINEAL
ii.i Modelo de Regresión
El término regresión fue introducido por Francis Galton . En términos generales se puede decir que,
se trata de un estudio de la dependencia de la variable dependiente, respecto a una o más variables
(las variables explicativas), con el objeto de estimar y/o predecir la media o valor promedio
poblacional de la primera en términos de los valores conocidos o fijos (en muestras repetidas) de las
ultimas.
Interpretación:
La idea clave detrás del análisis de regresión es la dependencia estadística de una variable (variable
dependiente) sobre una o más variables, las variables explicativas (variables independientes). El
objetivo de tal análisis es estimar y/o predecir la media o el valor promedio de la variable
dependiente con base en los valores conocidos o determinados de las variables explicativas. El éxito
del análisis de regresión depende de la disponibilidad de la información apropiada.
Ejemplo:
Dado el modelo de regresión simple, si se calcula la esperanza (valor esperado) del valor Y, se
obtiene:
( ) ̂ ( ) ( ) ( )_
Derivando respecto β0 y β1 e igualando a cero se
obtiene:
( ̂ ) ( ̂ )
Obteniendo dos ecuaciones denominadas
ecuaciones normales que generan la siguiente
solución para ambos parámetros.
( )
( ̅ )( ̅ )
( ̅ )
̅ ̅
La interpretación del parámetro β1 es que un incremento en Xi de una unidad Yi incrementará en β1.
Así, por ejemplo, podríamos encontrar que la media de la PAS aumenta con la edad pero que ese
aumento es mayor en el grupo de pacientes fumadores que en el de no fumadores, de tal manera
que si representamos gráficamente la relación PAS, EDAD en cada uno de los grupos obtenemos
unas rectas de regresión como la de la figura:
La forma más simple de incorporar la presencia de interacción entre dos variables en una ecuación
de regresión consiste en incluir en ésta el producto de ambas:
̂ ̂ ̂ ̂ ̂
Donde E es la variable edad y F fumador (0=no fumador, 1=fumador)
Según esta ecuación el cambio medio de ̂ cuando la variable cambia 1-año es, es

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 ii
decir que depende también del valor de F, lo que no ocurriría si b3=0.
ii.ii Linealidad de las variables
El primer significado y posiblemente el más “natural” de linealidad es aquel en que la esperanza
condicional de Y es una función lineal de X0. Geométricamente, la curva de regresión en este caso
es una línea recta. En esta interpretación, una función de regresión como R(Y/X1)= β1 + β2 X2 no es
una función lineal porque la variable x aparece elevada a una potencia o índice de 2.
Interpretación
Se dice que una función Y= f(x) es lineal en X si X
aparece elevado a una potencia o índice de 1
solamente y dicha variable no está multiplicada ni dividida
por alguna otra variables (por ejemplo, X.Z o X/Z donde
Z es otra variable) si Y depende solamente de X,
otra forma de plantear que X está relacionada
linealmente con X es que la tasa de cambio con
respecto a X (es decir, la pendiente, o la derivada, de
Y con respecto a X, dY/dX es independiente del valor de
X. Así, si Y=4X, dY/dX=4, este valor es independiente del valor de X. Pero si Y=4, dY/dX=8X, este
término no es independiente del valor tomado por X. Por consiguiente la función no es lineal en X.
Ejemplo:
Una función lineal de una única variable independiente x suele escribirse en la forma siguiente:
Que se conoce como ecuación de la recta en el plano
En la figura se ven dos rectas, que corresponden a las ecuaciones lineales siguientes:
En esta recta el parámetro m= 1/2, esto es el crecimiento de la recta es ½, cuando aumentamos x
en una unidad, y aumenta en ½, el valor de b es 2, luego la recta corta el eje y en el punto y=2
La ecuación
La pendiente de la recta, el parámetro m=-1, indica que cuanto el valor de x aumenta en una unidad,
el valor de y disminuye en una unidad, el corte con el eje y, lo tiene en y=5, dado que el valor de b=5
En el caso de una recta el valor de m se corresponde al ángulo de inclinación de la recta con el eje
de las x a través de la expresión:
ii.iii Linealidad en los parámetros
La segunda interpretación de linealidad se presenta cuando la esperanza condicional de Y, (Y/X1)

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 iii
es una función lineal de los parámetros, los β; pueden ser lineal en las variables X o pueden no
serlo. Se dice que es una función lineal en el parámetro cuando β1 aparece elevado a una potencia
de 1 solamente y no está multiplicando ni dividiendo por ningún otro parámetro.
Interpretación
La linealidad en los parámetros es relevante para el desarrollo de la teoría de regresión.
Ejemplo:
De acuerdo con esta interpretación (Y/X1) = β1+ β1 es un modelo de regresión lineal (en el
parámetro) Para ver lo anterior, E(Y/X=3) β1+ 9 β2. Por lo tanto, todos los modelos presentados en la
figura 2.3 son modelos de regresiones lineales, es decir modelos lineales en los parámetros.
Por lo tanto, E(Y/X=3) β1+ 9 β2 ecuación que es obviamente lineal en β1 y β2. Por lo tanto, todos los
modelos presentados en la figura 2.3 son modelos de regresiones lineales, es decir modelos lineales
en los parámetros.
ii.iv Error estocástico.
Llamado también estocástica µi, es un sustitutivo para todas aquellas variables que son omitidas del
modelo pero que, colectivamente afectan a Y.
Interpretación
Lo estocástico es la parte de la ecuación que NO SE RECOGE CON NINGUNA VARIABLE.
Esto existe por varias razones:
1. Algunos datos no los puedes describir a través de alguna variable (por ejemplo, si hablamos
d preferencias, no puedes medir las preferencias de las personas)
2. Son datos totalmente aleatorios (las personas actúan de forma inexplicable a veces que no
se puede descifrar)
3. Omites variables (al momento de definir una ecuación econométrica, el mismo analista se
“olvida” de poner otra variable que si exista pero no la tomas en cuenta.
4. Factores que ocurren sin ninguna frecuencia (terremotos, hechos que ocurren una sola vez)
Ejemplo:
Si por ejemplo se quiere explicar la inflación, se sabe que se mueve por el tipo de cambio, el
producto, entre otras, pero NUNCA se va a poder explicar al 110% porque hay factores

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 iv
inobservables que no se puede definir por varias razones: (no tienes datos, son factores aleatorios,
etc.)
No es que sirve o no para algo, es algo que está, en econometría el objetivo es estimar de tal forma
que la perturbación sea mínima (a través de minimizar los errores al cuadrado).
Cuanto se desarrolla un modelo se tiene una variable “Y” que quieres explicar su comportamiento a
través de otras “X,W,Z”
Y=B1*X + B2*Z + B3*W + U (U es la perturbación).
ii.v Regresión Muestral
Consiste en determinar los valores de “a” y “b” a partir de la muestra, es decir, encontrar los valores
de a y b con los datos observados de la muestra. Luego, la ecuación de regresión muestral estimada
es que se interpretación como:
a es estimador de A
Es el valor estimado de la variable Y cuando la variable X=0
b es el estimador de b, es el coeficiente de regresión.
Esta expresado en las mismas unidades de Y pro cada unidad de X. Indica el número de unidades
en que varía Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de
regresión).
El valor negativo de b sería interpretado con la magnitud del decremento en Y por cada unidad de
aumento en X.
Interpretación:
Generalmente es necesario trabajar con información muestral y no población, por lo tanto, se
plantea una ecuación que permita estimar los valores de E(Y/Xi), b0, b1 y ui.; así que el objetivo es
estimar la función de regresión poblacional con base en la función de regresión muestral:
̂ ̂ ̂
̂
̂
̂
̂ ( )
El caso más simple de regresión es cuando se tienen dos variables (una dependiente y una
independiente o explicativa), es decir, n parejas de datos.
Una vez especificadas las variables es necesario determinar la relación entre ellas, de la cual se
puede tener una idea general, graficando las variables en un sistema de coordenadas, en donde, en
el eje de las abscisas se ubica la variable independiente y en el de las ordenadas la variable
dependiente; esta gráfica se llama nube de puntos.
La relación más sencilla es la lineal, la función de regresión poblacional es:
̂ ̂
La cual no se puede observar directamente, por lo tanto, la estimamos a partir de la función de
regresión muestral:

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 v
̂ ̂ ̂
̂
̂
Ejemplo:
Debido a que los valores observados no forman exactamente una línea recta, es necesario elegir un
método para estimar los coeficientes de regresión ( ) que haga mínima la diferencia entre
los valores observados y los estimadores o ajustados, este método es el de los mínimos cuadrados.
Representación gráfica de los coeficientes de regresión y
̂
( ) (̅)(̅)
( )
̂ ̅ ̂ (̅ )
( ) ∑ ( ) ∑ (̅)
Interpretación de los coeficientes de regresión:
̂ Es el valor promedio de la variable dependiente cuando la independiente vale cero. También se
interpreta como el efecto promedio sobre la variable dependiente de todas las variables omitidas en
el modelo de regresión.
Cuando el valor del coeficiente de intersección (̂) sea negativo y su interpretación no sea lógica,
se interpreta como cero, pero para efectos de proyección se deja el valor obtenido.
Si la relación entre las variables es directa y mide el incremento de la variable
dependiente por cada aumento de una unidad en la variable independiente. Si la relación
entre las variables es inversa y mide el decremento de la variable dependiente por cada aumento de
una unidad en la variable independiente o viceversa.
ii.vi Mínimos cuadrados ordinarios.
Se atribuye a Carl Friendrich Gauss, un matemático alemán. Bajo ciertos supuestos tiene algunas
propiedades estadísticas muy atractivas que lo han convertido en uno de los más eficaces y
populares del análisis de regresión.
El método de los mínimos cuadrados ordinarios consiste en hacer minima la suma de los cuadrados

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 vi
residuales, es decir lo que tenemos que hacer es hallar los estimadores que hagan que esta suma
sea lo más pequeña posible.
Interpretación:
Se parte de representar las relaciones entre una variable económica endógena y una o más
variables exógenas de forma lineal, de la siguiente manera:
“Y” es la variable endógena, cuyo valor es determinado por las exógenas, hasta Las cuales
son las variables elegidas depende de la teoría económica que se tenga en mente, y también de
análisis estadísticos y económicos previos. El objetivo buscado sería obtener los valores de los
parámetros desde hasta . A menudo este modelo se suele completar añadiendo un término
más a la suma llamada término independiente, que es un parámetro más a buscar. Así:
En el que es una constante, que también hay que averiguar. A veces resulta útil, por motivos
estadísticos, suponer que siempre hay una constante en el modelo y contrastar la hipótesis de si es
distinto o no de cero para reescribirlo con ello.
Ejemplo:
Suponga que se cometió un error de reporte con respecto al promedio de calificaciones del primer
estudiante, habiéndose reportado una calificación de 1.0 en lugar de la cifra correcta de 4.0 si la
línea fuera considerada como una posible línea de mínimos cuadrados, la desviación asociada
con el primer punto de los datos sería muy grande y la desviación al cuadrado sería aún más
grande. La penalidad grande asociada con los mínimos cuadrados ha forzado al proceso de
estimación a poner mayor énfasis en la relación entre la línea recta y el primer punto de los datos. El
resultado es que la dependiente de la recta de mínimos cuadrados es muy sensible a los puntos que
se encuentran lejos de la verdadera línea de regresión.
ii.vii Error estándar de los mínimos cuadrados
Los mínimos cuadrados son función de los datos muéstrales y es probable que los datos cambien
entre una y otra, los valores estimados cambiaran ipsofacto. Por consiguiente, lo que se requiere en
alguna medida de confiabilidad o precisión de los estimadores .y .
( )̂ ( )̂
( )̂
√
( )̂ √
Interpretación:
Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de
medir la diferencia promedio entre lo observado y lo estimado o esperado de acuerdo al modelo,
puede considerarse como un indicador del grado de precisión con que la ecuación de regresión,
describe entre las dos variables.
Ejemplo:

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 vii
Un estimador con una varianza muy baja y un pequeño sesgo puede ser más deseable que un
estimador insesgado con una varianza alta. Un criterio que es útil a este respecto es la meta de
minimizar el error cuadrático medio, el cual se define como:
Error cuadrático medio ( )̂ (̂ ̂)
No es difícil demostrar que esta ecuación es equivalente a: 1
Error cuadrático medio = [ ( )̂ ] ( )̂
Por tanto, el criterio de minimizar el error cuadrático medio toma en cuenta la varianza y el cuadrado
del sesgo del estimador. Cuando ( )̂ es insesgado, el error cuadrático medio y la varianza de
( )̂ son iguales.
 Supuesto del modelo de regresión lineal (10 supuestos)
En el análisis de regresión el objetivo no es solo obtener a y b1 y b2 sino también hace inferenca
sobre los verdaderos B1 y B2 por ejemplo: si se desea sabe que tan cerca están b1 y b2 de sis
contrapartes o que tan cerca esta Y de la verdadera E(Y) para este fin no solamente se debe
especificar la forma funcional del modelo: ̂ ̂ sino también se deben hacer
ciertos supuestos sobre la forma como las son generadas:
Supuesto 1: Modelo de regresión lineal. El modelo de regresión lineal es lineal en los
parámetros como se observa o sea ̂ ̂
Supuesto 2: Los valores de x son fijos en muestreos repetidos. Los valores que toma el
regresor X son considerados fijos en muestreos repetidos, mas técnicamente X se supone
no estocástica.
Supuesto 3: El valor medio de la perturbación u, es igual a cero. Dado el valor de X la
media o el valor esperado del término aleatorio de perturbación es cero. Técnicamente el
valor de la media condicional de es cero simbólicamente, se tiene E( ) = 0
Supuesto 4: Homoscedasticidad o igual varianza de . Dado el valor de X, la varianza
de , es la misma para todas las observaciones esto es, la varianza condicionales de son
idénticas. Simbólicamente se tiene que:
Var ( ) [
( )
]
( ) Por supuesto 3
Donde Var significa Varianza
Supuesto 5: No existe auto correlación entre las perturbaciones. Dados dos valores
cualquiera de X, y ( ) la correlación entre dos y ( ) es
cero. Simbólicamente:

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 viii
( ) {
( )
} {
( )
}
{ } { } ¿Por qué?
Donde i y j son dos observaciones diferentes y donde COV significa covarianza.
Supuesto 6: La covarianza entre y es cero. O ( ) formalmente.
Supuesto 7: El número de observaciones n debe ser mayor que el número de
parámetros por estimar. Alternativamente, el número de observaciones n debe ser mayor
que el número de variables explicativas.
Supuesto 8: Variabilidad en los valores de X. No todos los valores de X en una muestra
dada deben ser iguales. Técnicamente, Var(X) debe ser número positivo finito.
Supuesto 9: El modelo de regresión esta correctamente especificado. Alternativamente
no hay un sesgo de especificación o error en el modelo utilizado en el análisis empírico
Supuesto 10: No hay multicolinealidad perfecta .Es decir, no hay relaciones
perfectamente lineales entre las variables explicativas.
Interpretación y ejemplificación:
Si no se tiene linealidad se dice que tenemos un error de especificación. En el caso de que sean
arias variables independientes. La independencia de la variable aleatoria “residuos”
(específicamente importante si los datos se han obtenidos siguiendo una secuencia temporal).
Homoscedasticidad o igualdad de varianzas de los residuos y los pronósticos. Esta condición se
estudia utilizando las variables: pronósticos y residuos tipificados mediante:
 Un gráfico de dispersión
El supuesto de Homoscedasticidad implica que la variación de los residuos sea uniforme en todo el
rango de valores de los pronósticos. Normalidad de los residuos tipificados. Podemos contrastarla
mediante:
Histograma: añade una curva y grafico de probabilidad normal: representa las proporciones
acumuladas de la variable esperada respecto a las proporciones acumuladas de la variable
observada.
No – Colinealidad, es decir la inexistencia de Colinealidad. Esta puede ser:
 Colinealidad perfecta si una de las variables independientes tiene una relación lineal con
otras independientes.
 Colinealidad parcial si entre las variables independientes existen altas correlaciones
 Propiedades de los estimadores de mínimos cuadrados
Los valores estimados de mínimos cuadrados poseen algunas propiedades ideales u optimas las
cuales son:

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 ix
1. Es lineal, función de una variables aleatoria, tal como la variable independiente Y en el
modelo de regresión.
2. Es insesgado, es decir, su valor promedio o esperado, E(β2), es igual al valor verdadero, β2.
3. Tiene varianza mínima dentro de la clase de todos los estimadores lineales insesgado; un
estimador insesgado con varianza mínima es conocida como un estimador eficiente.
Interpretación:
Propiedad 1. Mantiene una consistencia conforme al tamaño de la muestra.
Propiedad 2. Ausencia de sesgo esto quiere decir que la distribución del estimador tenga al valor
parámetro como su valor medio. Entonces si se analizan datos nuevos se deben asegurar en el
promedio correcto.
Propiedad 3. Un estimador es más eficiente que otro si tiene su varianza menor. Esta eficiencia es
deseable debido a que entre mayor sea la eficiencia asociada con un proceso de estimación son
más fuertes las estimaciones estadísticas que pueden hacerse acerca de los parámetros estimados
Ejemplo:
La diferencia entre un estimador sesgado y uno insesgado puede verse en las figuras. Aunque es
una propiedad deseable, no supone nada acerca de la dispersión del estimador alrededor del
parámetro verdadero.
En la gráfica se muestra un estimador relativamente eficiente y un estimador relativamente
ineficiente. Es de suma importancia ya que entre mayor sea la eficiencia mejor serán las
afirmaciones
Un estimador es consistente si la distribución del estimador se plega a un solo punto conforme el
tamaño de la muestra se hace arbitrariamente grande. En la figura se describe en forma gráfica:
iii. TEST SUPUESTOS:
iii.i Normalidad: Test de Jarque Bera
A menudo es útil probar si una serie de datos dada se aproxima a la distribución normal, esto puede
evaluarse de manera informal, estudiando si la media y la mediana son casi iguales, si el sesgo e
aproximadamente cero y si la cutorsis está cerca de 3. Una prueba más formal de normalidad esta
dad por la estadística Jarque Bera.
Sta sigue una distribución normal Ji Cuadrada con 2 grados de libertad. Si la estadística Jarque Bera
es mayor que el valor critico Ji Cuadrada, rechazamos la hipótesis nula de normalidad.
Interpretación:

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 x
La distribución normal es una distribución de probabilidad continua en forma de campana. Una
distribución normal puede describirse, completamente por su media y por su varianza u no necesita
preocuparse por otras propiedades como el sesgo y la cutorsis. Si dos o más variables aleatorias
están distribuidas en forma normal con medias y varianzas idénticas, cualquier suma ponderada de
estará distribuida en forma normal.
Ejemplo:
La distribución de los índices de salario por hora de una población de trabajadores está distribuida
en forma aproximadamente normal con media 9.6 dólares y al desviación estándar es de 5.2 dólares
que porcentaje de la población de empleados gana más de 20,000 dólares por hora? Y menos de
cinco dólares por hora? Determinamos que 20,000 tiene una desviación estándar de 1.98 por
encima de la media mientras que 5.00 de dólares tienen una desviación estándar de 0.88 por debajo
de la media en la tabla de distribución normal estandarizada, encontramos que 2.39% de la
distribución se encuentra a la derecha de 1.98, mientras que el 18.94% se encuentra a la izquierda
de 0.88 desviaciones estándar por debajo
iii.ii Test significancia global del modelo: prueba F
La prueba F se usa para determinar si existe una relación de significancia entre la variable
independiente y el conjunto de todas las variables independientes. A esta prueba F se le denomina
prueba de significancia global.
Si la prueba indica que hay significancia global se usa la prueba T para ver si cada una de las
variables individuales es significativa. Para cada una de las variables independientes del modelo se
realiza la prueba T (prueba de significancia individual)
El modelo de regresión múltiple que definimos es
La hipótesis de la prueba F comprende los parámetros del modelo de regresión múltiple
Ho:
Ha: (uno o más de los parámetros son distintos de cero)
Cuando se rechaza Ho, la prueba proporciona evidencia estadística suficiente para conclusión que
uno o más de los parámetros no es igual a cero y que la regresión global entre Y y el conjunto de las
variables independiente X1, X2 es significativa. En cambio, si no se puede rechazar Ho no se tiene
evidencia suficiente para concluir que tiene relación significativa
Interpretación:
La estadística de prueba se basa en la distribución F y se caracteriza por dos parámetros, estando el
primero asociado con el número de parámetros asignados y el segundo con el número de grados de
libertad, tiene una forma sesgada y varia en el valor de 0 al infinito. Y puede usarse para probar la
igualdad de dos varianzas. Un valor grande de F implica que es improbable que las dos varianzas de
error sean iguales. En la práctica, la prueba se lleva a cabo eligiendo un nivel de significancia y
luego buscando el valor crítico de la distribución F en una tabla estándar de F.
Ejemplo:
Se desea saber la varianza de pruebas de matemáticas del SA difiere de la varianza de la prueba
verbal del SAT. Se supone que de los 21 alumnos, todos respondieron la prueba verbal pero solo 16
respondieron la prueba de matemáticas. La varianza muestral de la prueba verbal es 80000. Al

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 xi
asumir que las poblaciones de las puntuaciones de prueba están distribuidas en forma normal la
estadística F es 1.25 con 20 y 15 gl. En vista de que el valor crítico del 5% de la distribución F es
2.33, no podemos descartar la posibilidad de que las varianzas reales son iguales. Ya que hemos
elegido una proporción F mayor que uno en la cola superior de la distribución.
iii.iii Determinación de intervalos de confianza para los coeficientes estimados
Los intervalos de confianza proporcionan un recorrido o límites dentro de los cuales puede
encontrarse el verdadero β con un coeficiente de confianza dado (90%, 95%, 99%), por lo tanto el
intervalo de confianza proporciona un conjunto de hipótesis nulas posibles.
Por consiguiente si 2 bajo HO se encuentra dentro del intervalo de confianza no se rechaza la Ho
nula pero si este se encuentra fuera del intervalo se puede rechazar la Ho nula.
Interpretación:
Los intervalos de confianza pueden usarse para probar hipótesis mediante coeficientes de confianza
que se proporcionan.
Ejemplo:
Para ver esto: se supone que deseamos probar la hipótesis de que la pendiente es 0. Entonces
decimos que la hipótesis nula es que la pendiente 0. Sin embargo, en vista de que sabemos que 0
se encuentra afuera del intervalo de confianza del 95% concluimos con una confianza del 95% que
podemos rechazar la hipótesis nula de una pendiente de cero.
iii.iv Test de significancia de coeficientes: prueba T
Como lo normal, la T es simétrica y que se aproxima a la normal para tamaños de muestras
grandes, pero la T tiene colas más gruesas de lo normal, una ocurrencia que es pronunciada en
especial para el tamaño de muestras de aproximadamente 30 o menos.
Si la prueba F indica que la relación de regresión múltiple es significativa, se puede realizar una
prueba T para determinar la significancia de cada uno de los parámetros.
Para cualquier parámetro: β: Ho: β=0
Ha: β≠0
Interpretación:
Por lo tanto, la distribución T puede usarse para probar si la media de una variable aleatoria es
cualquier número particular, aun cuando se desconoce la varianza de la variable aleatoria.
Para el caso de regresión lineal múltiple si se puede rechazar Ho: Ho: βi=0 y Ha: β2≠0 ambos
parámetros son estadísticamente significativos de lo contrario no lo será.

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 xii
iv. BASE DE DATOS Y DICCIONARIO DE LA BASE DE DATOS.
Se puede observar en la siguiente tabla la base de datos que se ha utilizado en nuestra
investigación:
Se hace una descripción breve de los datos utilizados en la base de datos:
: Población económicamente activa no ocupada: Es el total de personas que, perteneciendo a
la población económicamente activa, no se encuentran trabajando pero está buscando empleo.
Dentro de la población desempleada se encuentran quienes han perdido su empleo y aquellas
personas que buscan trabajo por primera vez, es decir, quienes desean incorporarse al mercado de
trabajo.
Remesas: son fondos que los emigrantes envían a su país de origen, normalmente a sus
familiares.se entiende también como las transferencias monetarias unilaterales enviadas desde el
extranjero por particulares y recibidas por población residente en el país. En su mayor parte, las
remesas son enviadas en nuestro país desde los Estados Unidos.
: Hogares No pobres: es una situación o forma de vida de cierto grupo de personas, que surge
como producto de la posibilidad de acceso a ciertos recursos para satisfacer las necesidades físicas
y psíquicas básicas humanas que inciden en un desgaste del nivel y calidad de vida de las personas,
tales como la alimentación, la vivienda, la educación, la asistencia sanitaria o el acceso al agua
potable.
Analfabetismo :No Ocupados Remesas No Pobres
(millones de personas) (miles de personas) (millones de dólares) (miles de hogares)
1125.76 164.42 142.70 833.41
1103.68 170.30 157.80 836.75
1137.08 147.37 143.40 885.53
1119.70 169.43 172.80 919.46
1102.11 164.03 210.10 948.78
1087.04 177.63 250.40 963.24
1073.37 164.24 284.90 1037.35
838.69 156.08 312.20 993.39
890.93 146.86 299.50 918.45
873.23 187.09 259.00 963.54

Análisis del analfabetismo en El Salvador en el periodo 2000-2009 xiii

ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN EL PERIODO 2000- 2009

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN EL PERIODO 2000- 2009

Similar to ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN EL PERIODO 2000- 2009 (20)

More from aliloinomedle

More from aliloinomedle (20)

ANÁLISIS DEL ANALFABETISMO EN EL SALVADOR EN EL PERIODO 2000- 2009