1


Ejemplos de estudios de series de tiempo


Ejemplo 1                   Pasajeros Aerolíneas Internacionales (PAI)


Es...
2




Transformación de los datos
En algunos casos, la gráfica de los datos sugiere considerar una transformación de
los m...
3




Identificación del modelo


Luego de transformados los datos y observada la gráfica                       de los dat...
4




En primer lugar observemos que los 36 primeros coeficientes de autocorrelación
son positivos, como consecuencia de l...
5




Con 144 observaciones en la serie ΔLPAI, una regla útil para decidir si un
coeficiente de autocorrelación es signifi...
6


Examinando el correlograma y teniendo en cuenta que el valor crítico de los
coeficientes de autocorrelación es también...
7


El resultado es:
                             ΔΔ12 LPAIt = ( 1 - 0.3765 L) ( 1 - 0.6242 L12 ) εt




Sample: 1950:02 1...
8




Correlograma de los residuos del modelo ajustado

Sample: 1950:02 1960:12
Included observations: 131
     Q-statisti...
9




PREDICCIÓN

Dado el último dato observado PAI60:12 del proceso SARIMA (0, 1, 1) (0, 1, 1)12
se desea estimar la vari...
10




El gráfico anterior contiene la predicción de la variable, Wt, para el período
1949/1 a 1961/12 (línea punteada) y ...
11




Ejemplo 2

Para este segundo ejemplo de aplicación de las técnicas de modelización
ARIMA se eligió una serie de dat...
12




Identificación del modelo

En primer lugar observemos el correlograma de los datos Leche

  Autocorrelation    Part...
13




Correlograma de la serie ΔΔ12 Leche

Included observations: 90
  Autocorrelation     Partial Correlation         AC...
14


A partir del correlograma de la serie ΔΔ12 Leche se identifica el siguiente
modelo: SARIMA (0,1,2)(0,1,12)12.

Estima...
15




Sample: 1991:02 1998:07
Included observations: 90
     Q-statistic
    probabilities
   adjusted for 3
   ARMA term...
16




                                                                                          10000

                  ...
Upcoming SlideShare
Loading in...5
×

2009 06-ejemplos de estudios de series de tiempo

7,231

Published on

Published in: Travel, Business
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
7,231
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
214
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Transcript of "2009 06-ejemplos de estudios de series de tiempo"

  1. 1. 1 Ejemplos de estudios de series de tiempo Ejemplo 1 Pasajeros Aerolíneas Internacionales (PAI) Este estudio está realizado sobre un famoso conjunto de datos mensuales, el número de pasajeros de aerolíneas internacionales, que ha sido analizado por muchos autores incluyendo a Box y Jenkins. Problema Encontrar un modelo ARIMA adecuado que reproduzca la serie y predecir los doce meses siguientes al último mes para el que se dispone dato. Gráfica de los datos Una etapa importante en el análisis de una serie de tiempo es la representación gráfica de los datos en los sucesivos períodos de tiempo. Esta gráfica mostrará las características de la serie, si tiene tendencia, estacionalidad, discontinuidades, o existen datos situados fuera de los límites esperados. A continuación se observa la gráfica de los datos mensuales del número de Pasajeros de Aerolíneas Internacionales (PAI), para el período enero 1949 a diciembre 1960, 144 datos. 700 Pasajeros Aerolíneas Internacionales 600 500 400 300 200 100 0 49 50 51 52 53 54 55 56 57 58 59 60 SER01 La gráfica muestra que los datos tienen una tendencia creciente y un marcado patrón estacional. Además, a medida que el nivel medio de la serie aumenta, también se incrementa la magnitud de la variación estacional. En el lenguaje de los modelos ARIMA, esto indica que podría ser adecuado ajustar a los datos un modelo estacional multiplicativo.
  2. 2. 2 Transformación de los datos En algunos casos, la gráfica de los datos sugiere considerar una transformación de los mismos, por ejemplo tomar los logaritmos o la raíz cuadrada Si hay tendencia en los datos y la varianza se incrementa con la media resulta aconsejable transformar los datos. En la serie que se estudia, Box y Jenkins decidieron tomar el logaritmo de la serie. Al observar que la desviación estándar de los datos es directamente proporcional a la media, la transformación logarítmica sería adecuada. 6.5 6.0 5.5 5.0 4.5 49 50 51 52 53 54 55 56 57 58 59 60 LPAI Cuando la serie tiene tendencia y la magnitud del efecto estacional se incrementa con la media, puede ser aconsejable transformar los datos para que el efecto estacional sea constante en el tiempo. De esta forma, en la serie transformada el efecto estacional se dice que es aditivo mientras que en los datos originales era multiplicativo. Esta transformación solamente estabilizará la varianza, si el término de error de la serie también crece cuando aumenta la media. Esta última circunstancia también tiene que ser considerada antes de la transformación de los datos. La gráfica que antecede, describe la serie transformada, elaborada con los logaritmos de la variable original, logaritmo del número de Pasajeros Aerolíneas Internacionales, LPAI. El argumento dado por Box y Jenkins para tomar el logaritmo de los datos originales, fue que “los logaritmos son tomados para analizar datos de ventas, porque es el porcentaje de variación el que sería comparable a diferentes volúmenes de ventas”.
  3. 3. 3 Identificación del modelo Luego de transformados los datos y observada la gráfica de los datos transformados, examinamos el correlograma de los mismos. Correlograma de los datos transformados LPAI Sample: 1949:01 1960:12 Included observations: 144 Autocorrelation Partial Correlación AC PAC Q-Stat Prob .|*******| .|*******| 1 0.954 0.954 133.72 0.000 .|*******| *|. | 2 0.899 -0.118 253.36 0.000 .|*******| .|. | 3 0.851 0.054 361.29 0.000 .|****** | .|. | 4 0.808 0.024 459.44 0.000 .|****** | .|* | 5 0.779 0.116 551.20 0.000 .|****** | .|. | 6 0.756 0.044 638.37 0.000 .|****** | .|. | 7 0.738 0.038 721.86 0.000 .|****** | .|* | 8 0.727 0.100 803.60 0.000 .|****** | .|** | 9 0.734 0.204 887.42 0.000 .|****** | .|. | 10 0.744 0.064 974.33 0.000 .|****** | .|* | 11 0.758 0.106 1065.2 0.000 .|****** | .|. | 12 0.762 -0.042 1157.6 0.000 .|****** | ****|. | 13 0.717 -0.485 1240.0 0.000 .|***** | .|. | 14 0.663 -0.034 1311.1 0.000 .|***** | .|. | 15 0.618 0.042 1373.4 0.000 .|**** | .|. | 16 0.576 -0.044 1428.0 0.000 .|**** | .|. | 17 0.544 0.028 1476.9 0.000 .|**** | .|. | 18 0.519 0.037 1521.9 0.000 .|**** | .|. | 19 0.501 0.042 1564.1 0.000 .|**** | .|. | 20 0.490 0.014 1604.9 0.000 .|**** | .|* | 21 0.498 0.073 1647.3 0.000 .|**** | .|. | 22 0.506 -0.033 1691.5 0.000 .|**** | .|. | 23 0.517 0.061 1737.9 0.000 .|**** | .|. | 24 0.520 0.031 1785.3 0.000 .|**** | **|. | 25 0.484 -0.194 1826.6 0.000 .|*** | .|. | 26 0.437 -0.035 1860.7 0.000 .|*** | .|. | 27 0.400 0.036 1889.5 0.000 .|*** | .|. | 28 0.364 -0.035 1913.5 0.000 .|*** | .|. | 29 0.337 0.044 1934.3 0.000 .|** | .|. | 30 0.315 -0.045 1952.6 0.000 .|** | .|. | 31 0.297 -0.003 1969.0 0.000 .|** | .|. | 32 0.289 0.034 1984.6 0.000 .|** | .|. | 33 0.295 -0.020 2001.1 0.000 .|** | .|. | 34 0.305 0.028 2018.8 0.000 .|** | .|. | 35 0.315 0.029 2038.0 0.000 .|** | .|. | 36 0.319 -0.004 2057.8 0.000
  4. 4. 4 En primer lugar observemos que los 36 primeros coeficientes de autocorrelación son positivos, como consecuencia de la tendencia que tienen los datos. Es necesario diferenciar la serie. Veamos nuevamente el correlograma de la serie diferenciada una vez, Δ LPAIt. = LPAIt - LPAIt-1 En la terminología de los modelos ARIMA, d = 1. Correlograma de la primera diferencia de LPAI, o sea Δ LPAIt Sample: 1949:02 1960:12 Included observations: 143 Autocorrelation Partial Correlation AC PAC Q-Stat Prob .|** | .|** | 1 0.303 0.303 13.393 0.000 *|. | **|. | 2 -0.102 -0.213 14.928 0.001 **|. | *|. | 3 -0.241 -0.160 23.549 0.000 **|. | **|. | 4 -0.300 -0.222 37.011 0.000 *|. | .|. | 5 -0.094 0.010 38.341 0.000 *|. | **|. | 6 -0.078 -0.191 39.272 0.000 *|. | *|. | 7 -0.092 -0.154 40.573 0.000 **|. | ****|. | 8 -0.295 -0.455 53.921 0.000 **|. | **|. | 9 -0.192 -0.234 59.612 0.000 *|. | ****|. | 10 -0.105 -0.547 61.328 0.000 .|** | *|. | 11 0.283 -0.130 73.903 0.000 .|****** | .|**** | 12 0.829 0.571 182.73 0.000 .|** | *|. | 13 0.285 -0.149 195.64 0.000 *|. | *|. | 14 -0.106 -0.172 197.44 0.000 **|. | .|* | 15 -0.222 0.067 205.43 0.000 **|. | .|. | 16 -0.231 0.062 214.15 0.000 *|. | .|. | 17 -0.062 0.008 214.78 0.000 *|. | *|. | 18 -0.066 -0.080 215.51 0.000 *|. | .|. | 19 -0.090 0.037 216.88 0.000 **|. | *|. | 20 -0.297 -0.095 231.76 0.000 *|. | .|. | 21 -0.163 -0.005 236.26 0.000 *|. | .|. | 22 -0.083 -0.008 237.44 0.000 .|** | .|. | 23 0.256 -0.039 248.72 0.000 .|***** | .|. | 24 0.701 -0.042 334.36 0.000 .|** | .|. | 25 0.257 -0.025 345.97 0.000 *|. | .|. | 26 -0.098 -0.035 347.68 0.000 **|. | .|. | 27 -0.196 0.016 354.55 0.000 *|. | *|. | 28 -0.174 -0.065 360.01 0.000 *|. | *|. | 29 -0.069 -0.126 360.88 0.000 .|. | .|. | 30 -0.042 0.007 361.20 0.000 *|. | .|. | 31 -0.078 0.026 362.32 0.000 **|. | .|* | 32 -0.247 0.067 373.70 0.000 *|. | *|. | 33 -0.157 -0.132 378.34 0.000 .|. | .|* | 34 -0.047 0.086 378.76 0.000 .|* | *|. | 35 0.195 -0.116 386.10 0.000 .|**** | .|. | 36 0.580 -0.010 451.19 0.000
  5. 5. 5 Con 144 observaciones en la serie ΔLPAI, una regla útil para decidir si un coeficiente de autocorrelación es significativamente diferente de cero es ver si su valor excede 2/√T. Aquí el valor crítico es 0.17 y encontramos coeficientes de autocorrelación significativos para los rezagos 1, 3, 4, 8, 9, 11, 12, 13, 15, 16, 20, 23, 24, 25, 27, 28, 32, 35 y 36. No hay signos de que la función de autocorrelación disminuya, por tanto se necesita otra diferenciación para obtener una serie estacionaria. Dado que los datos son mensuales y presentan una marcada estacionalidad se realiza la diferenciación de orden 12 de la primera diferencia de LPAI. Correlograma de la diferencia 12 de ΔLPAI, ΔΔ12 LPAIt Sample: 1949:02 1960:12 Included observations: 131 Autocorrelation Partial Correlation AC PAC Q-Stat Prob ***|. | ***|. | 1 -0.341 -0.341 15.596 0.000 .|* | .|. | 2 0.105 -0.013 17.086 0.000 **|. | **|. | 3 -0.202 -0.193 22.648 0.000 .|. | *|. | 4 0.021 -0.125 22.710 0.000 .|. | .|. | 5 0.056 0.033 23.139 0.000 .|. | .|. | 6 0.031 0.035 23.271 0.001 .|. | *|. | 7 -0.056 -0.060 23.705 0.001 .|. | .|. | 8 -0.001 -0.020 23.705 0.003 .|* | .|** | 9 0.176 0.226 28.147 0.001 *|. | .|. | 10 -0.076 0.043 28.987 0.001 .|. | .|. | 11 0.064 0.047 29.589 0.002 ***|. | ***|. | 12 -0.387 -0.339 51.473 0.000 .|* | *|. | 13 0.152 -0.109 54.866 0.000 *|. | *|. | 14 -0.058 -0.077 55.361 0.000 .|* | .|. | 15 0.150 -0.022 58.720 0.000 *|. | *|. | 16 -0.139 -0.140 61.645 0.000 .|* | .|. | 17 0.070 0.026 62.404 0.000 .|. | .|* | 18 0.016 0.115 62.442 0.000 .|. | .|. | 19 -0.011 -0.013 62.460 0.000 *|. | *|. | 20 -0.117 -0.167 64.598 0.000 .|. | .|* | 21 0.039 0.132 64.834 0.000 *|. | *|. | 22 -0.091 -0.072 66.168 0.000 .|** | .|* | 23 0.223 0.143 74.210 0.000 .|. | *|. | 24 -0.018 -0.067 74.265 0.000 *|. | *|. | 25 -0.100 -0.103 75.918 0.000 .|. | .|. | 26 0.049 -0.010 76.310 0.000 .|. | .|. | 27 -0.030 0.044 76.463 0.000 .|. | *|. | 28 0.047 -0.090 76.839 0.000 .|. | .|. | 29 -0.018 0.047 76.894 0.000 .|. | .|. | 30 -0.051 -0.005 77.344 0.000 .|. | *|. | 31 -0.054 -0.096 77.848 0.000 .|* | .|. | 32 0.196 -0.015 84.590 0.000 *|. | .|. | 33 -0.122 0.012 87.254 0.000 .|* | .|. | 34 0.078 -0.019 88.340 0.000 *|. | .|. | 35 -0.152 0.023 92.558 0.000 .|. | *|. | 36 -0.010 -0.165 92.577 0.000
  6. 6. 6 Examinando el correlograma y teniendo en cuenta que el valor crítico de los coeficientes de autocorrelación es también aproximadamente 0.17, encontramos valores significativos en los rezagos 1, 3, 9, 12 y 23, siendo el resto de los valores los suficientemente pequeños, para concluir que no hay signos de no estacionariedad. El valor significativo en el rezago 9 se puede considerar extraño y se ignora a menos que exista información externa indicando que debe considerarse. Ahora estamos en condiciones de identificar el modelo a ajustar a los datos. Previamente introducimos la notación habitual para el modelo general ARIMA con estacionalidad multiplicativa, el modelo llamado SARIMA. φp (L) ΦP (L) Wt = θq (L) ΘQ (Ls) εt donde L representa al operador del polinomio de rezagos, φp ,ΦP ,θq , ΘQ son polinomios de orden p,P, q,Q respectivamente, εt es un proceso puramente aleatorio y Wt es la variable Δd ΔD Yt. Examinamos en el último correlograma presentado los valores de la función de autocorrelación en los rezagos 12, 24, 36, comenzando con la parte estacional del modelo, para elegir los valores de P y Q, es decir el orden del polinomio de rezagos de la parte autorregresiva y el orden del polinomio de la parte de medias móviles El valor para el rezago 12 es grande, pero para los restantes resulta no significativo. Esta comprobación indicaría que no tiene términos autorregresivos, pero si de medias móviles en la parte estacional. Por este motivo se hace Q = 1 y P = 0. Los valores p y q de la parte no estacional son establecidos luego de examinar los primeros valores de la función de autocorrelación. Son valores significativos los correspondientes a 1 y 3 rezagos. Comenzamos probando con un término de medias móviles haciendo p = 0 y q = 1. Estimación Luego de identificado el modelo a ajustar, que en este caso es un modelo ARIMA estacional con p = 0, q = 1, P = 0 y Q = 1, es decir ( 0, 1, 1) ( 0, 1, 1 )12 se procede a estimar los parámetros del modelo. En la tabla siguiente se presenta la estimación del modelo realizada utilizando el EVIEWS.
  7. 7. 7 El resultado es: ΔΔ12 LPAIt = ( 1 - 0.3765 L) ( 1 - 0.6242 L12 ) εt Sample: 1950:02 1960:12 Included observations: 131 Convergence achieved after 6 iterations Backcast: 1949:01 1950:01 Variable Coefficient Std. Error t-Statistic Prob. C -0.000215 0.000909 -0.236397 0.8135 MA(1) -0.376502 0.080696 -4.665673 0.0000 MA(12) -0.624213 0.070534 -8.849842 0.0000 R-squared 0.364299 Mean dependent var 0.000291 Adjusted R-squared 0.354366 S.D. dependent var 0.045848 S.E. of regression 0.036840 Akaike info criterion -3.741845 Sum squared resid 0.173717 Schwarz criterion -3.676001 Log likelihood 248.0909 F-statistic 36.67621 Durbin-Watson stat 1.960799 Prob(F-statistic) 0.000000 (** Esta especificación del modelo difiere de la elegida en Práctico 9 Ejercicio 4 (2009). En este último no se incluyó término constante en el modelo). Luego de la estimación del modelo se procede a examinar si el modelo ajustado proporciona una adecuada descripción de los datos. Para esto, como es usual se estudian los residuos del modelo. Tenemos un buen modelo cuando los residuos son aleatorios y próximos a cero. En la gráfica siguiente en la parte superior se presentan el valor ajustado y las observaciones superpuestos y en la parte inferior los residuos del ajuste. La gráfica de los residuos parece indicar que estamos frente a un proceso puramente aleatorio. Examinamos el correlograma de los residuos para confirmar esta afirmación. 0.2 0.1 0.0 -0.1 0.10 -0.2 0.05 0.00 -0.05 -0.10 -0.15 51 52 53 54 55 56 57 58 59 60 Residual Actual Fitted
  8. 8. 8 Correlograma de los residuos del modelo ajustado Sample: 1950:02 1960:12 Included observations: 131 Q-statistic probabilities adjusted for 2 ARMA term(s) Autocorrelation Partial Correlation AC PAC Q-Stat Prob .|. | .|. | 1 0.014 0.014 0.0249 .|. | .|. | 2 0.010 0.009 0.0374 *|. | *|. | 3 -0.125 -0.125 2.1526 0.142 *|. | *|. | 4 -0.141 -0.139 4.8620 0.088 .|. | .|. | 5 0.059 0.065 5.3360 0.149 .|* | .|. | 6 0.069 0.059 6.0042 0.199 *|. | *|. | 7 -0.073 -0.115 6.7536 0.240 .|. | .|. | 8 -0.042 -0.051 6.9986 0.321 .|* | .|* | 9 0.104 0.153 8.5568 0.286 *|. | *|. | 10 -0.080 -0.095 9.4835 0.303 .|. | .|. | 11 0.045 -0.012 9.7818 0.368 .|. | .|. | 12 -0.008 0.031 9.7914 0.459 .|. | .|* | 13 0.042 0.083 10.057 0.525 .|. | .|. | 14 0.031 -0.019 10.199 0.598 .|. | .|. | 15 0.050 0.041 10.568 0.647 *|. | *|. | 16 -0.150 -0.111 13.992 0.450 .|. | .|. | 17 0.028 0.047 14.110 0.517 .|. | .|. | 18 0.008 0.004 14.119 0.590 *|. | *|. | 19 -0.105 -0.129 15.835 0.536 *|. | *|. | 20 -0.109 -0.167 17.689 0.476 .|. | .|. | 21 -0.029 0.036 17.822 0.534 .|. | .|. | 22 -0.030 -0.043 17.963 0.590 .|** | .|* | 23 0.229 0.152 26.454 0.190 .|. | .|. | 24 0.037 -0.017 26.682 0.224 .|. | .|. | 25 -0.017 0.049 26.732 0.268 .|. | .|* | 26 0.060 0.072 27.329 0.289 .|. | .|. | 27 -0.043 0.006 27.645 0.324 .|. | *|. | 28 -0.053 -0.097 28.121 0.353 .|. | .|. | 29 -0.054 -0.036 28.626 0.379 *|. | .|. | 30 -0.073 -0.047 29.553 0.385 .|. | .|. | 31 -0.051 -0.041 30.000 0.414 .|* | .|. | 32 0.116 0.018 32.366 0.351 *|. | *|. | 33 -0.126 -0.094 35.200 0.276 .|. | .|. | 34 -0.001 -0.008 35.200 0.319 .|. | *|. | 35 -0.050 -0.059 35.645 0.345 .|. | *|. | 36 -0.016 -0.068 35.691 0.389 Al mirar el valor de los coeficientes de autocorrelacion para 1, 2 y 12 vemos que no son significativamente distintos de cero. Si lo fueran habría que modificar el modelo para tener en cuenta esos valores significativos.
  9. 9. 9 PREDICCIÓN Dado el último dato observado PAI60:12 del proceso SARIMA (0, 1, 1) (0, 1, 1)12 se desea estimar la variable para el período 1961/1 a 1961/12.Veamos en detalle como hacerlo. La variable modelada fue ΔΔ12 LPAIt, la predicción para el período t+1, es decir 61/1, de esta variable es 0.010814. La variable ΔΔ12 LPAIt se nombra Wt y se escribe la relación entre esa variable y las originales PAI: Wt = ΔΔ12 LPAIt = ( 1 – L ) ( 1 - L12 ) LPAIt = LPAIt - LPAIt-1 - LPAIt-12 + LPAIt-13 == ( 1 - 0.3765 L) ( 1 - 0.6242 L12 ) εt Por tanto, el proceso LPAI se obtiene sumando, o lo que es lo mismo integrando el proceso W. Tengamos en cuenta que partimos de una serie no estacionaria PAI, que fue diferenciada para alcanzar un proceso estacionario, sin tendencia y sin estacionalidad. Por tanto el modelo integrado es aquel obtenido por suma o integración de un proceso estacionario, luego de remover la tendencia y estacionalidad de la serie. El valor de LPAI61/1 es 6,1084 siendo el antilogaritmo 450. De esta forma se obtiene la predicción de la serie original el número de pasajeros aerolíneas internacionales, PAI para enero de 1961 y operando en forma similar se completa la predicción hasta diciembre de1961. 0.15 0.10 0.05 0.00 -0.05 -0.10 -0.15 50 51 52 53 54 55 56 57 58 59 60 61 D1D12LPAI D1D12LPAIF
  10. 10. 10 El gráfico anterior contiene la predicción de la variable, Wt, para el período 1949/1 a 1961/12 (línea punteada) y las observaciones disponibles del período 1949/1 a 1960/12. Conclusiones La serie estudiada, tiene tendencia y estacionalidad muy marcadas, y el modelo estacionario resultante después de removidas ambas, es decir luego de la diferenciación conveniente de los datos, es un modelo de medias móviles, tanto en la componente estacional como en la no estacional. Luego de realizar éste ejercicio, cabe preguntarse si no hubiera sido más razonable utilizar el método de alisamiento exponencial, examinado en la primera parte del curso, para modelar la tendencia y estacionalidad de esta serie, y realizar una predicción de corto plazo. Utilizando el EVIEWS 3, aplicando la técnica de alisamiento exponencial, a la misma serie (PAI) le ajustamos un modelo de tendencia lineal con estacionalidad multiplicativa, para realizar una predicción mensual de enero de 1961 a diciembre de 1961, de la misma forma que lo hicimos con la aproximación ARIMA. Aplicamos el método de Holt – Winters multiplicativo, método apropiado para la predicción cuando la serie tiene una tendencia lineal y una variación estacional multiplicativa. A continuación se presenta la gráfica con los valores observados y la predicción de la serie LPAI. 7.0 6.5 6.0 5.5 5.0 4.5 50 51 52 53 54 55 56 57 58 59 60 61 LPAISM LPAI El valor de LPAI61/1 es 6,109579 siendo el antilogaritmo 450. Por tanto el resultado de la predicción es idéntico al obtenido con el modelo SARIMA.
  11. 11. 11 Ejemplo 2 Para este segundo ejemplo de aplicación de las técnicas de modelización ARIMA se eligió una serie de datos mensuales, que presentan tendencia y estacionalidad. Se trata de la entrada mensual de leche a plantas de Conaprole, en millones de litros, desde enero de 1990 a julio de 1998. Problema Elaborar un modelo ARIMA estacional que sea útil para la predicción mensual del período agosto 1998 / diciembre 1998. Gráfica de los datos El examen gráfico de la serie mensual de “Entrada de leche a plantas de Conaprole” (de aquí en más LECHE), es el primer paso para atender las características que presenta la serie, considerar si tiene tendencia, es decir si es no estacionaria en media, que ocurre con la varianza y tener en cuenta la estacionalidad de la misma. 90000 80000 70000 60000 50000 40000 30000 90 91 92 93 94 95 96 97 98 LECHE Se observa que la serie LECHE tiene tendencia y estacionalidad, contiene un componente periódico que se repite cada doce observaciones, s = 12. En este caso, se espera que la leche entrada en plantas de Conaprole en el mes de setiembre de 1998, dependa de la entrada de setiembre de 1997 y posiblemente de la entrada de 1996. A diferencia con el Ejemplo 1, serie PAI, en éste caso, no se observa que la varianza se incremente con la media. Cuando se examinó la serie PAI, para remover ese efecto se realizó la transformación logarítmica de los datos. No se considera necesario en este caso.
  12. 12. 12 Identificación del modelo En primer lugar observemos el correlograma de los datos Leche Autocorrelation Partial Correlation AC PAC Q-Stat Prob . |****** | . |****** | 1 0.835 0.835 73.997 0.000 . |**** | ****| . | 2 0.525 -0.572 103.51 0.000 . |*. | **| . | 3 0.164 -0.235 106.41 0.000 .*| . | .|. | 4 -0.129 0.065 108.23 0.000 **| . | .|. | 5 -0.291 0.065 117.61 0.000 ***| . | **| . | 6 -0.357 -0.204 131.83 0.000 **| . | . |** | 7 -0.295 0.221 141.66 0.000 .*| . | . |*. | 8 -0.145 0.135 144.06 0.000 . |*. | . |*** | 9 0.120 0.443 145.71 0.000 . |*** | . |** | 10 0.435 0.301 167.73 0.000 . |***** | . |*. | 11 0.681 0.077 222.31 0.000 . |****** | .|. | 12 0.779 0.015 294.46 0.000 . |***** | **| . | 13 0.638 -0.305 343.34 0.000 . |*** | . |*. | 14 0.381 0.159 360.95 0.000 . |*. | .*| . | 15 0.068 -0.129 361.51 0.000 .*| . | . |*. | 16 -0.175 0.131 365.32 0.000 **| . | .|. | 17 -0.302 0.027 376.78 0.000 ***| . | .|. | 18 -0.344 -0.037 391.82 0.000 **| . | .|. | 19 -0.274 -0.012 401.49 0.000 .*| . | .|. | 20 -0.133 -0.029 403.81 0.000 . |*. | .|. | 21 0.096 -0.027 405.02 0.000 . |*** | .|. | 22 0.355 0.052 421.89 0.000 . |**** | .|. | 23 0.548 -0.020 462.45 0.000 . |***** | .|. | 24 0.615 0.034 514.17 0.000 . |**** | **| . | 25 0.472 -0.215 545.06 0.000 . |** | .|. | 26 0.225 -0.021 552.15 0.000 .|. | . |*. | 27 -0.045 0.115 552.44 0.000 **| . | .|. | 28 -0.240 -0.026 560.77 0.000 ***| . | .*| . | 29 -0.335 -0.079 577.13 0.000 ***| . | . |*. | 30 -0.342 0.084 594.50 0.000 **| . | .|. | 31 -0.257 -0.015 604.39 0.000 .*| . | .*| . | 32 -0.131 -0.152 607.01 0.000 .|. | .|. | 33 0.055 -0.051 607.48 0.000 . |** | .|. | 34 0.258 0.014 617.87 0.000 . |*** | .|. | 35 0.396 -0.040 642.87 0.000 . |*** | . |*. | 36 0.433 0.070 673.15 0.000 Los coeficientes de los 36 primeros coeficientes de autocorrelación son todos significativos. En éste resultado está influyendo la tendencia de la serie y su marcada estacionalidad. Por tanto, diferenciamos la serie para eliminar a ambas, una diferencia de orden 1 y otra de orden 12: ( 1 - L )( 1 - L12 )
  13. 13. 13 Correlograma de la serie ΔΔ12 Leche Included observations: 90 Autocorrelation Partial Correlation AC PAC Q-Stat Prob .|. | .|. | 1 -0.016 -0.016 0.0230 0.879 ****| . | ****| . | 2 -0.460 -0.460 19.896 0.000 .|. | .*| . | 3 -0.039 -0.071 20.038 0.000 .|. | **| . | 4 0.017 -0.253 20.065 0.000 .|. | .|. | 5 0.057 -0.010 20.383 0.001 . |*. | .|. | 6 0.075 -0.043 20.937 0.002 .|. | .|. | 7 -0.048 -0.034 21.170 0.004 .*| . | .*| . | 8 -0.082 -0.073 21.854 0.005 .|. | .*| . | 9 -0.055 -0.120 22.167 0.008 . |** | . |*. | 10 0.198 0.171 26.212 0.003 . |*. | . |*. | 11 0.140 0.091 28.265 0.003 ****| . | ***| . | 12 -0.485 -0.440 53.237 0.000 .*| . | .|. | 13 -0.093 -0.031 54.172 0.000 . |*** | .|. | 14 0.368 -0.014 68.962 0.000 .|. | .|. | 15 0.053 -0.022 69.273 0.000 .*| . | .|. | 16 -0.083 -0.051 70.040 0.000 . |*. | . |** | 17 0.105 0.230 71.297 0.000 .*| . | .*| . | 18 -0.147 -0.127 73.770 0.000 .*| . | .*| . | 19 -0.141 -0.069 76.092 0.000 .|. | **| . | 20 0.034 -0.216 76.228 0.000 .|. | .*| . | 21 0.054 -0.155 76.575 0.000 . |*. | .|. | 22 0.068 0.048 77.141 0.000 .|. | . |*. | 23 -0.021 0.077 77.195 0.000 .|. | .*| . | 24 0.047 -0.135 77.470 0.000 . |*. | . |*. | 25 0.073 0.082 78.149 0.000 .*| . | .|. | 26 -0.162 -0.014 81.563 0.000 .*| . | .*| . | 27 -0.112 -0.170 83.204 0.000 . |** | .|. | 28 0.198 0.040 88.427 0.000 .*| . | .|. | 29 -0.072 -0.034 89.135 0.000 .|. | .|. | 30 -0.013 -0.025 89.157 0.000 . |*. | .*| . | 31 0.115 -0.093 91.020 0.000 .|. | .|. | 32 0.016 0.056 91.056 0.000 .|. | .|. | 33 0.006 0.042 91.061 0.000 .*| . | .|. | 34 -0.104 -0.010 92.651 0.000 .*| . | .|. | 35 -0.092 0.019 93.924 0.000 .|. | .*| . | 36 0.049 -0.099 94.299 0.000 El valor crítico para los coeficientes de autocorrelación es 0.21 y encontramos valores significativos para estos coeficiente en los rezagos 2, 12, y 14, siendo el resto de los mismos lo suficientemente pequeños para concluir que no hay signos de no estacionariedad. Si ΔΔ12 Leche es una serie estacionaria, estamos en condiciones de identificar el modelo ARMA que se ajusta mejor a los datos.
  14. 14. 14 A partir del correlograma de la serie ΔΔ12 Leche se identifica el siguiente modelo: SARIMA (0,1,2)(0,1,12)12. Estimación Utilizando el software EVIEWS 3.0 se estiman los parámetros del modelo. El resultado es: ΔΔ12 Lechet = (1 + 0.039L - 0.506L2 ) ( 1 - 0.658L12 ) εt La tabla que sigue contiene el resultado detallado de la estimación. Sample(adjusted): 1991:02 1998:07 Included observations: 90 after adjusting endpoints Convergence achieved after 11 iterations Backcast: 1989:12 1991:01 Variable Coefficient Std. Error t-Statistic Prob. MA(1) 0.038573 0.091660 0.420824 0.6749 MA(2) -0.506095 0.076612 -6.605953 0.0000 SMA(12) -0.658028 0.067051 -9.813843 0.0000 R-squared 0.537982 Mean dependent var 29.78644 Adjusted R-squared 0.527361 S.D. dependent var 3880.582 S.E. of regression 2667.851 Akaike info criterion 18.64870 Sum squared resid 6.19E+08 Schwarz criterion 18.73203 Log likelihood -836.1915 F-statistic 50.65220 Durbin-Watson stat 1.908953 Prob(F-statistic) 0.000000 Respecto de los coeficientes estimados del modelo, cabe señalar que el coeficiente del MA(1) no es significativo, en cambio tanto el del MA(2) como el del SMA(12), correspondiente a la componente estacional, son altamente significativos. En la parte inferior de la tabla se presentan un conjunto de estadísticos, entre los cuales Akaike Information Criterion (AIC), es de utilidad para considerar la bondad del ajuste en el caso de que en la etapa de identificación se especifiquen varios modelos alternativos. El criterio de AKAIKE consiste en seleccionar aquel modelo para el que se obtiene el estadístico AIC más bajo. En el caso a estudiado el modelo seleccionado, fue el que tuvo el mínimo AIC, entre las especificaciones probadas. Luego del examen de los estadísticos anteriores preparamos el correlograma de los residuos del modelo ajustado. Si el modelo especificado es correcto, los residuos, es decir la diferencia entre los valores observados y los estimados, tienen que tener un comportamiento similar a un ruido blanco. Los coeficientes de autocorrelación y autocorrelación parcial estimados que se presentan en ese correlograma , no deben ser significativamente distintos de cero.
  15. 15. 15 Sample: 1991:02 1998:07 Included observations: 90 Q-statistic probabilities adjusted for 3 ARMA term(s) Autocorrelation Partial Correlation AC PAC Q-Stat Prob .|. | .|. | 1 0.028 0.028 0.0729 .|. | .|. | 2 -0.026 -0.026 0.1341 .|. | .|. | 3 -0.044 -0.043 0.3198 .*| . | .*| . | 4 -0.133 -0.132 2.0232 0.155 .|. | .|. | 5 -0.037 -0.034 2.1584 0.340 .|. | .|. | 6 -0.011 -0.019 2.1705 0.538 .*| . | .*| . | 7 -0.146 -0.162 4.2902 0.368 .*| . | **| . | 8 -0.167 -0.193 7.1222 0.212 .|. | .|. | 9 -0.017 -0.043 7.1529 0.307 .|. | .|. | 10 0.012 -0.028 7.1673 0.412 . |*. | . |*. | 11 0.183 0.124 10.678 0.221 .*| . | .*| . | 12 -0.064 -0.143 11.110 0.268 .|. | .|. | 13 0.016 -0.004 11.138 0.347 . |** | . |** | 14 0.253 0.259 18.129 0.079 . |*. | . |*. | 15 0.076 0.074 18.761 0.094 .|. | .*| . | 16 -0.032 -0.085 18.876 0.127 .|. | .|. | 17 0.008 0.033 18.884 0.169 **| . | .*| . | 18 -0.230 -0.118 24.955 0.051 .*| . | .*| . | 19 -0.129 -0.073 26.900 0.043 .|. | .*| . | 20 -0.044 -0.107 27.132 0.056 .|. | .|. | 21 -0.041 -0.020 27.333 0.073 .|. | .|. | 22 0.015 0.042 27.361 0.097 .|. | .|. | 23 0.034 0.046 27.501 0.122 . |*. | .|. | 24 0.077 0.032 28.249 0.133 .|. | .*| . | 25 0.063 -0.059 28.751 0.152 . |*. | .|. | 26 0.066 0.037 29.317 0.170 .*| . | .*| . | 27 -0.132 -0.173 31.594 0.137 . |*. | . |*. | 28 0.190 0.119 36.396 0.066 .*| . | .*| . | 29 -0.089 -0.089 37.467 0.068 .|. | .|. | 30 -0.014 0.017 37.495 0.086 .|. | . |*. | 31 0.050 0.070 37.852 0.101 .*| . | .|. | 32 -0.114 0.006 39.712 0.089 .|. | . |*. | 33 0.046 0.151 40.024 0.104 .*| . | .*| . | 34 -0.076 -0.110 40.887 0.110 .*| . | .*| . | 35 -0.129 -0.171 43.394 0.086 .|. | .|. | 36 -0.025 -0.037 43.486 0.105
  16. 16. 16 10000 5000 0 10000 -5000 5000 -10000 0 -5000 -10000 92 93 94 95 96 97 98 Residual Actual Fitted La gráfica de los residuos también estaría indicando que estamos frente a una serie de ruido blanco. Predicción La predicción realizada con el modelo SARIMA (0,1,2)(0,1,1)12 para 1998/8 de leche entrada a plantas de Conaprole es de 65004 millones de litros. Se recuerda que el último dato observado para el estudio, fue 1998/7. La predicción realizada por el método de Alisamiento Exponencial (Holt Winters multiplicativo), para igual mes es de 65793 millones de litros. El gráfico siguiente presenta con línea punteada la variable Leche estudiada y con línea llena el resultado del alisamiento exponencial, incluido la predicción hasta 1998/12. 100000 80000 60000 40000 20000 90 91 92 93 94 95 96 97 98 LECHESM LECHE

×