Tema 25: ANÁLISIS DE SERIES TEMPORALES

1. El Análisis de series temporales es el estudio estadístico de muestras de variables recogidas secuencialmente a lo largo del tiempo.

2. Obviamente el material básico de este Análisis es un serie temporal. Una posible muestra de una serie temporal podría ser la siguiente:

IMG_5269

3. Un concepto básico a tener en cuenta al introducirse en el Análisis de series temporales es que se trata de muestras con valores dependientes, no independientes. Generalmente cuando tenemos una muestra tenemos n valores independientes obtenidos en una población. Ahora no sucede esto. Ahora tenemos un tipo de muestra distinto. Tenemos una muestra donde cada valor sucesivo depende de valores anteriores. Este es un elemento distintivo que estará presente evidentemente en todo nuestro recorrido por este tipo de técnicas estadíticas.

4. Como sucede con toda muestra los objetivos básicos serán, en primer lugar, describir lo que tenemos y, en segundo lugar, hacer inferencias; o sea, ir más allá de la muestra concreta que tenemos, de la serie temporal, para hacer predicciones. También, en este ámbitos, se crean modelos matemáticos que dibujen esa relación de una variable con el tiempo. Relacionar esa serie temporal con otras y establecer, así, dependencias, influencias, etc, también será un objetivo del Análisis de series temporales.

5. Hay tres elementos básicos a tener en cuenta, en primer lugar, a la hora de abordar una serie temporal: la tendencia, la estacionariedad y la aleatoriedad. Podemos decir, de hecho, que el valor de variable a estudiar a lo largo del tiempo es una función de estos tres elementos. Escrito quedaría así:

IMG_5270

6. La variable X simboliza la variable que estamos estudiando a lo largo del tiempo (el valor de un activo en la Bolsa, el número de neumonías diagnosticadas en urgencias, el número de muertos en las carreteras, etc.), la T simboliza la tendencia, la E la estacionariedad y la A la aleatoriedad. Todas ellas se expresan con el subíndice t porque en series temporales todo es temporal. De hecho, el tiempo siempre ocupa el eje de las abscisas, como hemos visto antes.

7. La Tendencia mide si temporalmente los valores tienen una direccionalidad hacia arriba o hacia abajo. En definitiva, capta una pendiente general de los valores. Una pendiente que puede ser positiva, si es de subida, o negativa, si es de bajada.

8. La Estacionariedad mide la presencia de ciclos, de subidas y bajadas realizas con una determinada regularidad.

9. La Aleatoriedad mide desvíos respecto de estos dos elementos vistos anteriormente, pequeños alejamientos de la tendencia o de la estacionariedad que se atribuirán a elementos no controlados en el modelo, a elementos incluso idiosincráticos, propios del individuo o los individuos evaluados en aquel momento.

10. Veamos en el siguiente gráfico ocho situaciones posibles, ocho series temporales distintas, para ver qué significa cada uno de estos elementos:

IMG_5271

11. Supongo que se van viendo en cada una de estas series dibujadas el papel de cada uno de estos tres conceptos anunciados antes. Pero lo resumo a continuación:

En A: No hay ni T, ni E, ni A.

En B: Sólo hay T. No hay ni E ni A.

En C: Sólo hay E. No hay ni T ni A.

En D: Hay T y E. No parece haber A.

En E: Sólo hay A. No hay T ni parece haber E.

En F: Hay T y A. No parece haber E.

En G: Hay E y A. No hay T.

En H: Hay T, E y A.

12. La Tendencia de una serie se podrá evaluar mediante una Regresión lineal simple, a través del modelo: X=at+b, donde “a” es la pendiente de la recta y “b” la llamada “ordenada en el origen”. Ver el artículo dedicado a la Regresión lineal simple. Se trata, pues, de ver si, en su conjunto, entre los datos de la variable X estudiada y los valores temporales se podría ajustar una recta de regresión significativa. Evidentemente, esa Regresión lineal no nos servirá para crear una modelo general de la serie temporal pero sí para detectar y caracterizar una tendencia.

13. La Tendencia evidentemente no siempre será lineal. Por lo tanto, en ocasiones, hará falta adaptar una función no lineal para detectar una tendencia, por ejemplo, exponencial, logarítmica, etc.

14. La Estacionariedad se evalúa mediante el llamado Correlograma. El correlograma consiste en un cálculo de correlaciones entre la misma muestra pero con diferentes desfases temporales. Es un original método de captar estacionariedad. Por ejemplo, si en datos mensuales se detecta una importante correlación entre los valores de cada mes con los del año siguiente hablaremos de una estacionariedad anual o de cada 12 meses.

15. A partir de toda esta información se trata de ajustar un modelo matemático, a los datos muestrales que tengamos de una serie temporal. Existen distintos modelos. Me centraré en comentar brevemente cuatro tipos que son los más importantes: AR, MA, ARMA y ARIMA. Se trata de modelos que no son independientes. Son mecanos hechos de piezas que se van reuniendo para explicar situaciones progresivamente más complejas.

15. Modelos AR: Son modelos donde el valor de la variable X se puede poner en función de valores de la misma X pero anteriores en la serie. Escrito sería lo siguiente:

IMG_5443

16. Suele escribirse AR(p) para simbolizar el número de valores anteriores de la variable estudiada X que en la serie influyen a un momento temporal concreto. Observemos que estamos escribiento el valor de la variable X en un momento temporal t como función de los valores de los p valores temporales anteriores de X, ya dados, por lo tanto. Y también, como función de un valor que denominamos épsilon y que es el residuo, aquel elemento que no controlamos y que nos desvía el valor del valor esperado.

17. Modelos MA: Son modelos donde el valor de la variable X se puede poner en función no de valores anteriores de la variable X sino de los errores introducidos y descontrolados que se suelen simbolizar en estadística con el símbolo epsilon. Escrito sería así:

IMG_5444

18. Suele escribirse MA(q) para simbolizar el número de errores anteriores que en la serie influyen en el valor que tenemos de la variable X en un momento determinado. Observemos que ahora estamos escribiento el valor de la variable X en un momento temporal t como función de los valores de los p errores, o residuos, temporales anteriores, valores ya dados, por lo tanto. Y también, por supuesto, como función de un valor de error, de residuo, nuevo, el del nuevo tiempor t.

19. Modelos ARMA: Son modelos donde conviene juntar un modelo AR con un modelo MA. Escrito sería así:

IMG_5445

20. Suele escribirse ARMA(p, q) para simbolizar el número de valores anteriores de la variable X y el número de errores anteriores que en la serie influyen en el valor que tenemos de la variable X en una etapa temporal concreta. Observemos que es un híbrido de los dos modelos anteriores.

21. Modelos ARIMA: Son modelos no estacionarios, que tienen una tendencia y que conviene explicar esa tendencia. Son la fusión de un modelo ARMA con una modelización de la tendencia a través de un proceso de diferenciación. Escrito sería así:

IMG_5446

22. Suele escribirse ARIMA(p, d, q) para simbolizar el modelo ARMA(p, q) empleado y el grado de diferenciación empleado para volver estacionario un proceso que no lo es.

23. Observemos que estos modelos que he ido describiendo progresivamente iban incorporando a los anteriores. Por lo tanto, un modelo ARIMA reúne a todos los anteriores. Así, un ARIMA(1, 0, 0) es un AR(1) y un ARIMA(1, 0, 1) es un ARMA(1, 1), etc. Esta modelización ha quedado, pues, así, elegante desde el punto de vista matemático. Un signo de elegancia matemática es encontrar formas unificadas de integrar elementos que anteriormente estaban dispersos.

24. Actualmente los software estadísticos ante una muestra concreta proponen el modelo ARIMA(p, d, q) más ajustado a esos datos. Estima los parámetros y, por lo tanto, proporciona elementos para el pronóstico a corto y medio plazo.

25. Por lo tanto, ante una serie concreta nos podemos encontrar que el modelo que mejor se ajusta a esos datos es un ARIMA(1, 1, 1), por ejemplo.

26. Los software que incorporan un módulo de series temporales suelen tener la posibilidad de ajustar el mejor modelo de serie temporal ARIMA(p, d, q) a una muestra seriada.

27. Vamos a ver, a continuación, muy intuitivamente, ante una serie temporal qué características van asociadas con diferentes valores de p, d y q en el modelo ARIMA más ajustado.

28. La parte AR valora qué influencia tienen los estadios temporales anteriores en un momento temporal concreto. El valor de p del modelo indica el número de etapas temporales anteriores que influyen en el presente. Cuanto más grande sea el valor de p más etapas del pasado influyen en los valores del futuro.

29. La parte MA valora la influencia que tienen errores anteriores, residuos anteriores, en el valor presente. El valor de q indica cuántos errores anteriores influyen en el presente.

30. La parte I del modelo ARIMA, el valor d, indica de alguna forma la tendencia que hay en el modelo. Representa las veces que hace falta derivar para conseguir eliminar esa tendencia. Irá en función de la inclinación de la tendencia.

31. Un tema también interesante en series temporales es ver la conexión que pueda haber entre diferentes series. En definitiva, ver si una variable influye a otra pero con un desfase temporal. El procedimiento principal para detectar estadísticamente este tipo de relaciones es el llamado correlograma con retardos. Se trata de dijar una variable fija y la otra irla retardando etapa temporal a etapa temporal e ir calculando la correlación entre ambas series retardo a retardo. De esta forma vemos si hay alguna relación estadística significativa entre esas series y si la hay cuál es el retardo temporal en el que se produce.

Anuncios

Un pensamiento en “Tema 25: ANÁLISIS DE SERIES TEMPORALES

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s