Comprenda el análisis de tiempos de aprendizaje profundo en un artículo
Autor | Prakhar Ganesh
Compilado | An Ran
Recientemente, se publicó un artículo en "DataScience", utilizando métodos de aprendizaje profundo, a partir del procesamiento de datos, recurrentes. Las redes, LSTM en RNN, CNN-LSTM, etc. introducen el análisis de series de tiempo y explican el concepto de series de tiempo y por qué se eligen los métodos de aprendizaje profundo.
¿Qué es el análisis de series temporales?
Una serie de tiempo es una serie de puntos de datos, ordenados mediante marcas de tiempo, y es el análisis de datos de series de tiempo.
Desde el precio diario de la fruta hasta la lectura de la tensión de salida proporcionada por un circuito, el alcance de las series temporales es muy amplio y también lo es el campo del análisis de series temporales. El análisis de datos de series de tiempo generalmente se centra en la predicción, pero también puede incluir clasificación, agrupación, detección de anomalías, etc.
Por ejemplo, al estudiar los patrones de cambio de precios anteriores, puedes intentar predecir el precio de un reloj que alguna vez quisiste comprar y determinar el mejor momento para comprarlo.
¿Por qué elegir el aprendizaje profundo?
Los datos de series temporales pueden ser muy volátiles y complejos. Los métodos de aprendizaje profundo no asumen patrones subyacentes en los datos y son más resistentes al ruido (común en los datos de series temporales), lo que los convierte en el método preferido para el análisis de series temporales.
Procesamiento de datos
Antes de continuar con las predicciones, es importante procesar primero los datos en una forma que pueda ser entendida por el modelo matemático. Los datos de series de tiempo se pueden convertir en un problema de aprendizaje supervisado mediante el uso de ventanas deslizantes para recortar puntos de datos. El resultado esperado para cada ventana deslizante es el paso de tiempo después del final de la ventana.
Red recurrente
La red recurrente es una red compleja de aprendizaje profundo. Pueden recordar el pasado y, por tanto, son los preferidos para el procesamiento de secuencias. Las unidades RNN son la columna vertebral de las redes recurrentes.
La unidad RNN tiene 2 conexiones entrantes, entrada y estado anterior. Así mismo también cuentan con 2 conexiones de salida, salida y estado actual. Este estado les ayuda a combinar información de entrada pasada y actual.
Una unidad RNN simple es demasiado simple para usarse de manera uniforme para el análisis de series temporales en múltiples dominios. Por lo tanto, a lo largo de los años se han propuesto varias variaciones para adaptar las redes recurrentes a diversos campos, ¡pero la idea central sigue siendo la misma! ,
LSTM en RNN
Las celdas LSTM son celdas RNN especiales con "puertas" en ellas, que son esencialmente valores entre 0 y 1, correspondientes a la entrada de estado. La intuición detrás de estas puertas es olvidar o retener información del pasado, lo que les permite recordar algo más que el pasado.
CNN-LSTM
Dado que la información del estado pasa por cada paso, los RNN solo pueden recordar el pasado reciente.
Por otro lado, las redes cerradas como LSTM y GRU pueden manejar secuencias relativamente largas, ¡pero incluso estas redes tienen sus limitaciones! ! Para comprender mejor este problema, también se pueden estudiar los gradientes que desaparecen y explotan.
Entonces, ¿qué hacer con secuencias muy largas? ¡¡La solución más obvia es acortarlas!! ¿Pero cómo? Una forma es descartar la información temporal detallada presente en la señal.
Esto se puede hacer acumulando un pequeño conjunto de puntos de datos y creando funciones a partir de ellos, y luego pasando estas funciones al LSTM como si fueran puntos de datos individuales.
LSTM jerárquicos de múltiples escalas
Al observar la arquitectura CNN-LSTM, me vino a la mente una cosa... ¿Por qué usar CNN para fusionar esos grupos? ¿Por qué no usar diferentes? ¡LSTM! Los LSTM jerárquicos de múltiples escalas se construyen basándose en la misma idea.
La entrada se procesa en múltiples escalas, cada una dedicada a hacer algo único. Las escalas más bajas, adecuadas para entradas más detalladas, se centran en proporcionar información temporal detallada (pero solo reciente).
Las proporciones más altas, por otro lado, se centran en proporcionar una imagen completa (pero sin detalles detallados). Se pueden utilizar varios ticks juntos para comprender mejor la serie temporal.
¿Qué sigue?
El análisis de series temporales es un campo muy antiguo que abarca una variedad de problemas interdisciplinarios, cada uno de los cuales presenta sus propios desafíos.
Sin embargo, aunque cada campo ha adaptado modelos a sus propios requisitos, todavía hay algunas direcciones generales de investigación en el análisis de series temporales que necesitan mejorar.
Por ejemplo, cada desarrollo, desde la unidad RNN más básica hasta el LSTM jerárquico de múltiples escalas, se centra de alguna manera en el procesamiento de secuencias más largas, pero incluso las últimas modificaciones de LSTM tienen sus propias limitaciones en la longitud de las secuencias, y hay Todavía no hay una arquitectura que realmente pueda manejar secuencias extremadamente largas.