Red de conocimiento de divisas - Apertura de cuenta en divisas - Cómo utilizar máquinas de vectores de soporte para modelar series temporales

Cómo utilizar máquinas de vectores de soporte para modelar series temporales

La teoría SVM se desarrolla sobre la base de la teoría del aprendizaje estadístico. Dado que la teoría del aprendizaje estadístico y los métodos SVM estudian sistemáticamente algunas cuestiones básicas en el reconocimiento de patrones en muestras limitadas, han resuelto en gran medida los problemas de selección de modelos y sobreaprendizaje, no linealidad, desastre de dimensionalidad y mínimos locales en preguntas anteriores de aprendizaje automático, etc. Los pasos para usar SVM para la predicción de regresión son los siguientes:

1) La elección de la escala experimental determina el número de conjuntos de entrenamiento, el número de conjuntos de prueba y la proporción de los dos; parámetros de predicción; 3) Regresión Unificación de datos experimentales; 4) determinación de la función del núcleo; 5) determinación de los parámetros de la función del núcleo; Entre ellos, la selección de parámetros es crucial para el rendimiento de SVM. La función del kernel en este artículo utiliza la función del kernel RBF, y los parámetros SVM incluyen el parámetro de compromiso c, el ancho del kernel c y el parámetro de insensibilidad e de la función del kernel RBF. En la actualidad, la selección de parámetros del método SVM y la función del núcleo aún no ha formado un modelo unificado a nivel internacional. En otras palabras, la selección de parámetros óptima del algoritmo SVM solo se puede optimizar a través de la experiencia, la comparación experimental, la búsqueda a gran escala y el experimento cruzado. . En aplicaciones prácticas, por conveniencia, a menudo se establece subjetivamente un pequeño número positivo como el valor de e. Este artículo primero toma varios valores dentro de un cierto rango de C y C para el entrenamiento, determina el rango aproximado de cada valor de parámetro y luego utiliza el método de dejar uno fuera para seleccionar específicamente los valores de los parámetros.

Determinación del orden más alto del modelo SVM de series temporales de precios de acciones

Los datos del precio de las acciones son una serie temporal. Del análisis característico de las series temporales se desprende que los precios de las acciones tienen desfases y efectos secundarios. El precio de las acciones del día no sólo está relacionado con diversas características del día, sino también con los precios de las acciones y las características de los días anteriores. Por tanto, el precio de las acciones y las características de los días anteriores deben considerarse variables independientes. El principio básico para determinar el orden más alto es comenzar a modelar el sistema desde un orden inferior y luego aumentar gradualmente el orden del modelo y usar la prueba f para distinguir estos modelos, determinando así el orden más alto n, para obtener más reflejan objetivamente las características de desfase temporal de los precios de las acciones. Los pasos de operación específicos son los siguientes: Suponga que un modelo de regresión de múltiples entradas y salida única tiene n muestras, una variable dependiente (precio de las acciones), m-1 variables independientes (características) y utiliza recursivamente el modelo SVM para ajustarse al sistema. de orden inferior a orden superior (la extensión aquí es usar el precio de las acciones de ayer como una variable independiente y, al mismo tiempo, expandir las características), y usar el método de prueba f para determinar si el orden de dos modelos SVM adyacentes aumenta es apropiado [7]. Para dos modelos adyacentes SVM (n) y SVM (n+ 1), existe una estadística Fi = qsvr(n)-qsvr(n+1)qsvr(n)1n-Mn-(m-1). N(1) Fi< obedece a la distribución F con grados de libertad m y (N-m n-(m -1)) respectivamente, donde QSVR (n) y QSVR( n+1) son SVR( n+1) respectivamente. f (?, m, N-m n- (m-1)), el modelo SVM (n) es adecuado, de lo contrario, continúe expandiendo el orden.

Detección de características flotantes hacia adelante

Después de determinar el orden más alto del modelo anterior, aunque se determina el modelo SVM de enésimo orden, es decir, n características, algunas características son perjudiciales. a la precisión de la predicción del modelo. Este artículo utiliza un algoritmo de detección de características flotantes hacia adelante basado en SVM y un método uno a uno para seleccionar características que son beneficiosas para mejorar la precisión de la predicción. Sea B = {xj: j=1, 2,,,k} representa el conjunto de características, Am representa el subconjunto de características compuesto por m características en B, y las funciones de evaluación MSE (Am) y MSE (Ai) i =1, 2,,, todos los valores de m -1 son conocidos. El algoritmo de detección de características flotantes hacia adelante utilizado en este artículo es el siguiente [9]: 1) Suponga que m = 0, A0 y A0 son conjuntos vacíos y utilice el método de detección de características hacia adelante para encontrar dos características para formar un subconjunto de características Am ( m = 2); 2) Utilice el método de selección de características directas para seleccionar la característica xm +1 del subconjunto de características no seleccionadas (B -Am) para obtener el subconjunto Am+1 3) Si el número de iteraciones alcanza el valor preestablecido, salga; , de lo contrario ejecute 4);4) Seleccione la característica menos importante en el subconjunto de características Am+1. Si xm+1 es la característica menos importante, es decir, para cualquier Jxm+1, J(Am+1-XM+1)FJ(Am+1-XJ) se cumple, entonces sea m = m +1.

Si la característica menos importante es xr ( r =1, 2,,, m) y MSE (am+1-xr) < MSE (Am) es verdadera, excluyendo xr, entonces A ' m = Am+1-xr; m = 2, establezca Am = A'm, J (Am) = J (A'm), devuelva 2); de lo contrario, vaya al paso 5) Encuentre el subconjunto de características menos importante A'm Feature xs, si es MSE); (A'm- xs)EM SE (Am-1), luego asume Am= A'm, MSE (Am)= MSE (A'm), devuelve 2); si m se (a' m-xs)

Indicadores de evaluación predictiva y modelos de referencia

La etapa de evaluación de los resultados del entrenamiento es verificar la capacidad de generalización del modelo entrenado. La llamada capacidad de generalización se refiere a la capacidad de un modelo entrenado para responder correctamente a muestras que no aparecen en el conjunto de entrenamiento. Para evaluar las ventajas y desventajas del modelo, se seleccionaron como modelos de referencia BPANN, modelo de series de tiempo autorregresivas (CAR) multivariado y SVM sin expansión de rango ni selección de características. El error cuadrático medio (MSE) y el error porcentual medio de solución ab (MAPE) se utilizan como indicadores de evaluación. Las definiciones de MSE y MAP son las siguientes: m se = e(yi-y I)2n(2)mape = e | yi-y I |/yin(3) donde yi es el valor verdadero, y I es el valor predicho valor, y n es el número de muestras de predicción. Si los resultados de MSE y MAPE son pequeños, significa que el modelo de evaluación tiene una fuerte capacidad de generalización o una fuerte capacidad de generalización; de lo contrario, significa que la capacidad de generalización es pobre.

上篇: ¿Cómo mostrar los 16 canales del grabador de vídeo con disco duro Hikvision en dos monitores a una distancia de 100 metros? 下篇: ¿Cuál es la letra de "We Are All Dream Chasers"?
Artículos populares