Nuevos avances en el modelado empresarial de big data: desde la predicción hasta las “pruebas de campo”
¿Cuál es la nueva dirección de desarrollo del modelado de negocios de big data? ¿Cómo predecir las ventajas únicas del big data? ¿Cómo es posible pasar de la predicción a la “medición de campo”? El científico jefe de modelos, el profesor Chen Yuxin, nos dio una explicación más profunda, desde la predicción hasta las "pruebas en tiempo real": el nuevo desarrollo del modelado empresarial de big data.
El siguiente es un extracto del discurso del profesor Chen Yuxin en la Conferencia de Financiamiento BD-OS y Serie D de 2015:
¡Gracias a todos, gracias! Hoy tengo el honor de compartir con ustedes algunas ideas sobre el nuevo desarrollo del modelado de negocios de big data en esta ocasión, que también es una frontera de la investigación y el desarrollo porcentuales actuales.
Como todos sabemos, la predicción es un núcleo de las aplicaciones comerciales de big data. La predicción de big data requiere grandes cantidades de datos de alta calidad y modelos muy avanzados. ¿Cuáles son los nuevos puntos calientes o las nuevas direcciones de desarrollo en el campo de la predicción en la situación actual? ¿Cómo predecir las ventajas únicas del big data? Esto es lo que quiero compartir. Antes de eso, permítanme presentarles dos noticias recientes de los medios de comunicación, en las que es posible que podamos ver algunas nuevas tendencias de desarrollo. Ambas noticias fueron publicadas en la edición de agosto de The Wall Street Journal.
En primer lugar, Apple y Google están desarrollando tecnología para saber lo que los usuarios quieren antes de que ellos lo quieran, y para decirte lo que quieres antes de que sepas lo que quieres. Todo el mundo ha oído hablar de estos dos productos, Apple lo llama "Active Assistant" y Google lo llama "Google Modern". Estas dos empresas especulan sobre lo que usted quiere hacer en el futuro cercano al encontrar cosas que definitivamente hará en el futuro. Google puede informarle por correo electrónico que tiene un vuelo hoy a las 6 p.m. A las tres de la tarde, según su ubicación actual y el flujo de tráfico en Beijing, le indica que es hora de irse. Si te vas, ¿qué auto deberías tomar, Didi o Uber? Ésta es su idea de predicción, que consiste en predecir lo que se hará en el futuro captando algunos eventos futuros conocidos.
Otra noticia que parece no tener nada que ver con esto, pero que tiene similitudes. El nombre de la empresa de previsión de indicadores macroeconómicos es "Xiance", y su fundador es un estudiante de doctorado de la Universidad de Columbia que ganó. el Premio Nobel de Economía. Big data predice indicadores macroeconómicos, como el índice de precios. ¿Por qué se llama "examen ahora"? No es un pronóstico, sino más bien un breve resumen de varios cambios de precios que acaban de ocurrir en los Estados Unidos y una descripción de lo que acaba de suceder, en lugar de una verdadera predicción de los precios futuros. ¿Por qué esto importa? Porque normalmente el índice publicado por el gobierno fue hace un mes o un trimestre, hace un minuto es suficiente.
Las dos noticias tienen la misma palabra clave "ahora". Ahora bien, esta es una tendencia muy importante en la aplicación actual de big data, desde la predicción hasta la medición actual. Una dificultad central, pero también la mayor, en el modelado de big data. Todo el mundo dice que el big data es muy poderoso y puede predecir muchas cosas. ¿Puede decirme si las acciones de China subirán un 100% mañana? Pero el beneficio del big data es que muchas veces lo que realmente necesitamos no son predicciones, sino las llamadas mediciones actuales, que son descripciones del pasado muy reciente y predicciones del futuro muy cercano.
¿A qué te refieres con muy cerca? ¿Hace un día o hace una hora? Realmente depende de la cantidad de datos que tengamos ahora y del desarrollo de la tecnología. La tendencia es que esto sea cada vez más corto. Los datos económicos que originalmente se conocían hace un mes ahora se pueden conocer hace un minuto, y el comercio de alta frecuencia requiere datos un segundo antes. Ésta es la definición de "medición de campo" que tenemos en mente. Ahora es un proceso dinámico. La medición de campo se refiere a una descripción o predicción punto por punto de nuestra situación actual. En realidad, este es un modelo predictivo que en realidad utilizan una gran cantidad de aplicaciones de big data, como el comercio de alta frecuencia. De hecho, ya conocemos la situación del mercado, sólo sabemos lo que pasó recientemente antes de que otros reaccionen.
El motor de recomendación es muy importante para aplicaciones de big data y también es el ADN más original de Percent. Según la situación actual de los consumidores en esta página, bríndele una recomendación actual de inmediato. Este tipo de recomendaciones pueden ser simplemente anuncios RTB y software de llamada de taxis que se colocan en tiempo real en un segundo o incluso medio segundo. Todo el mundo ha utilizado Didi Private Car. El principio detrás de ellos es el de la medición de corriente. Sé dónde está el coche, dónde estás tú, conozco el tráfico, así que puedo adivinar el próximo minuto. Hay un principio científico muy importante detrás de lo que acaba de pasar y de lo que va a pasar. La naturaleza nos ha dado un medio de predicción muy importante. Todo en el mundo tiene la llamada inercia. Cuando se produce esta eficiencia inercial, nuestras predicciones pueden ser más precisas. Cuando un objeto se desliza por una pendiente, es posible predecir con gran precisión dónde estará el bloque de madera en el siguiente segundo. Por qué la precisión de las mediciones actuales proviene de la inercia detrás de todo en el mundo.
En el ámbito social, la inercia viene impulsada por escenarios. Por ejemplo, si tu mujer celebra mañana su cumpleaños, cómprale un regalo de cumpleaños. Con este objetivo en mente, las predicciones se convierten en pruebas de realidad basadas en el principio de inercia.
Una de las ventajas de la medición de corriente es el uso del llamado principio de inercia y diferencia de tiempo. Ésta es la característica del big data, porque el big data suele ser datos en tiempo real y datos masivos de alta frecuencia. Puedes ver que si tomara una fotografía como esta cada diez minutos, probablemente fallaría. Si tomara una fotografía cada microsegundo o cada medio segundo, podría ver esta toma. Cuando vi esta toma, hubo una aplicación de inercia. La señora recogió la naranja.
Si no hay diferencia horaria, por ejemplo, si esta toma la hacemos cada cinco minutos, la fallaremos, pero si la frecuencia es alta, sabremos que está mirando la naranja. Aunque la niña se la quitó, estaba muy interesada en la naranja. En este caso, podemos disponer de algunos métodos de marketing.
Hablar como predicción es en realidad una cuestión de descripción. El efecto de descripción de la alta frecuencia es muy similar a la predicción. No estamos prediciendo si le gustan las manzanas o las naranjas, pero nuestra descripción ha cambiado de predicción a medición real. La descripción es muy ventajosa, por lo que hemos convertido un problema de predicción difícil en un problema de descripción. Eso es lo que dije acerca de por qué tenemos la ventaja de las pruebas de campo de big data.
Tengo varios estudiantes de doctorado haciendo construcción y prueba de modelos. Basándonos en el concepto de pruebas de campo, podemos desarrollar una serie de modelos técnicos que tienen una variedad de aplicaciones comerciales. Uno es el filtrado colaborativo y el análisis de series temporales. Generalmente, en el ámbito de la informática, todos conocemos el algoritmo de filtrado colaborativo. Si tenemos en cuenta las consideraciones econométricas actuales, al igual que el análisis de series temporales de la econometría, el análisis de series temporales se utiliza ampliamente en el comercio de alta frecuencia. Ahora podemos combinar el filtrado colaborativo y el análisis de series de tiempo para crear la aplicación correspondiente.
El segundo es el retrato del usuario. Combinado con el aprendizaje bayesiano de iteración rápida, sabemos qué tipo de persona es el usuario y qué tipo de cosas hará, pero podemos observar las necesidades anteriores en escenarios específicos y hacer correcciones. Esta corrección debe realizarse en tiempo real y repetirse rápidamente.
En tercer lugar, se han desarrollado algunos productos de visualización dinámica de datos e interacción persona-computadora. La ventaja del cerebro humano es que puede captar plenamente una escena y hacer mejores predicciones que las computadoras, y los macrodatos pueden interceptar esa información rápidamente y en tiempo real. Si algunos datos se muestran dinámicamente, se pueden juzgar mediante la interacción persona-computadora. Bajo la condición del personal del supermercado, no es necesariamente exacto dejar que la computadora juzgue si a una mujer le gustan las naranjas o no, pero podemos combinar orgánicamente la predicción humana de algunas vistas panorámicas con la captura de datos por parte de la computadora a través de la visualización dinámica de datos.
En la actualidad, algunos académicos se centran en la predicción de series de tiempo inversas basadas en la investigación de operaciones y las ciencias del comportamiento. En otras palabras, utilizar el futuro para predecir el presente suena un poco suspenso. Muchas veces, en nuestro futuro lejano, es posible que compres un billete de avión y vuele mañana. Este es el futuro exacto. Tenemos un futuro claro y lo utilizamos para ayudar a predecir el presente. Por ejemplo, si estás en unos grandes almacenes o en los grandes almacenes Wangfujing, al menos sé que debes salir y no puedes quedarte allí toda tu vida. Si quieres salir de estos grandes almacenes, te puedo decir varias opciones, por qué estantes pasa cada opción y cuántos productos posibles recomienda el método de optimización logística. Tiene muchas aplicaciones para convertir varios problemas de predicción muy difíciles en problemas de optimización logística que retroceden desde puntos finales conocidos. Esta es también una combinación muy cercana de lo que se ha hecho antes y lo que se está haciendo ahora. Se ha recomendado el porcentaje de ADN en tiempo real, coincidiendo con las mediciones actuales.
Percent ha hecho mucho en el modelado, es decir, dibujando retratos de usuarios y refinando escenarios. Después de una cuidadosa consideración, el escenario refinado va un paso más allá, no solo para estudiar el escenario del usuario, sino también para estudiar cuál es el objetivo del usuario en este escenario. Mi propósito en este lugar es comunicarme con usted. Cualquier usuario en cualquier entorno empresarial y en cualquier escenario tiene realmente un propósito. El propósito de ir a un restaurante es comer y el propósito de ir a la escuela es estudiar. Encontramos este propósito. A través de la tecnología de la que acabo de hablar, es posible conocer el retrato del usuario para impulsar sus pensamientos y comportamientos actuales. El sistema de datos y la segmentación de escenas actualmente establecidos, incluidos los retratos de los usuarios, tienen muchas aplicaciones dentro del rango de medición actual. Por tanto, acumular una gran cantidad de datos tiene muy buenas perspectivas.
Al igual que las empresas de predicción de big data, mucha información financiera e indicadores económicos en tiempo real predicen el futuro describiendo el pasado. También hay un campo con información financiera e informes crediticios personales. Desde el punto de vista de la medición actual, los llamados indicadores demográficos, indicadores de comportamiento pasado, ahora tienen más práctica. Cuando una persona compra un producto grande o un automóvil, esta información se retroalimenta inmediatamente a su sistema de crédito personal. El seguimiento en tiempo real de los cambios en sus niveles de flujo de caja es similar al marketing corporativo personalizado.
Para el mismo ejemplo que acabamos de mencionar, finanzas personales y tarjetas de crédito pueden calcular cuánto dinero aún puedes usar este mes, el consumo mensual total y la cantidad de depósitos bancarios en función de los cambios en tu cuenta en tiempo real. situación de consumo. En base a esto, puede impulsar las cosas que compra de un lado a otro; de lo contrario, es posible que los usuarios que recomiende no tengan los recursos financieros para gastar.
La tercera aplicación es la gestión de viajes turísticos. Por ejemplo, en cuanto a su vuelo, sé que el tiempo cambiará mañana, así que puedo saber que tendrán una reunión en Beijing. Si mañana hace mal tiempo, puedo recordarte en tiempo real si debes cambiar tu billete de avión por un billete de tren. Este es el concepto de medición actual. Conocer parte de la incertidumbre sobre el futuro puede, a su vez, ayudarle a resolver la incertidumbre.
Gestión de salud personal, el objetivo es perder cinco kilos en tres meses. En base a esto, podrás deducir cuánto debes perder y comer cada día, y ajustar tu plan de gestión de salud en tiempo real.
Finalmente, al juntar algunas cosas, puedes crear un asistente de vida digital que gestiona todos los aspectos de tu vida y te brinda la mejor experiencia posible.
¿Por qué se enfatiza repetidamente la importancia de la medición in situ y la aplicación de big data tiene grandes ventajas? En el pasado, Big Data a menudo mencionaba esto, los llamados tres V o cuatro V, pero generalmente cuando la gente habla de Big Data, la V suele ser velocidad, que puede procesar rápidamente datos masivos. Cuando se conoce el pasado y el futuro próximo, además, las ventajas relativas de big data tienen ventajas especiales para aplicaciones de corta escala, pero no ventajas obvias para aplicaciones de larga escala.
A largo plazo, puedo decir que no necesito big data, puedo tener éxito con small data. Pero con predicciones a corto plazo, no puedo decirte qué vas a cenar esta noche. Los macrodatos a menudo saben esto porque saben qué almorzaste, de dónde vienes, qué te gusta comer, dónde estás ahora, qué restaurantes hay a tu alrededor y, a menudo, a través de esto puedes inferir qué quieres comer y qué quieres comer. cuándo almorzar, altura y peso, cuándo tendrás hambre. Podemos retroceder y hacer una serie de presentaciones. Esta es una gran ventaja del big data y a la que se debe prestar especial atención en los negocios. Minería y utilización de la inercia del comportamiento a través de retratos de usuarios de big data y modelado detallado de escenas. Esta es una nueva tendencia de desarrollo para mejorar el valor de big data y maximizar las fortalezas y evitar las debilidades. Espero que todos puedan corregirme y comunicarse conmigo. Gracias
Lo anterior es el contenido compartido por el editor sobre el nuevo desarrollo del modelado empresarial de big data desde la predicción hasta las "pruebas de campo". Para obtener más información, puede seguir a Global Ivy para compartir más información detallada.