Reflexiones sobre la era inteligente: sobre el pensamiento mecánico y el pensamiento basado en big data
Recuerdo que tomé una clase de filosofía en la escuela secundaria y aprendí algo de pensamiento mecánico. No lo recuerdo con mucha claridad, solo sé que es mecánico y no comprende métodos de pensamiento flexibles como las máquinas. Después de leer el libro de Wu Jun, me di cuenta de que el pensamiento mecánico alguna vez fue una forma de pensar muy avanzada, incluidas las tres leyes cinemáticas de Newton y la teoría de la relatividad de Einstein, que se puede decir que es el resultado del pensamiento mecánico. ¿Es este otro avance?
En gran medida, el pensamiento mecánico se originó en la antigua Grecia. La única razón por la que Europa es líder en ciencia es por el pensamiento crítico y la capacidad de razonamiento lógico establecidos en la antigua Grecia. En China, excepto durante el período de primavera y otoño, cuando varias escuelas de pensamiento competían, las ideas principales detrás de ellas eran las culturas confuciana y taoísta. El confucianismo presta atención a la moderación, la neutralidad, la moderación, el equilibrio y la orientación a las personas, mientras que la especulación es una forma extrema de pensar y perseguir. El pensamiento taoísta persigue el camino natural del Tao, la unidad de la naturaleza y el hombre, el equilibrio del yin y el yang, y el misterio del yin y el yang es que el Tao puede taoizarse, el Tao es extraordinario y el nombre puede; ser muy famoso. En otras palabras, el Tao inmutable no se puede expresar con palabras. En resumen, en mi opinión, nuestros antepasados chinos descubrieron hace mucho tiempo que el mundo es muy complicado. El confucianismo se preocupa más por las personas desde la perspectiva de la benevolencia, mientras que el taoísmo se preocupa más por la armonía entre las personas y la naturaleza, tomando el cielo y la tierra como maestros, aprendiendo del cielo, aprendiendo de la tierra y aprendiendo de la naturaleza.
El resumen del pensamiento mecánico del profesor Wu en el libro es el siguiente:
En mi opinión, la mayoría de las personas pueden tener este modo de pensar, y hay otro modo de pensar que no existe en absoluto, es decir, hacer las cosas a ciegas. Este modo de pensar es peor que el pensamiento mecánico. La idea central del pensamiento mecánico se puede resumir de la siguiente manera: el mundo se puede entender completamente y tiene ciertas leyes. Existe una cierta relación causal entre todo en el mundo. La exploración de las leyes requiere "suposiciones audaces y una verificación cuidadosa". que ahora también se conoce como Piénselo como una actitud científica y una forma de pensar científica. Muchos logros modernos, incluida la ecuación masa-energía de Einstein, se completaron bajo el modo del pensamiento mecánico.
El lado positivo del pensamiento mecánico de que el mundo es cierto y puede ser conocido también tiene sus limitaciones, es decir, niega la incertidumbre y la incognoscibilidad. Einstein dijo la famosa frase: "Dios no juega a los dados", lo que Einstein dijo cuando discutía con Bohr, el inventor de la mecánica cuántica. Hoy sabemos que Bohr tenía razón en este debate, Einstein se equivocó y Dios también juega a los dados.
Desde las predicciones de expertos del mercado de valores hasta los pronósticos meteorológicos y simples tiradas de dados, muchas predicciones son inexactas. De dónde viene la incertidumbre:
Primero, cuanto más detallados conocemos, más variables afectan al mundo, y los resultados no se pueden calcular con métodos o fórmulas simples. Si se agotan todas las variables que afectan los asuntos, ciertamente se puede predecir, pero en la realidad es imposible. La fórmula será muy complicada y no se puede describir claramente con una fórmula simple;
En segundo lugar, debido a. La influencia de nuestro pensamiento subjetivo. Nuestra comprensión del mundo es inexacta debido a limitaciones en nuestra forma de pensar, lo que también dificulta nuestra comprensión del mundo.
En tercer lugar, objetivamente el mundo es intrínsecamente complejo. Por ejemplo, sabemos que los electrones giran rápidamente alrededor del núcleo, pero la posición y la velocidad de los electrones en un momento específico son inciertas. Esta es una característica del átomo mismo, similar al principio de incertidumbre en la cuántica. resultados de medición. Esto es similar a comprar acciones basándose en un índice específico del mercado de valores. Si todos compran acciones de acuerdo con este índice, entonces su propio comportamiento de compra de acciones afectará el precio y la tendencia de las acciones mismas.
El mundo es incierto, pero no desconocido. También es el movimiento de los electrones alrededor del núcleo. Aunque no conocemos la posición específica y la velocidad de los electrones, podemos estimar su ubicación y probabilidad de ocurrencia. Por lo tanto, muchas cosas en el mundo que son difíciles de describir con fórmulas específicas generalmente se pueden describir con modelos de probabilidad. El genio Shannon conectó la incertidumbre del mundo con la información y formó la teoría de la información. La teoría de la información no es sólo una teoría de la comunicación, sino también una nueva forma de entender el mundo.
La teoría de la información resuelve primero el problema de cuánta información hay. Estas dos frases simples, "El sol saldrá mañana por el este" y "La celebridad xxx y la celebridad xxx han registrado en secreto su matrimonio" contienen mucha información.
Desde nuestro pensamiento intuitivo, es casi seguro que el sol saldrá por el este mañana, por lo que es equivalente a una tontería con poco contenido de información, la probabilidad de la última oración es relativamente baja, por lo que la cantidad de información es grande; El Dr. Shannon introdujo el concepto de entropía relacionando la información con la incertidumbre en la certeza de los acontecimientos. La entropía es originalmente un concepto de termodinámica. Los dos contenedores están separados por un deflector y los gases de ambos lados están en un estado ordenado. Si se retira el deflector, el estado del gas se volverá cada vez más desordenado y macroscópicamente estable. Este tipo de gas cambia gradualmente del estado ordenado original a un estado desordenado y la entropía sigue aumentando. Es decir, la entropía determinada por el orden es baja y cuanto más desordenada, mayor es la entropía. Para que la entropía sea baja o que las cosas estén ordenadas, debe haber una fuerza externa.
Todavía un poco abstracto. Por poner un ejemplo sencillo, si tu habitación no está organizada, en el futuro estará cada vez más desordenada. En este momento, la entropía es cada vez mayor. Incluso después de buscar durante mucho tiempo, es posible que no lo encuentre. ¿Por qué? Porque el caos conduce a un aumento de la incertidumbre. Cómo afrontarlo es ordenar la habitación, mejorar el orden y reducir la entropía.
El Dr. Shannon utiliza la entropía para medir la cantidad de información. Cuanto mayor es la cantidad de información, mayor es la incertidumbre, por lo que la entropía es mayor. Si quieres que la información sea cierta, debes introducir más información. La cantidad de información a introducir depende de la incertidumbre de los eventos requeridos. A diferencia del pensamiento mecánico, la teoría de la información se basa en la incertidumbre.
Si has estudiado aprendizaje automático, debes estar familiarizado con el algoritmo del árbol de decisión. No importa si no has estudiado. Usemos un ejemplo para explicar brevemente cómo determinar si una sandía es una sandía madura. Necesitamos juzgar la profundidad del patrón del melón, el grosor del tallo del melón y el sonido del melón al golpearlo. Podemos juzgar paso a paso en función de estas condiciones, elegir una condición para juzgar en cada paso y finalmente juzgar la probabilidad de que un melón esté maduro en función de múltiples condiciones, como se muestra en la siguiente figura:
En primer lugar, no estamos seguros de si un melón está maduro o no. Cómo determinarlo, introdujimos mucha información, como el patrón y el color del melón, el grosor del pedicelo y el orden en que se introducen las condiciones de juicio también es muy importante. Por ejemplo, creo que la profundidad del patrón y el color de los melones es muy importante y contiene mucha información. Después de ser introducida, la entropía de la información de si la información está madura o no disminuirá rápidamente, lo que nos hará cada vez más seguros acerca de la información. Este principio se utiliza para juzgar árboles de decisión. El color del patrón y el grosor del tallo del melón no se seleccionan al azar. La información a seleccionar está relacionada con si el melón está maduro (según la teoría de la información). La información mutua en la teoría de la información explica la magnitud de la correlación.
El principio importante de la teoría de la información es que cuando queremos encontrar un modelo de probabilidad para un evento desconocido, este modelo debe satisfacer los datos que tenemos, pero no hacer ninguna suposición sobre lo desconocido. Este es el principio de máxima entropía, que es diferente del anterior "supuesto audaz, argumento cauteloso". El requisito previo para no hacer suposiciones subjetivas es disponer de datos suficientes.
En primer lugar, debemos comprender las tres características del big data: 1) La cantidad de datos debe ser lo suficientemente grande; 2) Las dimensiones de los datos deben ser suficientes; 3) Si los datos son completos; y completamente cubierto, no se puede realizar el muestreo.
La naturaleza de este mundo es un mundo incierto. Cuanta más información conozcamos, más fácil será eliminar la incertidumbre. Con el desarrollo de big data, muchos problemas de inteligencia artificial pueden resolverse porque nuestros datos son lo suficientemente grandes.
Si la cantidad de datos es lo suficientemente grande, tendremos suficiente información. Cuanto más se reduzca la incertidumbre en campos relacionados, más rápido será el progreso de la investigación relacionada. Cuantas más dimensiones tengan los datos, mejor coincidirá su relevancia con el problema que queremos resolver. Con información multidimensional, se puede realizar una validación cruzada para reducir aún más la incertidumbre de la información; la integridad de los datos previene la ocurrencia de eventos de baja probabilidad y cubre todo el rango del entorno en el que ocurre el evento. Gracias a los avances tecnológicos, se puede decir que es posible completar la recopilación de datos.
Los macrodatos enfatizan la correlación más que la causalidad. Dado que el mundo es incierto, no podemos encontrar su relación causal en algunas leyes, pero esto no nos impide encontrar su correlación, como colocar anuncios de bocadillos en sitios web de alquiler de películas o colocar anuncios de tarjetas de crédito en sitios web de reseñas y ventas de café. y anuncios de hipotecas. Este es el resultado de hacer clic en el anuncio de intercambio de big data, aunque no conocemos la causa y el efecto. Pero esta relevancia también nos ayuda a aumentar el porcentaje de clics de nuestros anuncios. Necesitamos aprender a aceptar la respuesta sin saber el motivo. Si estamos dispuestos a aceptarlo, saldremos de la forma mecánica de pensar y buscaremos sólo causa y efecto.
La era del big data ha llegado. Necesitamos dejar de pensar de la forma mecánica habitual y atrevernos a aceptar respuestas sin causa ni efecto.
Deseo que todos puedan mejorar su pensamiento.
-Yiming estuvo en Chengdu el 31 de agosto de 2009.