¿Cuál es el concepto de gráfico de conocimiento?
El concepto de gráfico de conocimiento es: el gráfico de conocimiento se construye de arriba hacia abajo. De arriba hacia abajo se refiere a definir primero la ontología y el modelo de datos para el gráfico de conocimiento y luego agregar las entidades a la base de conocimiento.
Este método de construcción necesita utilizar alguna base de conocimiento estructurada existente como base de conocimiento básica. Por ejemplo, el proyecto Freebase utiliza este método y la mayoría de sus datos se obtienen de Wikipedia.
Sin embargo, actualmente, la mayoría de los gráficos de conocimiento adoptan un método de construcción ascendente. De abajo hacia arriba se refiere a extraer entidades de algunos datos de conexión abiertos (es decir, "información"), seleccionar aquellas con mayor confianza para agregarlas a la base de conocimientos y luego construir conexiones entre entidades.
La arquitectura del gráfico de conocimiento es:
La arquitectura del gráfico de conocimiento incluye principalmente su propia estructura lógica y arquitectura del sistema.
La estructura lógica del gráfico de conocimiento se puede dividir en dos niveles: la capa de patrón y la capa de datos. La capa de datos se compone principalmente de una serie de hechos, y el conocimiento se almacenará en unidades de hechos. .
Si utiliza triples como (entidad 1, relación, entidad 2), (entidad, atributo, valor de atributo) para expresar hechos, puede elegir una base de datos gráfica como medio de almacenamiento, como el código abierto. Neo4j, Twitter FlockDB, JanusGraph, etc.
La capa de patrón se construye sobre la capa de datos y utiliza principalmente la biblioteca de ontologías para estandarizar una serie de expresiones fácticas en la capa de datos. La ontología es la plantilla conceptual de una base de conocimiento estructurada. La base de conocimiento formada a través de la base de ontología no solo tiene una fuerte estructura jerárquica, sino que también tiene un pequeño grado de redundancia.
La construcción y aplicación de bases de conocimiento a gran escala requieren el apoyo de una variedad de tecnologías inteligentes de procesamiento de información. A través de la tecnología de extracción de conocimiento, se pueden extraer elementos de conocimiento como entidades, relaciones y atributos de algunos datos públicos semiestructurados y no estructurados. A través de la fusión de conocimientos, se puede eliminar la ambigüedad entre elementos de referencia como entidades, relaciones y atributos y objetos de hechos para formar una base de conocimiento de alta calidad.
El razonamiento del conocimiento consiste en explorar más a fondo el conocimiento implícito basado en la base de conocimiento existente, enriqueciendo y ampliando así la base de conocimiento. El vector integral formado por la representación distribuida del conocimiento es de gran importancia para la construcción, razonamiento, fusión y aplicación de la base de conocimientos.