¿El algoritmo de agrupamiento en la minería de datos se divide en varias categorías de forma artificial o automática? ¿El uso de la red neuronal SOM para la agrupación significa establecer artificialmente varias categorías de agrupación?
Después de leer las respuestas anteriores, no son profesionales.
El análisis de agrupación es un análisis no guiado. Si comprende el significado central de la agrupación, podrá comprender que no existe un estándar. para el número y debe configurarse manualmente, pero los métodos de agrupación especiales pueden brindarle algunas referencias, como la agrupación del sistema, que puede generar un árbol de agrupación para que pueda juzgar intuitivamente cuántas categorías son apropiadas. Otro ejemplo: agrupación de segundo orden, el modelo del sistema elegirá automáticamente dividirla en varias categorías (si no se configura manualmente).
La agrupación es una muestra de entrenamiento no guiada y la clasificación es una muestra de entrenamiento guiada. La clasificación consiste en establecer reglas de clasificación a través de muestras conocidas para predecir la clasificación de nuevas muestras. Debido a que la clasificación es un modelo que utiliza otros atributos de la muestra para explicar y predecir los atributos que nos interesan, esto es vernáculo. Por ejemplo: conocemos las variables demográficas, el consumo, el salario y el estado de pago del préstamo de un grupo de usuarios. Ahora queremos utilizar las variables demográficas, el consumo y el salario del usuario para predecir el estado de pago del préstamo del usuario. Aquí se utilizan árboles de decisión. Es decir, utilizamos otros atributos de la muestra para establecer reglas de clasificación para la situación de pago del préstamo de la muestra y luego predecimos nuevas muestras en el futuro para determinar si el nuevo usuario es un candidato ideal para el préstamo.