¿Qué significa el algoritmo yolo?
La tarea de detección de objetos implica determinar la ubicación de ciertos objetos en una imagen y clasificarlos. Los métodos anteriores, como R-CNN y sus variantes, utilizaban canalizaciones para realizar esta tarea en varios pasos. Esto puede resultar lento y difícil de optimizar porque cada componente individual debe entrenarse por separado.
Características
YOLO redefine la detección de objetos como un problema de regresión. Aplica una única red neuronal convolucional (CNN) a toda la imagen, divide la imagen en cuadrículas y predice probabilidades de clase y cuadros delimitadores para cada cuadrícula.
El algoritmo también puede predecir la probabilidad de que un objeto esté en un cuadro delimitador. Si el centro de un objeto cae dentro de una celda de la cuadrícula, esa celda de la cuadrícula es responsable de detectar el objeto. Habrá varios cuadros delimitadores en cada cuadrícula. Durante el entrenamiento, queremos tener solo un cuadro delimitador por objeto. Por lo tanto, asignamos un cuadro para predecir un objeto en función de qué cuadro tiene la mayor superposición con el cuadro de verdad fundamental.