¿Qué son la recuperación y la precisión?
Nunca entendí lo que significan la tasa de recuperación y la tasa de precisión de un motor de búsqueda. Solo sé que estos dos miden el rendimiento de un motor de búsqueda. Cuando leí una tesis de licenciatura de la Universidad de Nanjing hoy. Encontré este problema nuevamente, así que decidí obtener más información al respecto. Lo busqué en Baidu y encontré mucho Análisis de tasa de recuperación y precisión: tasa de recuperación y precisión) Definición: al recuperar documentos de una recopilación de datos a gran escala. , los documentos se pueden dividir en cuatro grupos: documentos relevantes recuperados por el sistema (A) - documentos irrelevantes recuperados por el sistema (B) - documentos relevantes pero no recuperados por el sistema (C) - documentos que son relevantes pero recuperados por el sistema (D) Relevante e irrelevante AB recuperado pero CD no recuperado Intuitivamente hablando, cuantos más documentos relevantes se recuperen mediante un buen sistema de recuperación, mejor, y cuantos menos documentos irrelevantes, mejor. El recuerdo y la precisión son los parámetros más importantes para medir el rendimiento de los sistemas de recuperación de información. Recuerde R: utilice el número de documentos relevantes recuperados como numerador y el número total de todos los documentos relevantes como denominador, es decir, R = A/(A C) Precisión P: utilice el número de documentos relevantes recuperados como numerador, y el número total de todos los documentos recuperados como denominador. Es decir, P=A/(A B). El siguiente ejemplo ilustra la relación entre recuperación y precisión: una base de datos tiene 500 documentos, 50 de los cuales cumplen con el problema definido. El sistema recupera 75 documentos, pero solo 45 de ellos cumplen con el problema definido. Tasa de recuperación R=45/50=90 Precisión P=45/75=60 En este ejemplo, la recuperación del sistema es más efectiva, con una tasa de recuperación de 90. Sin embargo, los resultados tienen mucho ruido, con casi la mitad de. las recuperaciones El resultado es irrelevante. La investigación muestra: Es difícil obtener una alta tasa de recuperación sin sacrificar la precisión. Cuanto mayor es la tasa de recuperación, más rápido disminuye la precisión y la tendencia no es lineal. p>