¿Es pycharm un reptil?
_ ¿Qué? ¿Qué? Elimine los enlaces que no tengan nada que ver con el tema, conserve los enlaces útiles y colóquelos en la cola de URL en espera de ser rastreados. Luego, seleccionará la siguiente URL de la cola de acuerdo con una determinada estrategia de búsqueda y repetirá el proceso anterior hasta que se alcance una determinada condición del sistema. Además, todas las páginas web rastreadas por el rastreador serán almacenadas por el sistema, analizadas y filtradas hasta cierto punto, e indexadas para consultas y recuperación posteriores para rastreadores enfocados; los resultados del análisis obtenidos en este proceso también pueden ser útiles para posteriores; Proporcione comentarios y orientación durante el proceso de rastreo.