Red de conocimiento de divisas - Cuestiones de seguridad social - ¿Qué es un motor de búsqueda?

¿Qué es un motor de búsqueda?

Categoría: Ordenador/Red>> Software

Análisis:

Motor de búsqueda

El concepto de buscador

Motor de búsqueda se refiere a un sistema que recopila información en Internet con ciertas estrategias, organiza y procesa la información y brinda servicios de recuperación a los usuarios. Desde la perspectiva del usuario, el motor de búsqueda proporciona una página que contiene un cuadro de búsqueda. Después de ingresar palabras en el cuadro de búsqueda y enviarlas al motor de búsqueda a través del navegador, el motor de búsqueda devolverá una lista de información relacionada con el contenido ingresado. usuario. En los primeros días del desarrollo de Internet, las consultas de directorios de categorías de sitios web representadas por Yahoo eran muy populares. El directorio de clasificación de sitios web se organiza y mantiene manualmente. Los sitios web excelentes en Internet se seleccionan, describen brevemente y clasifican en diferentes directorios. Cuando los usuarios realizan consultas, hacen clic en las capas para encontrar el sitio web que desean. Algunas personas llaman a este sitio web de servicio de recuperación basado en directorio motor de búsqueda, pero en sentido estricto, no es un motor de búsqueda.

Cómo funcionan los motores de búsqueda

Se puede dividir en tres partes

1. Rastrear páginas web

Cada motor de búsqueda independiente Cada uno tiene su propio rastreador web (araña). Spider rastrea continuamente páginas web a lo largo de los hipervínculos de las páginas web. Dado que la aplicación de hipervínculos es muy común en Internet, en teoría, a partir de un cierto rango de páginas web, se puede recopilar la gran mayoría de las páginas web.

2. Procesamiento de páginas web

Después de que el motor de búsqueda rastrea la página web, necesita realizar una gran cantidad de trabajo de preprocesamiento antes de poder proporcionar servicios de recuperación. Entre ellos, el más importante es extraer palabras clave y crear archivos de índice. Otros incluyen eliminar páginas web duplicadas, analizar hipervínculos y calcular la importancia de las páginas web.

3. Proporcionar servicios de recuperación

Los usuarios ingresan palabras clave para buscar y el motor de búsqueda encuentra páginas web que coinciden con las palabras clave de la base de datos del índice para comodidad de los usuarios, además de las páginas web que coinciden con las palabras clave de la base de datos del índice. título de la página web y URL Además, se proporciona un resumen de la página web y otra información.

Historia del desarrollo de los motores de búsqueda

En 1990, profesores y estudiantes de la Facultad de Ciencias de la Computación de la Universidad de McGill en Canadá desarrollaron Archie. En ese momento, la World Wide Web aún no había aparecido y la gente compartía e intercambiaba recursos a través de FTP. Archie puede recopilar y analizar periódicamente información de nombres de archivos en el servidor FTP y brindar la capacidad de buscar archivos en cada host FTP. El usuario debe ingresar el nombre exacto del archivo para buscar y Archie le dice qué servidor FTP puede descargar el archivo. Aunque los recursos de información recopilados por Archie no son páginas web (archivos HTML), el método de trabajo básico de Archie es el mismo que el de los motores de búsqueda: recopilar automáticamente recursos de información, establecer índices y proporcionar servicios de recuperación. Por lo tanto, Archie es reconocido como el creador de los motores de búsqueda modernos.

La palabra Robot tiene un significado especial para los programadores. Computer Robot se refiere a un programa automático que puede realizar repetidamente una tarea a una velocidad que los humanos no pueden alcanzar. Debido a que los programas de robots utilizados específicamente para recuperar información se arrastran por Internet como arañas, los programas de robots de motores de búsqueda se denominan programas de araña.

En 1993, Matthew Gray desarrolló World Wide Web Wanderer, que fue el primer programa "robot" en utilizar las relaciones de enlace entre páginas web HTML para detectar el tamaño de la World Wide Web. Al principio solo se usaba para contar el número de servidores en Internet y luego también pudo capturar direcciones web (URL).

En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, los chino-estadounidenses Jerry Yang y David Filo***, cofundaron Yahoo. A medida que crecía el número de visitas y los enlaces incluidos, el directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Debido a que los datos de Yahoo! se ingresan manualmente, no se puede clasificar realmente como un motor de búsqueda y, de hecho, es solo un directorio en el que se pueden realizar búsquedas.

Yahoo adquirió inktomi el 23 de diciembre de 2002 y Overture, incluidas Fast y Altavista, el 14 de julio de 2003. En noviembre de 2003, Yahoo adquirió por completo 3721 Company.

A principios de 1994, Brian Pinkerton, un estudiante de la Universidad de Washington, inició su pequeño proyecto WebCrawler. Cuando WebCrawler se lanzó oficialmente el 20 de abril de 1994, contenía contenido de sólo 6.000 servidores. WebCrawler es el primer motor de búsqueda de texto completo en Internet que admite la búsqueda en el texto completo de un archivo. Antes, los usuarios solo podían buscar por URL y resumen. El resumen generalmente provenía de comentarios manuales o de las primeras 100 palabras del texto de forma automática. recuperado por un programa.

En julio de 1994, Michael Mauldin de la Universidad Carnegie Mellon integró el programa araña de John Leavitt en su programa de indexación y creó Lycos. Además de la clasificación por relevancia, Lycos también proporciona restricciones de coincidencia de prefijos y similitud de caracteres. Lycos fue el primero en utilizar un resumen automático de páginas web en los resultados de búsqueda, y su mayor ventaja es que supera con creces la cantidad de datos de otros motores de búsqueda.

A finales de 1994, Infoseek debutó oficialmente. Su amigable interfaz y su gran cantidad de funciones adicionales lo convierten en un importante representante de motores de búsqueda como Lycos.

En 1995, apareció una nueva forma de motor de búsqueda: un metamotor de búsqueda (A Meta Search Engine Roundup). Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable del procesamiento de la conversión y el envío a múltiples motores de búsqueda independientes preseleccionados. Todos los resultados de la consulta devueltos por cada motor de búsqueda independiente se centralizarán y procesarán antes de ser devueltos al usuario. . El primer metabuscador fue Metacrawler de Eric Selberg y Oren Etzioni, estudiantes de maestría en la Universidad de Washington.

En diciembre de 1995, DEC lanzó oficialmente AltaVista. AltaVista es el primer motor de búsqueda que admite búsquedas en lenguaje natural y el primer motor de búsqueda que implementa una sintaxis de búsqueda avanzada (como AND, OR, NOT, etc.). Los usuarios pueden utilizar AltaVista para buscar el contenido de grupos de noticias (Newsgroups) y obtener artículos de Internet. También pueden buscar texto en nombres de imágenes, buscar títulos, buscar subprogramas Java y buscar objetos ActiveX. AltaVista también afirma ser el primer motor de búsqueda que permite a los usuarios enviar o eliminar URL a la base de datos del índice web y puede conectarse en línea en 24 horas. Una de las novedades más interesantes de AltaVista es la búsqueda de todos los sitios web que tengan enlaces que apunten a una URL. AltaVista también ha realizado muchas innovaciones en la interfaz orientada al usuario. Coloca "consejos" debajo del área del cuadro de búsqueda para ayudar a los usuarios a expresar mejor sus términos de búsqueda. Estos consejos se actualizan con frecuencia, de modo que después de buscar varias veces, los usuarios verán muchas funciones interesantes que quizás nunca hayan conocido. Esta serie de funciones poco a poco han sido ampliamente adoptadas por otros motores de búsqueda. En 1997, AltaVista lanzó LiveTopics, un sistema de presentación gráfica para ayudar a los usuarios a encontrar lo que buscan entre miles de resultados de búsqueda.

El 26 de septiembre de 1995, Inktomi fue fundada por Eric Brewer, un profesor asistente en la Universidad de California, Berkeley, y Paul Gauthier, un estudiante de doctorado. El 20 de mayo de 1996, se fundó la empresa Inktomi. y el poderoso HotBot apareció frente al mundo. Afirma ser capaz de rastrear e indexar más de 10 millones de páginas cada día, por lo que tiene mucho más contenido nuevo que otros motores de búsqueda. HotBot también utiliza ampliamente cookies para almacenar las preferencias de búsqueda personales de los usuarios.

En agosto de 1997 apareció oficialmente el motor de búsqueda Northernlight.

Era uno de los motores de búsqueda con la base de datos más grande, no tenía palabras vacías, tenía excelentes noticias de actualidad, una colección especial de más de 7100 publicaciones, buena sintaxis de búsqueda avanzada y fue el primero en admitir una clasificación automática simple de resultados de búsqueda.

Antes de octubre de 1998, Google era sólo BackRub, un pequeño proyecto de la Universidad de Stanford. En 1995, el estudiante de doctorado Larry Page comenzó a estudiar diseño de motores de búsqueda y registró el nombre de dominio de Google el 15 de septiembre de 1997. A finales de 1997, con la participación de Sergey Brin, Scott Hassan y Alan Steremberg, BachRub comenzó a ofrecer población. En febrero de 1999, Google completó la transformación de la versión Alpha a la versión Beta. Google reconoce el 27 de septiembre de 1998 como su cumpleaños. Google determina la importancia de las páginas web basándose en el ranking de la página (Pagerank), lo que mejora enormemente la relevancia de los resultados de búsqueda. La cultura geek de Google y la filosofía No seas malvado le han valido a Google una gran reputación y reputación de marca. En abril de 2006, Google anunció su nombre chino "Google", que era el primer nombre de Google en un país de habla no inglesa.

Fast (Alltheweb) se fundó en 1997 como resultado de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU). En mayo de 1999, lanzó su propio motor de búsqueda AllTheWeb. El objetivo fundamental de Fast es ser el motor de búsqueda más grande y rápido del mundo, y ha estado cerca de lograrlo en los últimos años. La búsqueda web de Fast (Alltheweb) puede usar ODP para clasificar automáticamente, admitir búsquedas en Flash y PDF, admitir búsquedas en varios idiomas y también proporcionar búsqueda de noticias, búsqueda de imágenes, videos, MP3 y FTP, y tiene una búsqueda avanzada extremadamente poderosa. funciones. (El 25 de febrero de 2003, Overture adquirió la división de búsqueda en Internet de Fast).

En agosto de 1996, se fundó la empresa sohu para producir catálogos de sitios web chinos. Alguna vez tuvo la reputación de "buscar mapas cuando sales y Sohu en Internet". Con el rápido aumento de los sitios web en Internet, este tipo de directorio de clasificación editado manualmente ya no es adecuado. Sohu lanzó un sitio web independiente de búsqueda de nombres de dominio, "Sogou", en agosto de 2004, autodenominado "motor de búsqueda de tercera generación".

Openfind se fundó en enero de 1998. Su tecnología se originó en el laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán. Openfind comenzó como un motor de búsqueda chino únicamente. En su apogeo, también proporcionó motores de búsqueda chinos para los tres famosos portales Sina, Qimo y Yahoo. Sin embargo, después del año 2000, el mercado se dividió gradualmente entre Baidu y Google. En junio de 2002, Openfind relanzó la versión Beta del motor de búsqueda Openfind basado en el Proyecto GAIS30, lanzó PolyRankTM, anunció que había rastreado un total de 3.500 millones de páginas web y comenzó a ingresar al campo de la búsqueda en inglés.

En enero de 2000, dos ex alumnos de la Universidad de Pekín, Robin Li, el inventor de la patente de análisis de hipervínculos y ex ingeniero senior de Infoseek, y su amigo Xu Yong (becario postdoctoral en la Universidad de California, Berkeley) fundaron Baidu en Zhongguancun, Beijing. La versión Beta del motor de búsqueda Baidu se lanzó en agosto de 2001 (anteriormente, Baidu solo proporcionaba motores de búsqueda para otros portales como Sohu, Sina, Tom, etc. El motor de búsqueda Baidu se lanzó oficialmente el 22 de octubre de 2001). en la búsqueda china. Otras características del motor de búsqueda de Baidu incluyen: instantánea de Baidu, vista previa de la página web/vista previa de todas las páginas web, términos de búsqueda relacionados, sugerencias para corregir errores tipográficos, búsqueda de mp3 y búsqueda en Flash. Después del inicio del Proyecto Blitzen en marzo de 2002, las actualizaciones tecnológicas se aceleraron significativamente. Posteriormente se lanzaron una serie de productos como Tieba, Zhibao, Mapas, Estudios Chinos y Enciclopedia, que fueron muy populares entre los internautas. Cotizó en Nasdaq el 5 de agosto de 2005, con un precio de emisión de 27,00 dólares estadounidenses y nombre en clave BIDU.

El precio de apertura fue de 66,00 dólares y cerró en 122,54 dólares, un aumento del 353,85%, estableciendo un récord para el mayor aumento diario de nuevas acciones cotizadas en el mercado de valores estadounidense en cinco años.

El 23 de diciembre de 2003, la Búsqueda Huicong original operó oficialmente de forma independiente y estableció China Search. En febrero de 2004, China Search lanzó el motor de búsqueda de escritorio Internet Pig 1.0. En marzo de 2006, China Search cambió el nombre de Internet Pig a IG (Inter Gateway).

En junio de 2005, Sina lanzó oficialmente su motor de búsqueda desarrollado de forma independiente "Aiwen".

Modelo de negocio de motores de búsqueda

En los primeros días del desarrollo de los motores de búsqueda, la mayoría de ellos actuaban como proveedores de tecnología para proporcionar servicios de búsqueda para otros sitios web, y los sitios web pagaban a los motores de búsqueda. Más tarde, con el estallido de la burbuja de Internet en 2001, la mayoría de ellos recurrieron al método de clasificación de ofertas.

Los principales modelos comerciales actuales de los motores de búsqueda (PPC de Baidu, AdWords de Google) consisten en colocar anuncios en las páginas de resultados de búsqueda y cobrar a los anunciantes mediante los clics de los usuarios. Este modelo fue propuesto por primera vez por Bill Gross. Fundó GoTo Company en junio de 1998 (más tarde rebautizada como Overture en septiembre de 2001), implementó este modelo, logró un gran éxito y solicitó una patente. Este modelo tiene dos características. Una es el Pago Por Clic. Si el usuario no hace clic, el anunciante no tiene que pagar. El segundo es la clasificación de ofertas, que clasifica los resultados según cuánto pagó el anunciante. En octubre de 2001, Google lanzó AdWords, que también adoptó métodos de pago por clic y de oferta. En 2002, Overture demandó a Google por infracción de patente. En agosto de 2004, y Yahoo! (Yahoo! adquirió Overture en julio de 2003) llegó a un acuerdo y pagó 2,7 millones de acciones ordinarias (menos de 300 millones de dólares estadounidenses) a este último como tarifa de acuerdo.

AdSense es un nuevo método publicitario lanzado por Google en 2003. AdSense ofrece a editores web externos de todos los tamaños acceso a la amplia red de anunciantes de Google. Google coloca anuncios relacionados con el contenido de la página web en estas páginas web de terceros. Cuando los visitantes hacen clic en estos anuncios, el editor de la página web puede obtener ingresos. AdSense es muy popular entre los blogueros. Al mismo tiempo, Google eliminó arbitrariamente algunas cuentas, lo que provocó descontento entre algunas personas. Otros motores de búsqueda han lanzado métodos publicitarios similares. El método publicitario de Yahoo es YPN (Yahoo Publisher Neork). Además de mostrar anuncios relacionados con el contenido en páginas web, YPN también puede mostrar anuncios en suscripciones RSS. El programa de publicidad de Microsoft se llama AdCenter. Baidu también lanzó una promoción temática.

上篇: ¿Cuáles son algunas buenas técnicas de contratación de personal de ventas escolares para la formación profesional contable? 下篇: ¡Quédate en el Hotel Panda y contempla un auténtico circo!
Artículos populares