Hay diferentes métodos de búsqueda de información y cada una funciona de una manera y tiene un propósito y un alcance concreto y propio.
Buscadores:
Los buscadores o motores de búsqueda utilizan tipos de software especiales que localizan e
indexan, en forma automática, las páginas Web y además todos los documentos referenciados en
ellas.
Un buscador está compuesto por cuatro componentes básicos:
un robot,
un motor de indexación,
los índices
un motor de búsqueda.
El robot, también llamado spider, es un programa que se encarga de recorrer la Web obteniendo
información relevante, de cada una de las páginas que visita.
Una vez obtenida la información de la página, debe ser analizada y condensada, para su organización
y su posterior presentación a los usuarios. Esta tarea la realiza el denominado motor de indexación.
La indexación puede efectuarse por palabras claves, que es la forma más común, o por
conceptos. En el caso de hacerlo por palabras claves, algunos buscadores indexan todo el texto del
documento, a excepción de los artículos, preposiciones y otros términos denominados “palabras
vacías”.
Otros motores de búsqueda se limitan a incluir en la indexación a las palabras que más se repiten,
o priorizan los términos que se encuentran en el título, la URL, las cabeceras, los enlaces, los
primeros párrafos y además, las palabras claves incluidas en las etiquetas o tags.
Para facilitar la búsqueda, en la información recolectada, se utilizan estructuras de datos
denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de
documentos relacionados con ella.
El motor de búsqueda es el encargado de procesar las consultas recibidas por los usuarios, para lo
cual recorre los índices inversos buscando los términos relacionados con la consulta y obteniendo
E
los identificadores de los documentos. Finalmente los ordena jerárquicamente y presenta al usuario
los resultados obtenidos.
Este tipo de herramienta, realiza sus búsquedas en sus propios índices, no lo hace directamente
sobre la Web. Esto implica, que los buscadores, solo pueden recuperar una muy pequeña parte
de todo lo que realmente hay en Internet.
Es importante señalar que los motores de búsqueda se diferencian entre sí por diferentes
características como: el volumen y la frecuencia de indexación y el ordenamiento que hacen de la
información encontrada para su presentación.
Algunos son: Google, Lycos, Bing...
Metabuscadores: son “buscadores en buscadores”, es decir, son servidores web que
realizan búsquedas en los índices de un gran número de buscadores y/o directorios,
eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos,
ordenados por relevancia y, en algunos casos, nos indican cuál ha sido el buscador de origen
de dicha información. Cada uno de los motores de búsqueda de los metabuscadores
funciona de una manera distinta, aunque existe un proceso interno común a todos ellos.
Entre los mas importantes están: Metacrawler y Zoo.
Directorios: también denominados buscadores temáticos, organizan la información por medio
de categorías y sub-categorías que registran las direcciones (URL) y una pequeña descripción de
los diferentes sitios que han sido indexados.
Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un
proceso posterior de selección y categorización jerarquizada por parte de los editores.
Los más importantes son: Yahoo, DMOZ, Portal SEO...
Guías: las guías temáticas están conformadas por páginas de recursos web organizadas por áreas del
dominio de diversos especialistas y entidades académicas que asumen la tarea de elaborarlas.
Por lo general incluyen algún mecanismo de búsqueda en sus páginas o en el sitio en general.
Estos directorios anotados suelen ser de gran calidad ya que la selección de recursos, es muy
cuidadosa y su actualización, frecuente.
Software especializado: Para mejorar las búsquedas en la Web puede utilizarse software especializado.
Estos agentes auxiliares se instalan en nuestra PC y operan junto a los navegadores añadiéndoles
ciertas funcionalidades, como el manejo de conceptos para la recuperación de la información.
Un agente de búsqueda es un programa que, imitando el comportamiento de una persona y
actuando de forma autónoma, recorre automáticamente internet aprovechando la estructura de
enlaces de la web. Un agente de búsqueda puede recuperar un documento en particular, o utilizar
algún algoritmo de búsqueda que permita recuperar distintos documentos de la web a los que se
hace referencia en un documento fuente u origen, o conforme a unos criterios predefinidos
anteriormente por sus usuarios.
Un agente de búsqueda puede realizar diversas funciones como:
- Realizar consultas con una velocidad y en un conjunto de fuentes mucho mayor que el
posible para un usuario humano.
- Informar de las actualizaciones que se producen en los sitios web que son de interés.
- Agilizar las descargas que se realizan de internet.
- Eliminación de correo basura o spam
- Búsqueda de noticias conforme a las preferencias.
No hay comentarios:
Publicar un comentario