viernes, marzo 19, 2004

La Internet oculta

EL UNIVERSALLunes 08 de marzo de 2004

BrightPlanet, en un estudio denominado "The ‘Deep web’: Surfacing Hidden Value"
(www.brightplanet.com/technology/deepweb.asp), define la Web profunda como el conjunto
de documentos existentes a los que no tienen acceso los motores de búsqueda convencionales. La razón es que utilizan herramientas de software denominadas spiders y crawlers para detectar y registrar la existencia de nuevas páginas, pero en esta tarea de rastreo se pierden muchos contenidos valiosos.

Lo más usual, sin embargo, es que los motores de búsqueda ni siquiera tengan en sus índices una enorme cantidad de bases de datos de universidades, centros de investigación, organismos de la administración pública y demás. Cuando los buscadores se enfrentan
con este tipo de bases de datos, se limitan a
registrar la página Web inicial y no penetran en sus vastos contenidos.

Sherman y Price (invisible-web.net) indican cuatro tipos de contenidos invisibles en el ciberespacio, que denominan como la Web opaca, la privada, la propietaria y la realmente invisible:

1. La Web opaca se compone de archivos que podrían estar incluidos en los índices de los motores de búsqueda, pero no lo están debido a razones de extensión de la indización.

2. La Web privada consiste de sitios que podrían estar indexados en los motores de búsqueda, pero que son excluidos en forma deliberada, porque las páginas
están protegidas por contraseñas o porque contienen un campo "noindex" para no permitir que el motor de búsqueda vaya más allá.

3. La Web propietaria incluye páginas en las que es necesario registrarse para tener acceso al contenido, ya sea en forma gratuita o pagada.

4. La Web realmente invisible se compone de páginas que no pueden ser indexadas por limitaciones técnicas de los buscadores.

De acuerdo con Pilar María Moreno Jiménez,
bibliotecaria académica y profesora de El Colegio de México, autora del documento "Estrategias y mecanismos de búsqueda en la Web invisible"
(http://biblio.colmex.mx/recelec/web_invisible.htm)
las estrategias de búsqueda por parte de los usuarios deben adecuarse a sus necesidades específicas de información. Es decir, no hay una sola herramienta ni una única forma que asegure encontrar resultados óptimos en todos los casos.

(HSZ)






Día dos

This page is powered by Blogger. Isn't yours?