En mi entrada
anterior les compartí
los resultados de una tarea asignada en el módulo 5 de un MOOC que estoy
cursando y que trata sobre búsquedas en la web. En esta oportunidad les
comparto otra tarea que, si bien corresponde al módulo 4, fue ahora cuando
la pude resolver. Esa flexibilidad en el manejo de la evaluación de buena parte
de los MOOCS es una de las posibilidades que más me gusta. A continuación, los
requerimientos de la tarea: evidenciar lo
aprendido sobre la caracterización de la Web Superficial y la Web Profunda,
socializándolo en una entrada en su blog.
Acá les va mi tarea.
Hablar de la Web es común entre
quienes manejan las TIC; sin embargo, para la gran mayoría hay una sola Web: la
que leemos, vemos y escuchamos, llamada por algunos superficial. Se suele desconocer que existe “otra Web”, conocida
como profunda o invisible que, según distintos autores, representa el 96% de toda
la información disponible en la Web.
La primera vez que escuché hablar de
ese término no me convenció mucho, apliqué una de mis estrategias preferidas
para abordar lo desconocido: preguntarme primero qué es y no cómo o para qué
propósitos se usa, a la manera de Chomsky, de quien les hablaré más adelante.
Para ello revisé algunos conceptos de estructura profunda, particularmente en
un denso trabajo al respecto de Alejandro
Tomasini, de la UNAM de México, que paso a comentarles muy brevemente.
Chomsky, lingüista y psicólogo, estuvo
interesado en los procesos de generación del lenguaje, se refería a un sistema
internalizado de reglas que el hablante maneja inconscientemente y que explica
la operación de su lenguaje. La metáfora para la estructura profunda en su
programa es la que está “debajo”.
Rusell, matemático y filósofo, se
motivó por el abordaje lógico y epistemológico, decía que el lenguaje tenía
enigmas y paradojas que, para ser resueltas, se debían estudiar desde otro
lenguaje que para él era la lógica. La lógica permitía poner al descubierto
proposiciones implicadas o encubiertas. La metáfora para la estructura profunda
en su programa es la que está “en el interior de”.
Wittgenstein, filósofo, matemático,
lingüista y lógico, señalaba que el lenguaje es complejo, que hay enigmas que
subyacen a la explicación de su funcionamiento, un sistema de regulaciones no
explícitas, no perceptibles directamente, pero que pueden ser “inspeccionables”,
pues forman parte del lenguaje en uso. Para realizar la inspección, no se sale
del lenguaje natural, no recurre ni a hipótesis ni a la lógica, sino al
desmontaje del marco o trama de relaciones entre las proposiciones que integran
nociones como conocer, dudar, tener certeza. Para este autor no hay lenguaje
privado, cualquier hablante puede acceder y rastrear la estructura profunda una
vez que aprenda a traspasar sus límites, sus fronteras. No se trata entonces de
algo que está “debajo”, tampoco que está “en el interior de”, sino de algo que
“es necesario comprender”. Señala el referido Alejandro Tomasini que las dos
primeras expresiones son equívocas.
A continuación se presenta la imagen
más común que se utiliza en la Web para ilustrar la llamada Web profunda. Nótese
que es claramente chomskyana y ruselliana, por lo de “debajo de” y “en el
interior de”, y wittgensteiniana por la noción de límites o fronteras que
pueden ser traspasados.
Ahora bien, ¿qué derivé de esta lectura
y del estudio de los materiales del MOOC?
- Validé mi postura referida a que llamar a esa “otra Web” profunda o invisible no parecía muy acertado, pues, a mi criterio no es ni profunda, ni invisible, no “está debajo”, ni “dentro de”, sin embargo, hasta ese momento no tenía mejor opción para denominarla.
- Encontré en los materiales del MOOC la opinión de Lluis Codina que me resolvió el problema, el señala que la “Internet invisible es un nombre claramente inadecuado para referirse al sector de sitios y de páginas web que no pueden indizar los motores de búsqueda de uso público. Debería denominarse, en realidad, la web "no indizable", lo cual es un término mucho más adecuado”.
- Aprendí que la información es invisible sólo a los robots de los buscadores conocidos, pues no está indizada por éstos, sus URL no son fijas, se construyen en el mismo instante, son temporales y desaparecen una vez hecha la consulta. Esa característica hace que la web no indizada se preste para lamentables actos ilegales como la trata de personas, pornografía infantil, negocios turbios que prefiero no comentar, visualización de imágenes crudas producto de delitos y accidentes, por lo que también la denominan la Web oscura. Hasta ahora eso era lo único que conocía de la llamada Web profunda.
- En los materiales del MOOC tomé contacto con Sherman y Price, quienes identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca (the opaque Web), la Web privada (the private Web), la Web propietaria (the proprietary Web) y la Web realmente invisible (the truly invisible Web).
- Aprendí también que existe un extenso y valioso material no indizado, a continuación les comparto algunos sitios muy interesantes que alcancé a revisar:
- www.Infoplease.com recoge los materiales de la conocida enciclopedia Columbia.
- http://vlib.org/ Virtual Library, el catálogo más antiguo en la web y fue iniciado por Tim Berners-Lee, el creador de la web.
- www.DeepWebTech.com ofrece cinco motores de búsqueda para temas específicos que abarcan la ciencia, medicina y negocios.
- www.techxtra.ac.uk centra su información, en ingeniería, matemáticas e informática. Contiene revistas gratuitas especializadas de ingeniería, documentos técnicos, descargas y podcasts.
- http://lp.espacenet.com/singleLineSearch?locale=es_LP Latipat, agrega resultados de patentes de países de Latinoamérica, España y Portugal.
- http://www.brightplanet.com/completeplanet/ Complete planet, una de las más viejas puertas de acceso a la Web profunda. Un directorio con más de 70.000 bases de datos y recursos.
Los invito a continuar
profundizando en este interesante tema.