martes, 7 de julio de 2015

¿HAS OÍDO HABLAR DE LA WEB PROFUNDA? OTRA TAREA DEL MOOC

En mi entrada anterior les compartí los resultados de una tarea asignada en el módulo 5 de un MOOC que estoy cursando y que trata sobre búsquedas en la web. En esta oportunidad les comparto otra tarea que, si bien corresponde al módulo 4, fue ahora cuando la pude resolver. Esa flexibilidad en el manejo de la evaluación de buena parte de los MOOCS es una de las posibilidades que más me gusta. A continuación, los requerimientos de la tarea: evidenciar lo aprendido sobre la caracterización de la Web Superficial y la Web Profunda, socializándolo en una entrada en su blog.

Acá les va mi tarea.

Hablar de la Web es común entre quienes manejan las TIC; sin embargo, para la gran mayoría hay una sola Web: la que leemos, vemos y escuchamos, llamada por algunos superficial. Se suele desconocer que existe “otra Web”, conocida como profunda o invisible que, según distintos autores, representa el 96% de toda la información disponible en la Web.

La primera vez que escuché hablar de ese término no me convenció mucho, apliqué una de mis estrategias preferidas para abordar lo desconocido: preguntarme primero qué es y no cómo o para qué propósitos se usa, a la manera de Chomsky, de quien les hablaré más adelante. Para ello revisé algunos conceptos de estructura profunda, particularmente en un denso trabajo al respecto de Alejandro Tomasini, de la UNAM de México, que paso a comentarles muy brevemente.

Chomsky, lingüista y psicólogo, estuvo interesado en los procesos de generación del lenguaje, se refería a un sistema internalizado de reglas que el hablante maneja inconscientemente y que explica la operación de su lenguaje. La metáfora para la estructura profunda en su programa es la que está “debajo”.

Rusell, matemático y filósofo, se motivó por el abordaje lógico y epistemológico, decía que el lenguaje tenía enigmas y paradojas que, para ser resueltas, se debían estudiar desde otro lenguaje que para él era la lógica. La lógica permitía poner al descubierto proposiciones implicadas o encubiertas. La metáfora para la estructura profunda en su programa es la que está “en el interior de”.

Wittgenstein, filósofo, matemático, lingüista y lógico, señalaba que el lenguaje es complejo, que hay enigmas que subyacen a la explicación de su funcionamiento, un sistema de regulaciones no explícitas, no perceptibles directamente, pero que pueden ser “inspeccionables”, pues forman parte del lenguaje en uso. Para realizar la inspección, no se sale del lenguaje natural, no recurre ni a hipótesis ni a la lógica, sino al desmontaje del marco o trama de relaciones entre las proposiciones que integran nociones como conocer, dudar, tener certeza. Para este autor no hay lenguaje privado, cualquier hablante puede acceder y rastrear la estructura profunda una vez que aprenda a traspasar sus límites, sus fronteras. No se trata entonces de algo que está “debajo”, tampoco que está “en el interior de”, sino de algo que “es necesario comprender”. Señala el referido Alejandro Tomasini que las dos primeras expresiones son equívocas.

A continuación se presenta la imagen más común que se utiliza en la Web para ilustrar la llamada Web profunda. Nótese que es claramente chomskyana y ruselliana, por lo de “debajo de” y “en el interior de”, y wittgensteiniana por la noción de límites o fronteras que pueden ser traspasados.


Ahora bien, ¿qué derivé de esta lectura y del estudio de los materiales del MOOC? 

  • Validé mi postura referida a que llamar a esa “otra Web” profunda o invisible no parecía muy acertado, pues, a mi criterio no es ni profunda, ni invisible, no “está debajo”, ni “dentro de”, sin embargo, hasta ese momento no tenía mejor opción para denominarla.
  • Encontré en los materiales del MOOC la opinión de Lluis Codina que me resolvió el problema, el señala que la “Internet invisible es un nombre claramente inadecuado para referirse al sector de sitios y de páginas web que no pueden indizar los motores de búsqueda de uso público. Debería denominarse, en realidad, la web "no indizable", lo cual es un término mucho más adecuado”.
  • Aprendí que la información es invisible sólo a los robots de los buscadores conocidos, pues no está indizada por éstos, sus URL no son fijas, se construyen en el mismo instante, son temporales y desaparecen una vez hecha la consulta. Esa característica hace que la web no indizada se preste para lamentables actos ilegales como la trata de personas, pornografía infantil, negocios turbios que prefiero no comentar, visualización de imágenes crudas producto de delitos y accidentes, por lo que también la denominan la Web oscura. Hasta ahora eso era lo único que conocía de la llamada Web profunda.
  • En los materiales del MOOC tomé contacto con Sherman y Price, quienes identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca (the opaque Web), la Web privada (the private Web), la Web propietaria (the proprietary Web) y la Web realmente invisible (the truly invisible Web).
  • Aprendí también que existe un extenso y valioso material no indizado, a continuación  les comparto algunos sitios muy interesantes que alcancé a revisar:
    • www.DeepWebTech.com ofrece cinco motores de búsqueda para temas específicos que abarcan la ciencia, medicina y negocios.
    • www.techxtra.ac.uk centra su información, en ingeniería, matemáticas e informática. Contiene revistas gratuitas especializadas de ingeniería, documentos técnicos, descargas y podcasts.

Los invito a continuar profundizando en este interesante tema.

2 comentarios:

  1. Hola. tienes toda la razón que hay más vida y con fuentes más interesantes en el 'internet más profundo'. Lo difícil es llegar y localizar esos datos. Tu haces un gran trabajo. Gracias por compartir. Seguimos en contacto

    ResponderEliminar