CSN El subsuelo de internet - Alfa 49 Revista Alfa

Skip to Content

Your version of Internet Explorer is not adequate for correct display of this website. You must use Internet Explorer 9 or better.

Accept

Contenido principal

Alfa 49

DEEP WEB: el subsuelo de internet

Mostramos las claves científicas del envejecimiento para ralentizar, e incluso prevenir, su aparición y desarrollo. Nuevos métodos que buscan no solo envejecer más lentamente sino hacerlo saludablemente. Explicamos también qué son esas "tierras raras" que contienen los dispositivos electrónicos que utilizamos profusamente y sus propiedades que las convierten en bienes muy preciados.

Precisamente, los mencionados dispositivos hacen posible la navegación por los sitios más conocidos de la red pero la mayor parte de internet no la conforman los portales y  buscadores más habituales, sino la llamada Deep Web, el conjunto de millones de páginas invisibles que se ocultan en la red y que ofrecen privacidad y anonimato a los usuarios, además de un rincón, la Dark Web, donde se llevan a cabo actividades ilegales prácticamente indetectables.

A través del resto de reportajes paseamos por el permafrost, una capa de suelo que ha permanecido a una temperatura bajo cero durante miles de años y que actualmente está sufriendo los efectos del cambio climático. El marco de la transición ecológica que la humanidad necesita para combatir el cambio global provocado por los combustibles fósiles, incluimos un reportaje sobre el hidrógeno, una opción sostenible para mover los vehículos, dada su alta eficiencia energética y que no emite contaminantes.

Back

El subsuelo de internet

El subsuelo de internet La web profunda, la que se halla debajo de la capa superficial donde llegan buscadores como Google, no es solo lo que nos han contado: además de una pequeñísima parte más oscura —la Dark Web, asociada sobre todo a actividades ilegales—, la mayor parte es utilizada a diario. Cuentas bancarias, redes sociales o intranets son algunos ejemplos entre las millones de páginas invisibles que se ocultan en la red, y que también sirven para posibilitar privacidad y anonimato en países con regímenes que coartan la libertad.  Texto: Patricia Ruiz Guevara | Periodista de ciencia 

Cuando un internauta comienza a navegar por la red y abre un buscador web como Google, no es consciente de las conexiones que van a realizarse para que su búsqueda culmine con éxito. Comprar algo en una tienda digital, corroborar una información o encontrar el próximo vuelo u hotel son acciones que comienzan con un tecleo. Por ejemplo, si buscamos la palabra ‘búho’, Google nos devuelve 23.700.000 resultados de páginas. Parecen muchas, pero en realidad conforman una parte no tan grande de la web: es la llamada web superficial o clear web, esa que todos conocemos y usamos a diario. Estas páginas están indexadas, es decir, son encontrables a través de motores de búsqueda. Por eso acuden a nuestra llamada cuando tecleamos. Hay otras que no. 

Más abajo de esa web superficial, hay otra gran parte de internet que se conoce como Deep Web o web profunda. Allí se encuentran algunas de las cosas que suelen aparecer en los medios de comunicación —actividades delictivas, tráfico de armas, espionaje, blanqueo de dinero—, pero también muchísimas otras. De hecho, las primeras representan una parte ínfima frente a las que encontramos si excavamos un túnel subterráneo y digital para llegar a las verdaderas profundidades de la red.

Las primeras redes de comunicación entre ordenadores nacieron en los años 60 en el Massachusetts Institute of Technology. En 1981 se definieron los protocolos de comunicaciones actuales de internet, en 1989 el físico Tim Berners-Lee, con 34 años, inventó la World Wide Web y en 1991 publicó la primera página web. Desde entonces, el número de ellas no ha dejado de crecer de manera (casi) exponencial. El hito de mil millones se alcanzó en septiembre de 2014 y fue tuiteado y confirmado por el propio Berners-Lee a partir de datos de Internet Live Stats, que contabiliza en tiempo real los movimientos en la red. A finales de enero de 2022 había ya 1.921.931.574 sitios web online. Visibles.

Conviene diferenciar entre internet y web. “Desde el punto de vista técnico, internet es la infraestructura, un conjunto de redes interconectadas, de protocolos de comunicación y procesos”, explica José M. Barceló, profesor del Departamento de Arquitectura de Computadores de la Universidad Politécnica de Cataluña (UPC). La web son los contenidos. Así, a través de la WWW accedemos a ellos, distribuidos por todo el mundo, pero ¿cómo encontrarlos? “Tras el nacimiento de internet, más y más personas pudieron alojar contenido y ofrecer acceso a él. Pero había tanta información que hubo que crear una manera de buscarlo. Es como una biblioteca donde hay cada vez más libros; si las estanterías no estuvieran ordenadas sería muy difícil encontrar uno concreto”, explica desde Kuala Lumpur Josep Curto, profesor de la Universitat Oberta de Catalunya (UOC) y fundador de AthenaCore. Así es como el subsuelo empieza a hacerse más profundo e invisible y esos casi dos mil millones de sitios web se quedan en la superficie. 

De la web profunda...

Entre todos esos contenidos empezaron a diferenciarse dos tipos: los que son indexables (esos 1.921.931.574 que van fluctuando) y los que no. “Lo que hace un motor de búsqueda es ir buscando servidores donde están los recursos indexables”, indica Barceló. Por ejemplo, Google. El gigante tecnológico lo explica en su web, y replica la analogía de la biblioteca: “Incluso antes de que empieces a buscar, en Google organizamos la información sobre las páginas web en el índice de búsqueda. Este índice es como una biblioteca, pero contiene más información que todas las bibliotecas del mundo. (...) Cientos de miles de millones de páginas web que, juntas, superan los 100.000.000 de gigabytes. Es similar al índice analítico de un libro: dispone de una entrada para cada palabra de cada página web que indexamos. Al indexar una página web, añadimos al índice todas las palabras que contiene”.

¿Qué pasa con los contenidos no indexables? En 2001, Michael Bergman dio nombre a todo lo que es invisible a los ojos de los motores de búsqueda tradicionales (Google, Yahoo!, Bing, DuckDuckGo...) y de la mayoría de usuarios de internet: había nacido la Deep Web. 

Como recoge el informe de buenas prácticas Principios y recomendaciones básicas en Ciberseguridad del Centro Criptológico Nacional de España, la principal razón de la existencia de la internet profunda es la imposibilidad de que los motores de búsqueda encuentren e indexen gran parte de la información existente en ella. Pero también hay contenidos no indexados deliberadamente. “Cuando queremos que se encuentre algo, lo damos de alta en los navegadores para que actúen los mecanismos de búsqueda e indexación de forma periódica. Pero algunos contenidos están en la Deep Web porque el creador no quiere que sean encontrados”, indica Curto. Llega el momento de coger impulso y excavar aún más hondo, donde se esconden los últimos flujos de información: cuando hablamos de casos de uso dentro del marco de la ilegalidad, hablamos de la Dark Web. 

... a la más oscura

“Para comprender el funcionamiento de Tor, debemos tener en cuenta que las conexiones que realizamos suelen ser directas: se traza una ruta del ordenador al router, del router a nuestro proveedor de internet y de ahí al servidor de la página web que queremos visitar”, explica Mercedes Muñoz, ingeniera de ciberseguridad en Telefónica Tech. Pero Tor usa el “enrutamiento de cebolla”, de ahí su nombre. “Se puede comparar con una malla, en la que cada nodo es un dispositivo co“Si la Deep Web hace referencia a todo el contenido de internet que no está indexado por los buscadores tradicionales y que, por lo tanto, está oculto, la Dark Web o web oscura hace referencia a una parte específica de la Deep Web, en la que su contenido sí puede considerarse peligroso y más difícil de acceder”, resume Marcos Gómez, subdirector de Servicios de INCIBE-CERT, el centro de respuesta a incidentes de seguridad del Instituto Nacional de Ciberseguridad. Son términos, por lo tanto, muy diferentes, y “no deben usarse como sinónimos”. La web oscura, ese subconjunto de la web profunda, solo es accesible utilizando determinados navegadores web, las darknets o redes oscuras. Freenet e I2P son dos de ellas, pero la más conocida es Tor (The Onion Router o el router cebolla), un proyecto diseñado e implementado por la Marina de los Estados Unidos en 2002. El objetivo era fortalecer las comunicaciones por internet y garantizar el anonimato y la privacidad. 

“Para comprender el funcionamiento de Tor, debemos tener en cuenta que las conexiones que realizamos suelen ser directas: se traza una ruta del ordenador al router, del router a nuestro proveedor de internet y de ahí al servidor de la página web que queremos visitar”, explica Mercedes Muñoz, ingeniera de ciberseguridad en Telefónica Tech. Pero Tor usa el “enrutamiento de cebolla”, de ahí su nombre. “Se puede comparar con una malla, en la que cada nodo es un dispositivo conectado a esta red. En Tor, no hay una conexión directa, sino que se realizan al menos tres saltos entre los nodos de la red, que se corresponden con servidores gestionados por diferentes personas y organizaciones de todo el mundo”, detalla. 

Una vez instalado Tor, el paso natural es entrar en The Hidden Wiki (la wiki oculta), un listado distribuido en categorías donde están los enlaces a las páginas invisibles. Los dominios de Tor acaban en .onion y suelen ser ininteligibles, para aumentar la dificultad de su rastreo. “Hace unos años se mejoró el protocolo porque las URL eran muy cortas; se decidió hacerlas más largas y temporales”, explica la ingeniera. Por ejemplo, http://r6rfy5zlifbsiiym.onion/ es una librería de cómics. Esta navegación es más segura y las búsquedas son mucho más difíciles de rastrear. Por eso, no solo se utiliza con fines delictivos; también lo hacen usuarios que quieren proteger su privacidad. “Hay empresas que la utilizan porque implica un sistema de comunicaciones muy seguro”, explica Barceló. 

De hecho, la línea entre web profunda y web oscura puede ser complicada de entrever. Por ejemplo, “la intranet de mi empresa es Deep Web y hace falta una aplicación para entrar en ella, pero no por eso es Dark Web”, explica Jorge Louzao, hacker ético y colaborador de C1be3wall Academy de la Escuela de la Policía Nacional. En la compañía para la que trabaja, una de sus misiones es rastrear la Deep Web para verificar que no se publica información de la empresa. “Cuando hay un ataque y filtran información, acaba ahí. Hay casos de chantaje y amenazas antes de liberar la documentación, dinero mediante”, explica Louzao. 

Uso cotidiano

La Deep Web son secciones de las páginas web que no pueden ser indexadas, pero “también aquellas que requieren de un mecanismo de autenticación para acceder, por lo que se presenta en la vida cotidiana”, explica desde Bogotá Diego Espitia, ingeniero electrónico, hacker y consultor sénior de seguridad en ElevenPaths, el equipo de ciberseguridad de Telefónica Tech en Colombia. Son las ocasiones en las que usamos usuario y contraseña, como “cuando accedes al correo electrónico desde el móvil, estás leyendo mensajes, consultas tu servicio médico o accedes a algún servicio del Estado. En estos casos, se busca adrede que no sean contenidos encontrables. La página web es pública pero lo demás no es accesible”, explica Barceló. 

Publicaciones científicas, documentos gubernamentales, ficheros almacenados en plataformas de almacenamiento en la nube (como Dropbox o Google Drive), foros privados y otras bases de datos privadas. Todo forma parte de la web profunda y solo es necesario tener el enlace y las credenciales para acceder. Como se deduce, “muchos de los contenidos que podemos encontrar en la Deep Web son legítimos y no son peligrosos, pero esta parte de internet sí es utilizada para fines no tan lícitos, cercanos a la cibercriminalidad o totalmente ilegítimos, sobre todos aquellos que se encuentran en la Dark Web”, recuerda Marcos Gómez del INCIBE.

El portal de noticias sobre gadgets y tecnología Xataka hizo un par de incursiones con el objetivo de relatar qué se encontraban (“Una semana en la Deep Web. Esto es lo que me he encontrado” y “Una semana en la Deep Web, tres años después”), y hallaron cosas inimaginables y otras al límite de lo inmoral: gente que busca a alguien que hackee sus notas de la universidad; patentes de energía alternativa; venta de armas nucleares, drogas y medicamentos ilegales; mercenarios; falsificaciones; pornografía en todos sus posibles escenarios; compraventa de personas y órganos; y cientos de teorías conspiranoicas. También información curiosa e interesante, como Hidden Answers (respuestas escondidas), una especie de Quora o Reddit, y hasta una emisora de radio digital propia: Deep Web Radio.  

Pero, en esencia, la principal ventaja que ofrece utilizar las profundidades de la web es “preservar la privacidad durante la navegación, por ejemplo, para mantener el anonimato en sitios web de opinión; compartir información libremente sin que se conozca nuestra identidad; y acceder a contenidos que no están disponibles en nuestro país”, señala Gómez. Esto nos lleva a algunas situaciones muy particulares. “La Darknet se usa mucho en periodismo y personal de ONG en zonas de conflicto. Es una manera de conectarte a internet de forma más segura que la normal”, revela el hacker ético Jorge Louzao. 

En países con regímenes como China, con su gran cortafuegos, que censura y vigila internet, “posibilita saltarse estas normas y poder acceder a otros portales de información y plataformas: te conectas a Tor, y tu conexión va saltando por sus capas, por esos nodos de salida con los que el firewall chino no va a entender tu tráfico ni a poder detenerlo”. 

Así, “las personas que se encuentran en países bajo dictaduras y con limitaciones pueden conectarse sin restricciones y comunicarse con el resto del mundo. Es otra herramienta más que, según el uso que se le dé, puede suponer un beneficio o un problema para la sociedad”, señala Mercedes Muñoz, de Telefónica Tech. La experta recalca que, pese a la fama que se le ha conferido, “navegar en la Deep Web en absoluto es ilegal, también es una forma de reportar sucesos en diferentes países y compartir contenido”.  

El futuro de la web

Una cosa está clara: al navegar por las web dejamos mucha información en ellas. Especialmente en las redes sociales, que han creado una forma especial de indexación: “Tienen sus propios jardines de contenido indexado: algunos se pueden encontrar con buscadores, pero otros están vallados dentro de la red social”, explica Curto. Con tantos datos sensibles, “las utilidades son realmente infinitas en términos de procesamiento de información y de mejoras en los servicios, y de esto se nutren muchas de las grandes empresas del mundo digital”, señala Diego Espitia, de Telefónica Tech. El experto pone el ejemplo de Google, que empezó siendo un buscador y acabó creando servicios de correo electrónico, mapas y muchos más servicios. “Desde el punto de vista del aprovechamiento de datos, se puede mejorar la vida de los ciudadanos con datos anonimizados que son extraídos de la Deep Web”, analiza Espitia. El profesor de la UPC José M. Barceló añade la inteligencia artificial (IA) a la ecuación: “La evolución del mundo de internet está en la IA, las empresas están analizando todos los datos de la web visibles para ofrecer servicios personalizados”.

Pero esta no es la única tendencia. El nombre del padre de la World Wide Web vuelve a aparecer, treinta años después. Tim Berners-Lee, ahora con 66 años, quiere volver a revolucionar internet. Para ello ha creado Inrupt, una empresa enfocada en la identidad y privacidad digital, que acaba de conseguir una financiación de 30 millones de dólares. “Está trabajando en un proyecto para darle una vuelta de tuerca al concepto de la web y convertirlo en algo más privado y seguro, donde tengamos el control de nuestros datos y decidamos con quién y para qué los compartimos”, señala Jorge Louzao Penalva. Algo que choca directamente con la situación actual de redes sociales y explotación de los datos por los gigantes tecnológicos. 

En un momento bisagra, en el que todas las tecnologías están bullendo y empezando a implementarse de manera real, la web es el primer reducto que se debe abordar de manera responsable para impactar positivamente en la sociedad. Berners-Lee lo dijo muy claramente en Boston Magazine: “Lo importante es que, por primera vez, los usuarios (y no las grandes empresas tecnológicas) tendremos el control de nuestros datos, lo que significa que los sitios web y las aplicaciones se crearán para beneficiarnos a nosotros y no a ellos”.