Hemos escuchado decir que la Deep Web no es más que la parte de Internet oculta, es decir que no ha sido indexada por algún tipo de buscador, por lo que la única forma de llegar a este tipo de información es conociendo la dirección exacta. También oímos que es donde abundan cosas indeseables como el narcotráfico, el crimen organizado, los paquetes de malware y la pedofilia.
Sin embargo, las razones por las cuales alguien podría querer no indexar su información abarcan un gran abanico de posibilidades, de las cuales no todas son necesariamente ilegales. Quizá es solo un tema de privacidad. Y si bien es cierto que en la Deep Web habitan todas esas cosas indeseables, pocos conocen lo que hay realmente allí en detalle y que no todo es tan aterrador.
¿Qué tipos de contenidos hay y en qué idiomas se publican? ¿Cuántos sitios componen la Deep Web? Estas y otras preguntas, hasta hace no tanto, seguían sin respuesta.
Este post no tiene como objetivo valorar a la Deep Web como buena o mala, ni como conveniente o no conveniente, sino contarte qué es lo que hay allí para que estés al tanto y decidas si quieres aventurarte a usarla o prefieres quedarte en la Internet tradicional.
Algunos datos reveladores
Día a día más curiosos deciden entrar, a sabiendas de que pueden estar exponiéndose a distintas amenazas y códigos maliciosos. Sin embargo, poco se sabe del estado actual de la Deep Web.
Según los expertos de Intelliagg y Darksum, la red Tor (también conocida como nivel 4 de la Deep Web) se compone actualmente por aproximadamente 30.000 sitios web “.onion” activos, lo cual la hace mucho más pequeña de lo que se pensaba anteriormente.
Esta investigación arroja datos que se obtuvieron luego de generar algoritmos capaces de recorrer distintos saltos entre sitios, de un modo similar a los robots que utilizan los buscadores para indexar nuevas páginas web.
Respecto a los idiomas utilizados en los sitios, se encontraron al menos 32 diferentes; encabezando el podio con un 76%, como era de suponer, está el inglés, seguido del alemán con solamente un 4%, y por último el chino con 3,7%.
Además, de los sitios identificados durante el período de muestreo, solo se tuvo acceso al 46% del total de sitios en línea, es decir que la mayor parte no se encontró disponible. Esto nos da una pauta de la baja tasa de disponibilidad y la volatilidad de este tipo de portales, los cuales no pueden ser visitados las 24 horas.
Una de las razones se debe a que ciertos usuarios, mediante los complementos necesarios, utilizan computadoras personales para el almacenamiento de sus páginas .onion. De este modo, al apagar sus dispositivos, lógicamente los sitios quedan fuera de línea.
Para complementar el estudio mencionado podemos visitar el portal dnstats.net, el cual muestra información interesante acerca de la disponibildad de algunos de los sitios más utilizados, como vemos en la siguiente imagen:
Esta herramienta de monitoreo es muy útil para comprobar la calidad en cuanto a disponibilidad de los sitios de la Deep Web. De manera gráfica, se puede observar el historial de los sitios seleccionados, una imagen de la página, comentarios y algunas estadísticas.
Otra parte restante de las dominios visitados está relacionada con la infraestructura de paneles de control (C&C), que se utilizan para la administración de botnets financieras y otros códigos maliciosos como el ransomware, aplicaciones para compartir archivos o clientes de chat y foros de con debates políticos.
Al recopilar los resultados obtenidos de manera automática por medio de scripts, se encontró que solamente el 48% de los contenidos es ilegal en la mayoría de los países, aunque con un análisis más profundo realizado de manera manual ese porcentaje subió al 68%.
El siguiente gráfico muestra las temáticas y la cantidad de sitios hallados para cada una:
La última característica que vamos desarrollar está vinculada al tipo de moneda que mayormente se utilizada en esta red. Como es de suponerse, se trata de una criptomoneda, el famoso bitcoin.
A esta moneda, no ligada a ningún país, se la considera experimental aunque curiosamente su valor es de aproximadamente 564 dólares por bitcoin en junio de 2016. Es interesante remarcar que las transacciones realizadas con esta criptomoneda no se pueden revertir, es decir que ninguna entidad financiera podrá interceder en caso de que haya algún conflicto.
Todas las transacciones con bitcoins se recopilan públicamente y permanentemente en la red, es decir que cualquier usuario capacitado puede ver los fondos y transacciones de una dirección bitcoin. Sin embargo, la identidad del usuario que posee la dirección no es conocida, a no ser que sea revelada durante una compra o por alguna otra circunstancia. Esta es una de las razones por la que las direcciones bitcoin suele ser utilizadas solo una vez.
Las amenazas de la Deep Web no son únicas
Muchas veces escuchamos hablar de los peligros que existen en “la Internet oculta”; sin embargo, y sin restarles peligrosidad, debemos decir que los mismos contenidos pueden ser hallados en la Internet convencional. Malware, exploits y diversos tipos de ataques se pueden encontrar en ambas redes, por supuesto en menor medida en la Internet de todos los días.
Lo mismo sucede con contenidos del tipo pornográfico, racial o violento. En cuanto a narcotráfico, investigaciones de entidades gubernamentales descubrieron que en muchos casos se utilizaban redes sociales como YouTube para enmascarar mensajes entre carteles.
Quizá el asunto no radica en la presencia o ausencia de estos contenidos, sino en la facilidad con que son hallados a simple vista.
Por último, podemos mencionar que también en los sitios .onion es posible encontrar vulnerabilidades ligadas a aplicaciones web, y que normalmente estas son utilizadas para subir códigos maliciosos que serán explotados en el navegador del visitante, con el motivo de robar información o inclusive un monedero bitcoin.
Entonces, si bien es cierto que el contenido que existe en este tipo de redes es peligroso, cuando analizamos la cantidad de gente que sufre infecciones, el origen de la mayor parte de las mismas no proviene de la Deep Web.
Es posible que te preguntes cuál es la forma de navegar seguro. Muchos usuarios navegan de manera relativamente anónima y segura, utilizando un liveCd o desde una máquina virtual con sistemas operativos preparados para eso, como es el caso de Tails, el cual aísla el sistema.
En la siguiente imagen puedes ver su sencilla interfaz.
Conclusión
Desde un punto de vista neutral, quizá sea hora de desmitificar a la Deep Web como el lugar donde habitan las cosas malas de Internet, para entender e intentar cambiar el uso que se le suele dar a esta red. Después de todo, según cómo se la use, la navegación anónima puede ser vista como una herramienta de privacidad o como una herramienta más para los cibercriminales.
El no tener control en este tipo de comunicaciones puede ser utilizado indebidamente, aunque en tiempos en donde cada día perdemos un poco de privacidad, dejando huellas de todo tipo en Internet, esta red podría ser valiosa. Una de las razones está ligada a que permite expresar ideas de gente que, por diversas causas políticas o de otra naturaleza, debe permanercer anónima, como por ejemplo el famoso Wikileaks.
Lógicamente la responsabilidad y el buen uso del contenido quedará en manos de los navegantes, quienes serán los que indiquen a futuro el rumbo a seguir.
Si estas interesado en saber más, te recomiendo que leas los Mitos y realidades de la Deep Web.