Desarrollan una IA que rastrea usuarios de YouTube por sus comentarios y predice su ubicación

La plataforma, surgida de un proyecto de videojuegos, utiliza modelos de lenguaje avanzados para deducir la residencia y orientación política de los usuarios
Desarrollan una IA que rastrea usuarios de YouTube por sus comentarios y predice su ubicación
Isotipo de YouTube en 3D I RUBAITUL AZAD

Si alguna vez has dejado un comentario en un vídeo de YouTube, la web YouTube-DataTools asegura que podría encontrar cada mensaje que hayas escrito en cualquier vídeo que hayas visto. Posteriormete, con el uso de la inteligencia artificial podría construir un perfil con tus datos y adivinar dónde vives, qué idiomas hablas y cuáles podrían ser tus ideas políticas.

 

El servicio en cuestión representa la evolución más reciente de una serie de herramientas web que comenzaron investigando nombres de usuario en el juego League of Legends. Ahora, esta plataforma emplea un modelo de lenguaje grande (LLM) modificado, desarrollado por la empresa Mistral, para generar informes detallados sobre usuarios de YouTube basándose en sus conversaciones. 

 

Los Términos de Servicio del sitio son explícitos desde el primer párrafo: "El servicio se distribuye únicamente a investigadores profesionales con licencia y a las fuerzas del orden. No se permite la suscripción a personas no profesionales". Sin embargo, esta afirmación contrasta con la facilidad con la que, en la práctica, cualquier individuo puede  acceder al servicio. Solo es necesaria una tarjeta de crédito para pagar alrededor de 20 dólares al mes y una dirección de correo electrónico. 

 

Este desarrollo no es un hecho aislado; forma parte de una tendencia creciente en el campo de la inteligencia de código abierto (OSINT), donde herramientas cada vez más sofisticadas utilizan información disponible públicamente en internet para construir perfiles detallados de individuos.

Manos femeninas en la computadora portatil

Alcance inquietante

YouTube-DataTools, creada por un desarrollador con experiencia en OSINT, se suma a un arsenal de plataformas similares que están redefiniendo los límites de lo que se puede descubrir sobre una persona a través de su huella digital

 

Un ejemplo paralelo es GeoSpy, una herramienta de IA que puede geolocalizar fotografías con una precisión sorprendente basándose en elementos visuales como la vegetación o la arquitectura. Estas herramientas, aunque presentadas como valiosas para profesionales como la policía o los investigadores privados, plantean un dilema ético fundamental: la facilidad con la que pueden ser utilizadas para la vigilancia sin consentimiento o, peor aún, para el acoso. 

 

El desarrollador ha reconocido los riesgos inherentes a la privacidad que conlleva su creación, pero insiste en el valor de la herramienta para profesionales legítimos. Pero la promesa de un "uso responsable" a menudo choca con la realidad de la accesibilidad y el potencial de abuso por parte de terceros malintencionados. 

 

Este debate subraya una cuestión más amplia sobre la ética de la extracción de datos públicos y el potencial de su uso en contextos que van más allá de lo previsto inicialmente. La misma persona detrás de YouTube-DataTools ha desarrollado herramientas similares para otras plataformas como Twitch, Kick y sitios de contenido para adultos, lo que refuerza la necesidad de un escrutinio constante sobre la forma en que se recopila y utiliza la información en el vasto ecosistema digital.

Zulfugar karimov B9klYJqQ4DU unsplash
YouTube, al igual que otras plataformas digitales, prohíbe explícitamente el "scraping" masivo de datos I ZULFUGAR KARIMOV

Lanzada hace apenas una semana, YouTube-DataTools es una extensión directa de LoL-Archiver, la herramienta original. Pero no es la única. Su desarrollador también ha creado nHentai-Archiver, capaz de proporcionar un historial completo de comentarios de un usuario en el popular sitio de manga para adultos. 

 

Para los entusiastas del streaming, existen Kick-Tools, que puede generar historiales de chat o de prohibiciones de un usuario en la plataforma Kick, y Twitch-Tools, que organiza el historial de chat de una cuenta por fecha y permite clasificarlo por los canales en los que el usuario ha interactuado. 

 

Test del servicio

Para poner a prueba el servicio, se introdujo de forma aleatoria el nombre de un usuario que hubiera comentado algún vídeo de YouTube. En cuestión de segundos, la plataforma encontró docenas de sus comentarios en varios videos y generó un párrafo de análisis mediante inteligencia artificial

 

El informe resultante sugería, por ejemplo: "Posible ubicación/región: la presencia de comentarios en italiano y referencias a 'X Factor Italia' y cocina italiana sugieren una asociación con Italia". Continuaba con inferencias sobre sus opiniones: "Opiniones Políticas/Sociales/Culturales: algunos comentarios reflejan un nivel de crítica hacia entrevistadores y normas sociales (por ejemplo., comentarios sobre la masculinidad), lo que indica un compromiso con discusiones culturales contemporáneas. Sin embargo, no se expresa una postura abiertamente política".

 

Según el sitio, la herramienta tiene acceso a una base de datos de "1.400 millones de usuarios y 20.000 millones de comentarios". Aunque impresionante, cabe destacar que este conjunto de datos no es exhaustivo, dado que YouTube cuenta con más de 2.500 millones de usuarios a nivel global.

 

Batalla legal y técnica contra el "scraping"

La operación de herramientas como YouTube-Tools se sitúa en una zona gris legal y técnica. Por un lado, YouTube, al igual que otras plataformas digitales, prohíbe explícitamente el "scraping" masivo de datos en sus términos de servicio. 

 

Este tipo de actividades no solo infringen los derechos de propiedad intelectual de los comentarios (que suelen estar cubiertos por derechos de autor), sino que también representan una violación directa de las políticas de privacidad, especialmente en regiones con regulaciones estrictas como el Reglamento General de Protección de Datos (GDPR) de la Unión Europea. La recopilación y el procesamiento de datos personales sin una base legal clara, como el consentimiento explícito, pueden acarrear graves consecuencias legales.

Rachit tank VLzAkbs5afg unsplash
 I RACHIT TANK

Por otro lado, la infraestructura de YouTube está diseñada con mecanismos anti-bot y límites de tasa para detectar y bloquear el "scraping" automatizado. Sin embargo, los desarrolladores de estas herramientas buscan constantemente formas de eludir estas defensas, utilizando técnicas como la rotación de proxies para evitar ser detectados y bloqueados. 

 

Este constante choque entre las plataformas que buscan proteger sus datos y los desarrolladores de herramientas de extracción subraya la complejidad de mantener la integridad de los datos.

 

IA en YouTube: protección vs. invasión

Irónicamente, mientras herramientas externas explotan los datos de los usuarios, YouTube también ha invertido significativamente en sus propias herramientas de IA para proteger a sus creadores y la integridad de su plataforma. 

 

La IA de YouTube se utiliza para detectar deepfakes, identificar usos no autorizados de contenido y salvaguardar la propiedad intelectual de los creadores. Este contraste resalta la dualidad de la inteligencia artificial: una tecnología con un inmenso potencial tanto para la protección como para la invasión de la privacidad.

 

En última instancia, el surgimiento de YouTube-Tools y herramientas similares enfatiza la creciente falta de anonimato online y la necesidad urgente de una mayor concienciación sobre cómo se utilizan nuestros datos digitales. La línea entre la información pública y la privacidad personal se difumina cada vez más, y exige un debate continuo y marcos regulatorios sólidos para proteger a los usuarios en un panorama digital en constante evolución.

Desarrollan una IA que rastrea usuarios de YouTube por sus comentarios y predice su ubicación

Te puede interesar