Los chilenos que cazan bots en Twitter

En medio de la era de las fake news y las identidades falsas, un grupo de ingenieros e ingenieras chilenas creó BotCheckerCL, una cuenta que se encarga de identificar cuentas automatizadas, conocidas como bots. En entrevista exclusiva con POUSTA ycon reserva de identidad, nos contaron porqué decidieron unirse en esta gigantesca tarea tecnológica, qué hay detrás del funcionamiento de estas cuentas y si ven posible continuar después del plebiscito del próximo 4 de septiembre.

Hace unos días la BBC publicó un artículo titulado ‘La brutal desinformación sobre la nueva Constitución propuesta para Chile (y algunas de las confusiones más difundidas)’. Nuestro país, en medio de este contexto polarizado, estaría viviendo una contaminación informativa nunca antes vista, llena de fake news y humanoides falsos que las difunden.

Y derribar a estos últimos es uno de los trabajos de BotCheckerCL en Twitter. Allí, sus publicaciones son precisas: primero hacen mención del hashtag que se analizó, cuántas interacciones tuvo y el número de cuántas cuentas son bots y cuántas no; además de identifican cuál fue el perfil que lo utilizó por primera vez. Después viene un índice donde, en una escala de 1 a 5, apuntan qué actividad relacionada al hashtag está automatizada. Los tweets están acompañados de un mapa que analiza la difusión y vínculos de perfiles entre sí.

Detrás de este trabajo de análisis hay un grupo de ingenieros chilenos y chilenas que comenzó a operar durante julio de este año. El primer hashtag que estudiaron fue #MerluzoInepto –haciendo referencia al presidente Gabriel Boric– el cual tuvo 661 interacciones por parte de 319 cuentas identificadas como bots.

Este tipo de perfiles de identidades falsas, están configuradas de manera automática y en el contexto político actual, usualmente son utilizadas para levantar discursos de odio y masificar noticias falsas.

En el contexto de la campaña por el plebiscito del próximo 4 de septiembre –uno de los más importantes en los últimos 35 años en Chile– la presencia de estas cuentas no ha pasado desapercibida, menos su financiamiento. Durante esta semana, el medio La Tercera reportó que la opción Rechazo cuenta con aportes monetarios 200 veces mayores a los del Apruebo.

Al momento de estudiar el #YoAprueboPorque, el análisis apuntó que menos de 1% eran cuentas bots, mientras que el #NoSoyFachoVotoRechazo arrojó un índice de 55%. En conversación exclusiva con POUSTA y resguardados en el anonimato por temor a represalias, parte de esta agrupación respondió a nuestras preguntas.

¿Cómo se generó este grupo de acción para detectar bots?

“Nuestro equipo surgió literalmente en la mesa de un bar, junto a algunos amigos y colegas de diversas profesiones con los que conversábamos de la escasa calidad de la información que existe en Chile con el auge de las fake news y las cuentas bots. De esto nos surgió la idea de generar algún método que permitiera de forma simple poner en contexto la realidad que existe en Twitter, donde montón de cuentas falsas levantan trending topics a diario usando cámaras de eco de discursos falsos, imprecisos o intencionalmente dañinos. De la idea de una amiga médico surgió BotCheckerCL, el homólogo de un scanner en tiempo real del cerebro y corazón de Twitter”

¿Cuál es su objetivo al realizar este trabajo de detección de cuentas bot?

“En simple es mostrar a la comunidad la realidad de esta red social y cómo se manipula la opinión pública valiéndose de cuentas automatizadas y semi automatizadas para amplificar discursos que sin esta importante inversión monetaria, no tendrían mayor alcance”

De ser posible, ¿pueden explicar en palabras fáciles cómo identifican estas cuentas?

“La explicación simple es que tomamos una fotografía de Twitter en un minuto determinado, barriendo con todas las cuentas que interactúan con un hashtag. Luego se realiza un análisis de cada una de dichas cuentas para determinar su naturaleza (bot o humano) y se grafica la interacción que estas cuentas tuvieron en el hashtag analizado, generando así los gráficos que subimos a diario.

La explicación técnica es que mediante el uso de la API (interfaz de programación) de Twitter y múltiples fuentes de datos abiertas y privadas de detección de bots se alimenta un algoritmo de aprendizaje automático (machine learning) entrenado para detectar comportamientos y patrones destacables en las cuentas de usuario y estimar en que % una cuenta puede ser (o no) BOT, esto en una puntuación de 1 a 5. Las puntuaciones bajas indican presencia de cuentas humanas y las puntuaciones altas indican cuentas de bots.

Para calcular la puntuación se revisa cada cuenta, se obtiene el perfil del usuario y se analizan cientos de sus tweets públicos y menciones, estos datos alimentan el algoritmo de detección, el que ejecuta alrededor de mil funciones previamente aprendidas para caracterizar el perfil de la cuenta basándose en los seguidores, la estructura de la red social, los patrones de actividad, el idioma y el sentimiento de los tweets para darle la puntuación a cada cuenta. Luego todo esto se grafica, se le da colores a las cuentas de acuerdo a su puntuación y se sube a Twitter. Un pequeño disclaimer: en todo proceso existe el error y no somos la excepción. Por ejemplo si una persona real no pagada twittea cientos de veces al día #Rechazo es muy probable que lo confundamos con un BOT, pero en esencia ¿no lo es también? “

¿Qué caracteriza a las personas que forman parte de este grupo? ¿Son todos chilenos y chilenas?

“Chilenos y chilenas todos. Tenemos entre 19 y 45 años. Varios de profesión o aficionados a la informática. Amamos Chile, su gente y queremos que la verdad sea lo que prevalezca, sea cual sea y le afecte a quien le afecte.

Pese a que todos tenemos nuestra postura, para este proyecto en particular nos declaramos abiertamente un grupo sin tendencia, solo buscadores (e informadores) de la realidad, incomode a quien incomode. Algo que también nos caracteriza y nos une a la vez es haber nacido en familias con carencias económicas en algunos casos muy grandes y pese a ello gracias al esfuerzo conjunto de familia e hijos haber logrado estudiar, por lo mismo queremos devolverle la mano a la vida de alguna forma y esta es una de ellas”.

¿Cuáles creen ustedes que son las principales problemáticas que presentan la presencia de bots en Twitter?

“La literatura aquí es extensa y nosotros solo unos principiantes, pero claramente destacamos la desinformación, la difusión de mentiras y fake news, hostigamiento y cancelación de discursos, etc”.

¿Cómo proyectan su trabajo?

“Proyectamos quedarnos por poco tiempo dado que el esfuerzo requerido es grande a nivel de procesamiento (arriendo de servidores Cloud y mano de obra especializada) y dado que por ahora somos autofinanciados no nos es viable mantenerlo por mucho tiempo”.

¿Esperan seguir después del plebiscito?

“Eso lo decidiremos en su momento, por ahora esa es nuestra fecha tope”.