top of page

Metodología

¿Qué datos usamos?

El monitor utiliza información de Twitter, una red social con gran repercusión en la agenda nacional a pesar de la baja base de usuarios que tiene Uruguay (Departamento de Estudios Sociodemográficos - INE, 2020). Amnistía Internacional (2018) agrega: “La naturaleza misma de Twitter fomenta que los usuarios tengan conversaciones públicas y compartan sus opiniones con otros (a menudo, extraños), de modo que podría decirse que los usuarios se benefician más de la plataforma cuando pueden participar abiertamente en los debates.” Es por estas razones que el monitor encuentra la fuente de datos de Twitter particularmente interesante para analizar violencia en redes sociales. 

A su vez, Twitter, a diferencia de otras redes sociales, provee el acceso a todos los tweets realizados por usuarios públicos mediante una API, permitiéndonos recolectar tweets, menciones, hashtags y usuarios de una manera muy simple. De esta forma, para construir el monitor se accede sólo a datos públicos (los perfiles privados no están disponibles) que son almacenados de manera segura y anónima en una nube propiedad del Instituto Nacional de las Mujeres, por lo que ninguna información personal va a ser revelada en la confección del mismo. La data es recolectada y almacenada en tiempo real cada una hora, modificando en la misma frecuencia los resultados del monitor. Los tweets comenzaron a ser recolectados y almacenados desde el 1 de marzo de 2022.

 
Listado de usuarias

El monitor muestra tweets donde se menciona o responde a alguna de las 180 usuarias de interés del proyecto. La lista de usuarias seleccionadas fue confeccionada teniendo en cuenta distintos grupos de mujeres influyentes de diversas profesiones (tabla 1).

Tabla 1:

 

Cantidad de usuarias por grupo.

Grupo

Cantidad de usuarias observadas

Periodista

69

Política

41

Artista

27

Comunicadora

27

Lideresa

16

Usuarias totales

180

Se incluyó únicamente a aquellas mujeres con más de 3.000 seguidores/as en sus cuentas para asegurar robustez y comparabilidad de muestra. 

 
Identificación de agresiones

Para la detección automática y en escala de violencia digital en redes se entrenó un modelo de redes neuronales (aprendizaje automático) utilizando datos y anotadores locales. En particular, se utilizó un modelo llamado BETO, un transformer de tipo BERT entrenado por un equipo del Departamento de Ciencias de la Computación de la Universidad de Chile sobre un gran corpus de textos en español. Un transformer es una red neuronal, en este caso pre-entrenada, a la que se le puede re-entrenar con nuevos datos para que aprenda a detectar un caso de uso específico. Se entrenó el modelo BETO con 7.697 tweets clasificados entre violencia digital y no violencia digital, anotados por 6 anotadoras y anotadores locales. Así, el modelo aprendió a clasificar un tweet nuevo, inédito y no visto antes por un humano entre estos dos tipos.

 

Tras seis sucesivas rondas de anotaciones y de entrenamiento, el modelo final obtuvo sobre la muestra de testeo una accuracy del 79.7%, y una F1 macro del 76%. 

Una vez detectados los tweets violentos, se los clasificó en distintas categorías utilizando una lista de 350 insultos. Esto permitió identificar el uso de un lenguaje particular para realizar la agresión en las redes. La lista de insultos se construyó a partir de una utilizada en el proyecto del Monitor de agresión a candidatas argentinas a las elecciones legislativas de 2021, la cual se actualizó a partir de la inspección de los 9.000 tweets de origen uruguayo anotados.

Fuentes 

(4) https://www.gub.uy/agencia-gobierno-electronico-sociedad-informacion-conocimiento/datos-y-estadisticas/estadisticas/encuesta-uso-tecnologias-informacion-comunicacion-2019

 

(5) https://huggingface.co/dccuchile/bert-base-spanish-wwm-cased

 

(6) Proyecto desarrollado y mantenido por WitPact y liderado por Laila Sprejer, con el apoyo técnico de las áreas de Géneros y Datos de Fundar, y con el apoyo de la Embajada Británica en Argentina. Disponible en: https://www.conductaenredes.org/

Embajada Britanica AZUL sin fondo (2).png
PNUD-Logo-Blue-Large (002).png
InstitutoNacionalMujeres 01.png

Monitor de violencia digital de género

© 2022 por PNUD+WithData

bottom of page