Análisis del sesgo de género en los modelos NLP

Javier Azpillaga Rivera 2021

Finalizado

Descripción:

Este proyecto explora la existencia del sesgo de género en el ámbito del Procesamiento del Lenguaje Natural o NLP (Natural Language Processing). Se trata de un fenómeno de extrema importancia, dada la importancia exponencialmente creciente del aprendizaje automático dentro de la sociedad, y cómo la extrema dependencia de las técnicas NLP en datos históricos, de probado sesgo, puede contribuir a que el mismo no solo no desaparezca de la sociedad, sino que contribuya a mantenerlo o incluso ampliarlo. Por un lado se ha hecho una recopilación de diferentes estudios que ya han analizado, medido y mitigado el mencionado sesgo. Posteriormente se procede a aplicar de forma práctica una de las formas de medición del sesgo de género en los modelos de lenguaje, en este caso concreto en los BERT (Bidi-rectional Encoder Representations from Transformers). Además se ha extendido la técnica a los idiomas castellano y euskera, aparte del inglés originalmente estudiado, y para versiones de BERT tanto monolingües como multilingües.

Director(es):
Olatz Arbelaitz
Olatz Perez de Viñaspre Garralda
Universidad:
Euskal Herriko Unibertsitatea (UPV/EHU)
Centro:
Informatika Fakultatea - Facultad de Informática
Departamento:
Konputagailuen Arkitektura eta Teknologia - Arquitectura y Tecnología de computadores
Fecha lectura:
2021-07-02
Año lectura:
2021