Aldapa, Algorithms, Data Mining and Parallelism

Javier Azpillaga Rivera 2021

Finalizado

Línea de investigación:: Fairness & gender analysis
Descripción:: Este proyecto explora la existencia del sesgo de género en el ámbito del Procesamiento del Lenguaje Natural o NLP (Natural Language Processing). Se trata de un fenómeno de extrema importancia, dada la importancia exponencialmente creciente del aprendizaje automático dentro de la sociedad, y cómo la extrema dependencia de las técnicas NLP en datos históricos, de probado sesgo, puede contribuir a que el mismo no solo no desaparezca de la sociedad, sino que contribuya a mantenerlo o incluso ampliarlo. Por un lado se ha hecho una recopilación de diferentes estudios que ya han analizado, medido y mitigado el mencionado sesgo. Posteriormente se procede a aplicar de forma práctica una de las formas de medición del sesgo de género en los modelos de lenguaje, en este caso concreto en los BERT (Bidi-rectional Encoder Representations from Transformers). Además se ha extendido la técnica a los idiomas castellano y euskera, aparte del inglés originalmente estudiado, y para versiones de BERT tanto monolingües como multilingües.
Participantes:
Director(es):: Olatz Arbelaitz
Olatz Perez de Viñaspre Garralda
Universidad:: Euskal Herriko Unibertsitatea (UPV/EHU)
Centro:: Informatika Fakultatea - Facultad de Informática
Departamento:: Konputagailuen Arkitektura eta Teknologia - Arquitectura y Tecnología de computadores
Fecha lectura:: 2021-07-02
Año lectura:: 2021