Jon Ochoa de Alda 2025
En curso
- Línea de investigación:
- Explainable models
- Descripción:
Se trata de integrar el meta-algoritmo de consolidación, algoritmo CTC, diseñado por el grupo ALDAPA (http://www.aldapa.eus) en la plataforma de Machine Learning desarrollada en Python scikit-learn (https://scikit-learn.org/), sólo que en lugar de usar como algoritmo base el algoritmo de construcción de árboles de clasificación C4.5, usar el algoritmo CART.
El algoritmo CTC está basado en el algoritmo de construcción de árboles de clasificación C4.5 propuesto por Quinlan. La plataforma de Machine Learning WEKA (http://www.cs.waikato.ac.nz/ml/weka/), desarrollada en Java, contiene una implementación del algoritmo C4.5 llamada J48 y, basada en ésta, el grupo ALDAPA ha desarrollado una implementación del algoritmo CTC llamada J48Consolidated, aceptada como paquete oficial en Weka (http://weka.sourceforge.net/packageMetaData/J48Consolidated/index.html).
Además scikit-learn dispone de una clase con una implementación del algoritmo clásico de construcción de árboles de clasificación y regresión CART, llamada DecisionTreeClassifier (https://scikit-learn.org/stable/modules/tree.html#tree).
Estas implementaciones forman parte del material de base para la implementación final propuesta del algoritmo de consolidación del CART, CTCART.
Una vez llevada a cabo la implementación del algoritmo se realizará una experimentación con un conjunto de problemas de clasificación controlado y los cuatro algoritmos implicados (algoritmos base, C4.5 y CART, y algoritmos de consolidación, CTC o CTC45 y CTCART) para analizar los puntos fuertes y débiles de unos y otros en distintos contextos de clasificación.
- Participantes:
-
- Director(es):
- Jesús M. Pérez
- Universidad:
- Universidad del País Vasco/Euskal Herriko Unibertsitatea (UPV/EHU)
- Centro:
- Informatika Fakultatea - Facultad de Informática
- Departamento:
- Konputagailuen Arkitektura eta Teknologia - Arquitectura y Tecnología de computadores
- Año lectura:
- 2025
