CART zuhaitzen gaineko kontsolidazio prozesuaren, CTCARTen, integrazioa scikit-learn plataforman

Jon Ochoa de Alda 2025

Martxan

Ikerketa lerroa:
Explainable models
Azalpena:

Proiektu honen helburua zera da: ALDAPA ikerketa-taldeak (http://www.aldapa.eus) diseinatutako kontsolidazio meta-algoritmoa, CTC algoritmoa, Python-en garatutako Machine Learning-eko scikit-learn (https://scikit-learn.org/) plataforman integratzea, baina, kasu honetan, C4.5 sailkapen-zuhaitzak eraikitzeko algoritmoan oinarritu beharrean, CART algoritmoan oinarrituta.

CTC algoritmoa Quinlan-ek proposatutako sailkapen zuhaitzak sortzeko C4.5 algoritmoan oinarrituta dago. Java-n garatutako WEKA izeneko Machine Learning plataforman (http://www.cs.waikato.ac.nz/ml/weka/) J48 izeneko C4.5 algoritmoaren inplementazioa existitzen da. Honen gainean, ALDAPA taldeak J48Consolidated deituriko CTC algoritmoaren inplementazioa garatu du, zeina Wekako paketete ofizial gisa onartuta dagoen (http://weka.sourceforge.net/packageMetaData/J48Consolidated/index.html).

Beste alde batetik, scikit-learn-k berak badu klase bat non CART sailkapen- eta erregresio-zuhaitzak eraikitzeko algoritmoaren inplementazioa dagoen, DecisionTreeClassifier deiturikoa (https://scikit-learn.org/stable/modules/tree.html#tree).

Inplementazio hauek guztiak oinarri hartuta erabil daitezke proiektu honen helburu nagusia lortzeko asmoz: CARTen kontsolidazioaren inplementazioa, CTCARTena, hain zuzen.

Behin algoritmoa inplementatuta, ezagunak diren hainbat sailkapen-problemekin eta aipatutako lau algoritmoekin (oinarrizko biak, C4.5 eta CART, eta euren kontsolidazioa direnak, CTC edo CTC45 eta CTCART) esperimentazio bat burutu beharko da batzuen eta besteen puntu ahul eta sendoak aztertzeko sailkapen testuinguru desberdinetan.

Partehartzaileak:

Zuzendaria(k):
Jesús M. Pérez
Unibertsitatea:
Universidad del País Vasco/Euskal Herriko Unibertsitatea (UPV/EHU)
Zentroa:
Informatika Fakultatea - Facultad de Informática
Saila:
Konputagailuen Arkitektura eta Teknologia - Arquitectura y Tecnología de computadores
Irakurketaren urtea:
2025