2024 | Martxoa 05
ZelaiHandi aurkeztu dugu, lizentzia libreko testuen euskarazko corpusik handiena
Corpusak 521,5 milioi hitz ditu, eta hautatutako webguneen bilduma batetik bildu dira testuak, kalitatezkoak eta askotarikoak direla ziurtatzeko. Corpusaren edukia aldian-aldian eguneratuko da.
Euskara ulertzeko eta sortzeko gaitasuna duten hizkuntza-eredu neuronalen garapena eta ikerketa errazteko sortu da corpusa.
https://huggingface.co/datasets/orai-nlp/ZelaiHandi
ZelaiHandi Oraik garatu du ICL4LANG Elkartek proiektuaren barnean. Proiektu horretan, gure industriaren beharretara egokitzen diren zehaztasun handiko hizkuntza-teknologia eskalagarriak ikertzen dihardugu, Tecnalia eta HiTZ zentroarekin batera.
Azken postak
2024 | Urria 22
2024 | Urria 16
2024 | Iraila 26