Le corpus DTC réunit des textes historiographiques grecs d’époque byzantine. Ces textes ont été analysés semi-automatiquement (lemmatisation et catégorisation morphosyntaxique) avec les outils informatiques et les ressources linguistiques du projet GREgORI (UCLouvain, Louvain-la-Neuve, Belgique) spécialisé dans le traitement automatique du grec et des langues de l’Orient chrétien. Une seconde analyse a été menée en collaboration avec l’entreprise Calfa (Paris, France) spécialisée dans le traitement de l’arménien et la mise en œuvre d’approches basées sur l’intelligence artificielle. Cette seconde analyse est réalisée par un réseau de neurones. Cette étude compare et évalue les résultats produits par les deux méthodes et propose une approche hybride pour le traitement automatique des langues concernées.
Analyse automatique du grec ancien par réseau de neurones. Évaluation sur le corpus De Thessalonica Capta
Delle Donne Saulo
2022-01-01
Abstract
Le corpus DTC réunit des textes historiographiques grecs d’époque byzantine. Ces textes ont été analysés semi-automatiquement (lemmatisation et catégorisation morphosyntaxique) avec les outils informatiques et les ressources linguistiques du projet GREgORI (UCLouvain, Louvain-la-Neuve, Belgique) spécialisé dans le traitement automatique du grec et des langues de l’Orient chrétien. Une seconde analyse a été menée en collaboration avec l’entreprise Calfa (Paris, France) spécialisée dans le traitement de l’arménien et la mise en œuvre d’approches basées sur l’intelligence artificielle. Cette seconde analyse est réalisée par un réseau de neurones. Cette étude compare et évalue les résultats produits par les deux méthodes et propose une approche hybride pour le traitement automatique des langues concernées.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.