Séminaire – Mohamed Mehdi Boudabous

Titre : Enrichissement de Arabic WordNet a partir de Wikipedia Résumé : Les travaux de recherche dans le domaine du Traitement Automatique du Langage Naturel (TALN), ont vécu un grand développement au cours de ces dernières décennies. Des applications sophistiquées et complexes sont développées dans ce domaine, tels que les systèmes de questions/ réponses (Q/A), de résumés automatiques, de recherche et d’extraction d’information (RI), la traduction automatique (TA), etc. La plupart de ces applications se sont basées sur des ressources numériques tels que les corpus, les BD, les dictionnaires électroniques, les ontologies, etc. Actuellement, nul ne conteste l’apport des ontologies dans le domaine de TALN. En effet, elles permettent de faciliter la compréhension du sens par la machine à travers la richesse de leurs structures et des relations sémantiques qu’elles présentent. AWN est considérée parmi les ontologies arabes les plus importantes. Sa conception offre plusieurs avantages pour son utilisation dans le contexte de TALN. Cependant, elle présente quelques insuffisances au niveau de la complétude des synsets et des relations sémantiques les reliant. Notre contribution consiste essentiellement à enrichir les relations sémantiques de cette ontologie à partir de Wikipedia Arabe. Ainsi, nous présentons, dans un premier lieu, un état de l’art sur les ontologies. Dans un second lieu, nous développons notre méthode d’enrichissement des relations sémantiques en se basant sur des patrons morpho-lexicaux ainsi que les outils utilisés pour l’implémentation. En troisième lieu, nous présentons les résultats obtenus. Enfin, nous conclurons cette présentation par nos futures recherches.

Comments are closed.