Hors contexte, la plupart des mots ont plusieurs sens et plusieurs fonctions. La désambiguïsation lexicale, par exemple, consiste à choisir la bonne signification d’un mot polysémique dans un contexte donné. Plusieurs méthodes et approches existent à tous les niveaux de désambigüisation: morphologique [7], lexicale [3], sémantique [4] pour le TAL (traitement automatique des langues). Mais pour la langue arabe l’ambigüité s’accentue par la non diacritisation des mots. Afin de réduire considérablement ce taux d’ambigüité, nous proposons dans cet article une approche de désambigüisation qui se fonde sur le choix des bonnes diacritiques lors des différentes analyses. Cette approche combine une approche linguistique à une approche multicritère d’aide à la décision. Cette combinaison peut être considérée comme une alternative de choix pour remédier au problème de l’ambigüité morpho_lexicale quelque soit le taux de diacritiques du texte traité. Pour son évaluation, nous avons essayé la désambigüisation de l’analyseur morphologique on-line Alkhalil (L’approche que nous proposons peut être expérimentée sur n’importe quel autre analyseur morphologique da la langue
arabe). Alkhalil Morpho Sys, Version 1.3, 2011, un open source http://www.alecso.org.tn/ index.php? option=com_content&task=view&id=1302&Itemid=956&lang=a . Nous avons obtenu des résultats encourageants avec un F-Measure de plus de 80%.
-
Votre commentaire
Votre commentaire s'affichera sur cette page après validation par l'administrateur.
Ceci n'est en aucun cas un formulaire à l'adresse du sujet évoqué,
mais juste un espace d'opinion et d'échange d'idées dans le respect.
Posté par : einstein
Ecrit par : - Bousmaha K.z - Charef-abdoun S. - Hadrich Belguith L. - Rahmouni M.k
Source : Revue de l'Information Scientifique et Technique Volume 21, Numéro 1, Pages 26-40 2013-03-05