We aim in this research to find and compare crosslingual articles concerning a specific topic. So, we need measure for that. This measure can be based on bilingual dictionaries or based on numerical methods such as Latent Semantic Indexing (LSI). In this paper, we use the LSI in two ways to retrieve Arabic-English comparable articles. The first one is monolingual: the English article is translated into Arabic and then mapped into the Arabic LSI space; the second one is crosslingual: Arabic and English documents are mapped into Arabic-English LSI space. Then, we compare LSI approaches to the dictionary-based approach on several English-Arabic parallel and comparable corpora. Results indicate that the performance of cross-lingual LSI approach is competitive to monolingual approach, or even better for some corpora. Moreover, both LSI approaches outperform the dictionary approach.

Cross-lingual semantic similarity measure for comparable articles

Saad M.
Membro del Collaboration Group
;
2014-01-01

Abstract

We aim in this research to find and compare crosslingual articles concerning a specific topic. So, we need measure for that. This measure can be based on bilingual dictionaries or based on numerical methods such as Latent Semantic Indexing (LSI). In this paper, we use the LSI in two ways to retrieve Arabic-English comparable articles. The first one is monolingual: the English article is translated into Arabic and then mapped into the Arabic LSI space; the second one is crosslingual: Arabic and English documents are mapped into Arabic-English LSI space. Then, we compare LSI approaches to the dictionary-based approach on several English-Arabic parallel and comparable corpora. Results indicate that the performance of cross-lingual LSI approach is competitive to monolingual approach, or even better for some corpora. Moreover, both LSI approaches outperform the dictionary approach.
2014
9783319108872
9783319108889
File in questo prodotto:
File Dimensione Formato  
MotazDavidKamelPolTAl2014.pdf

accesso aperto

Tipologia: Versione editoriale
Note: Autorisation HAL (Les documents diffusés avec l'autorisation HAL sont protégés par le droit d'auteur. L'autorisation HAL atteste que, lors du dépôt de son document, le déposant a accordé à HAL : l’autorisation de mettre en ligne et distribuer le document ; la reconnaissance que les dépôts ne peuvent pas être supprimés, une fois acceptés ; l’acceptation du droit réservé à HAL de reclasser ou de refuser tout dépôt. L’utilisateur peut lire, consulter, citer (en mentionnant le ou les auteurs et la source) mais doit demander une autorisation à l’auteur ou à l’ayant droit pour reproduire, adapter ou utiliser l’œuvre au-delà des exceptions légales. La métadonnée licence devient une métadonnée obligatoire à partir de février 2026. L’autorisation HAL permet de traiter l’existant : elle est automatiquement associée à tout fichier déposé avant cette date si aucune licence n’est présente dans les métadonnées. Elle n’est pas disponible dans la liste des licences proposées lors du dépot. Par contre, elle peut être remplacée par une licence proposée dans l’interface en modifiant le dépôt) v. https://about.hal.science/hal-authorisation-v1/
Licenza: PUBBLICO - Pubblico con Copyright
Dimensione 351.74 kB
Formato Adobe PDF
351.74 kB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11587/561297
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus 12
  • ???jsp.display-item.citation.isi??? ND
social impact