Skip to Main content Skip to Navigation
Conference papers

COMFO : Corpus Multilingue pour la Fouille d’Opinions

Résumé : L’utilisation d’algorithmes de Machine Learning (ML) en fouille d’opinions notamment ceux d’apprentissage supervisé nécessite un corpus annoté pour entrainer le modèle de classification afin de prédire des résultats proches de la réalité. Malheureusement, il n’existe pas encore de ressources pour le traitement automatique de données textuelles exprimées dans le langage urbain sénégalais. L’objectif de cet article est de construire un corpus multilingue pour la fouille d’opinions (COMFO). Le processus de constitution du corpus COMFO est composé de trois étapes à savoir la présentation de la source de données, la collecte et préparation de données, et l’annotation par approche lexicale. La particularité de COMFO réside dans l’intégration des langues étrangères (française et anglaises) et celles locales notamment le wolof urbain afin de refléter l'opinion collective des lecteurs sénégalais.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-03701518
Contributor : Yannick Parmentier Connect in order to contact the contributor
Submitted on : Friday, June 24, 2022 - 4:42:44 PM
Last modification on : Thursday, July 7, 2022 - 5:41:53 AM
Long-term archiving on: : Sunday, September 25, 2022 - 9:39:12 PM

File

9092.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-03701518, version 1

Citation

Lamine Faty, Khadim Drame, Edouard Ngor Sarr, Marie Ndiaye, Yoro Dia, et al.. COMFO : Corpus Multilingue pour la Fouille d’Opinions. Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.297-304. ⟨hal-03701518⟩

Share

Metrics

Record views

23

Files downloads

1