Skip to Main content Skip to Navigation
Conference papers

Classification automatique de questions spontanées vs. préparées dans des transcriptions de l'oral

Résumé : Ce travail a pour objectif de développer un modèle linguistique pour classifier automatiquement des questions issues de transcriptions d’enregistrements provenant des corpus ESLO2 et ACSYNT en deux catégories "spontané" et "préparé". Avant de procéder au traitement automatique, nous proposons une liste de critères définitoires et discriminants permettant de distinguer les questions parmi d’autres énoncés. Les expériences basées sur des méthodes d’apprentissage supervisé sont réalisées selon une classification multiclasse comprenant les catégories "spontané", "préparé" et "non-question" et selon une classification binaire incluant les catégories "spontané" et "préparé" uniquement. Les meilleurs résultats pour les méthodes traditionnelles d’apprentissage automatique sont obtenus avec une régression logistique combinée aux critères linguistiques significatifs uniquement (F-score de 0.75). Pour finir, nous mettons en parallèle ces résultats avec ceux obtenus en utilisant des techniques d’apprentissage profond.
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-03701483
Contributor : Yannick Parmentier Connect in order to contact the contributor
Submitted on : Friday, June 24, 2022 - 4:41:18 PM
Last modification on : Thursday, July 7, 2022 - 5:41:51 AM
Long-term archiving on: : Sunday, September 25, 2022 - 9:33:16 PM

File

2331.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-03701483, version 1

Citation

Iris Eshkol-Taravella, Angèle Barbedette, Xingyu Liu, Valentin-Gabriel Soumah. Classification automatique de questions spontanées vs. préparées dans des transcriptions de l'oral. Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.305-314. ⟨hal-03701483⟩

Share

Metrics

Record views

19

Files downloads

4