Skip to Main content Skip to Navigation
Conference papers

Extraction d'informations de messages aéronautiques (NOTAMs) avec des modèles de langue appris de façon auto-supervisée

Résumé : Avant un vol, les pilotes de ligne doivent lire une longue liste de messages appelés NOTAM (pour NOtice To AirMen) donnant des informations sur des aléas potentiels le long du vol. Ces messages suivent une grammaire particulière, contiennent beaucoup d’acronymes et un vocabulaire spécifique aéronautique. Dans cet article, un modèle de langue de type BERT est pré-entraîné sur un grand nombre de ces messages ; il est ensuite affiné sur trois tâches : l’estimation de criticité, la reconnaissance d’entités nommées et la traduction vers un langage structuré appelé Airlang. L’apprentissage auto-supervisé, permettant de tirer parti du vaste nombre de données non annotées, est particulièrement intéressant dans le domaine aéronautique, pour lequel les annotations sont très coûteuses car nécessitant une forte expertise. Nous montrons les résultats encourageants sur les trois tâches.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-03701509
Contributor : Yannick Parmentier Connect in order to contact the contributor
Submitted on : Friday, June 24, 2022 - 4:42:26 PM
Last modification on : Thursday, July 7, 2022 - 5:41:53 AM
Long-term archiving on: : Sunday, September 25, 2022 - 9:37:44 PM

File

6576.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-03701509, version 1

Citation

Alexandre Arnold, Fares Ernez, Catherine Kobus, Marion-Cécile Martin. Extraction d'informations de messages aéronautiques (NOTAMs) avec des modèles de langue appris de façon auto-supervisée. Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.335-344. ⟨hal-03701509⟩

Share

Metrics

Record views

35

Files downloads

0