Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS

Résumé

Cette étude porte sur les différences entre les romans français du XIXe siècle écrits par des hommes et ceux écrits par des femmes en trois étapes. Premièrement, nous observons que ces textes peuvent être distingués par apprentissage supervisé selon ce critère. Un modèle simple a un score de 99% d’exactitude sur cette tâche si d’autres œuvres de la même personne figurent dans le jeu d’entraînement, et de 72% d’exactitude sinon. Cette différence s’explique par le fait que le langage de l’individu est plus distinctif qu’un éventuel style propre au genre. Deuxièmement, notre étude textométrique met au jour des stéréotypes de genre chez les hommes et les femmes. Troisièmement, nous présentons un modèle de coréférence entraîné sur des textes littéraires pour étudier le genre des personnages. Nous montrons ainsi que les personnages féminins sont plus nombreux chez les femmes, et prennent généralement une place plus proéminente que chez les hommes.
Fichier principal
Vignette du fichier
2362.pdf (2.69 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03701468 , version 1 (24-06-2022)

Identifiants

  • HAL Id : hal-03701468 , version 1

Citer

Marco Naguib, Marine Delaborde, Blandine Andrault, Anaïs Bekolo, Olga Seminck. Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS. Traitement Automatique des Langues Naturelles, 2022, Avignon, France. pp.66-77. ⟨hal-03701468⟩
103 Consultations
56 Téléchargements

Partager

Gmail Facebook X LinkedIn More