Ircam AudioPrint : Réduction de Dimension des Empreintes Sonores par Analyse Discriminante

Rémi Mignot

Rapport (Rapport De Recherche) Année : 2016

Ircam AudioPrint : Réduction de Dimension des Empreintes Sonores par Analyse Discriminante

(1)

Rémi Mignot

Fonction : Auteur

Analyse et synthèse sonores [Paris]

Résumé

Dans le cadre du travail mis en œuvre pour l’amélioration de l’indexation audio du projet BeeMusic, nous avons développé de nouvelles empreintes sonores intrinsèquement plus robustes à certains types de dégradations audio : changement d’échelles (temps et fréquences), égalisation, bruit additif. Cependant, ces données obtenues, qui décrivent une portion de signal musical d’environ deux secondes, sont de très grande dimension : chacune de ces empreintes initiales est de dimension environ mille. Dans ce document, nous expliquons comment tirer partie de cette grande dimensionnalité pour accroître une fois de plus la robustesse. Ici, nous obtenons une réduction de dimension basée sur une analyse semblable à une analyse linéaire discriminante, qui permet de sélectionner par un apprentissage automatique les directions les plus informatives et les moins sensibles aux altérations.

Mots clés

Indexation audio Analyse discriminante

Domaines

Machine Learning [stat.ML] Traitement du signal et de l'image [eess.SP]

Fichier principal

Mignot-2016_-_IRCAM_rapport-AudioPrints_-_Reduction_Discriminant.pdf (1.06 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Rémi Mignot : Connectez-vous pour contacter le contributeur

https://hal.science/hal-04470494

Soumis le : mercredi 21 février 2024-11:25:39

Dernière modification le : jeudi 22 février 2024-03:35:44

Dates et versions

hal-04470494 , version 1 (21-02-2024)

Identifiants

HAL Id : hal-04470494 , version 1

Citer

Rémi Mignot. Ircam AudioPrint : Réduction de Dimension des Empreintes Sonores par Analyse Discriminante. STMS - Sciences et Technologies de la Musique et du Son UMR 9912 IRCAM-CNRS-Sorbonne Université. 2016. ⟨hal-04470494⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS IRCAM STMS LARA SORBONNE-UNIVERSITE SU-SCIENCES

11 Consultations

2 Téléchargements

Ircam AudioPrint : Réduction de Dimension des Empreintes Sonores par Analyse Discriminante

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager