Ircam AudioPrint : Réduction de Dimension des Empreintes Sonores par Analyse Discriminante
Résumé
Dans le cadre du travail mis en œuvre pour l’amélioration de l’indexation audio du projet BeeMusic, nous avons développé de nouvelles empreintes sonores intrinsèquement plus robustes à certains types de dégradations audio : changement d’échelles (temps et fréquences), égalisation, bruit additif. Cependant, ces données obtenues, qui décrivent une portion de signal musical d’environ deux secondes, sont de très grande dimension : chacune de ces empreintes initiales est de dimension environ mille. Dans ce document, nous expliquons comment tirer partie de cette grande dimensionnalité pour accroître une fois de plus la robustesse. Ici, nous obtenons une réduction de dimension basée sur une analyse semblable à une analyse linéaire discriminante, qui permet de sélectionner par un apprentissage automatique les directions les plus informatives et les moins sensibles aux altérations.
Fichier principal
Mignot-2016_-_IRCAM_rapport-AudioPrints_-_Reduction_Discriminant.pdf (1.06 Mo)
Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)