Une empreinte audio à base d’ALISP appliquée à l’identification audio dans un flux radiophonique

Houssem Khemiri 1, 2 Dijana Petrovska-Delacrétaz Gérard Chollet 1, 2
1 MM - Multimédia
LTCI - Laboratoire Traitement et Communication de l'Information
Résumé :

Cet article présente un système d’identification audio pour détecter et identifier des publicités et des morceaux de musique dans les flux radiophoniques en utilisant des unités acoustiques. Ces unités, nommées ALISP (Automatic Language Independent Speech Processing), sont apprises de manière entièrement automatique grâce à la décomposition temporelle, la quantification vectorielle et des modèles HMM. L’originalité de l’approche est qu’aucune transcription n’est utilisée pour apprendre les modèles HMM. Pour identifier des morceaux de musique et les publicités, les transcriptions ALISP des morceaux de référence sont comparées aux transcriptions du flux radiophonique de test en utilisant la distance de Levenshtein. Pour l’identification des publicités, nous obtenons un taux de précision de 99% et un taux de rappel de 94% pour un flux de test contenant 4401 publicités. Pour l’identification de morceaux de musique nous obtenons un taux de précision de 100% et un taux de rappel de 95% sur un flux de test contenant 505 morceaux de musique.

Complete list of metadatas

https://hal.telecom-paristech.fr/hal-02286467
Contributor : Telecomparis Hal <>
Submitted on : Friday, September 13, 2019 - 3:47:25 PM
Last modification on : Thursday, October 17, 2019 - 12:37:00 PM

Identifiers

  • HAL Id : hal-02286467, version 1

Collections

Citation

Houssem Khemiri, Dijana Petrovska-Delacrétaz, Gérard Chollet. Une empreinte audio à base d’ALISP appliquée à l’identification audio dans un flux radiophonique. COmpression et REprésentation des Signaux Audiovisuels, May 2012, Lille, France. pp.139-144. ⟨hal-02286467⟩

Share

Metrics

Record views

7