Traitement, synthèse et reconnaissance de la parole

Ce module a pour objectif de faire découvrir la parole à travers ses applications et les questions scientifiques soulevées.

Les concepts de base du traitement automatique de la parole depuis les techniques d’analyse spectrale jusqu’aux méthodes de reconnaissance automatique de la parole seront présentés aux étudiants. L’étudiant sera amené à manipuler des logiciels et algorithmes simples pour illustrer certaines étapes d’analyse, de traitement et de reconnaissance de la parole.

Prérequis

Aucun.

Acquis d’apprentissage

  • Découvrir le domaine pluridisciplinaire du traitement de la parole en étant sensibilisé aux questions scientifiques sous-jacentes.
  • Identifier les principales caractéristiques d’un son.
  • Expliciter les méthodes de bases utilisées pour représenter un signal acoustique (fenêtrage, transformée de Fourier, prédiction linéaire, lissage cepstral, coefficients MFCC) et pour analyser des phénomènes classiques (détection de la fréquence fondamentale…).
  • Identifier les grandes familles d’algorithmes utilisés pour la transformation et la synthèse de la parole.
  • Caractériser les différentes étapes d’un système de reconnaissance automatique de la parole (modélisation des sons de la parole, modèles de Markov cachés, algorithme de décodage, notion de modèle de langage).

Compétences visées

  • Identifier les différentes étapes de base mises en œuvre lors d’une analyse, d’un traitement, de la synthèse et de la reconnaissance de la parole.
  • Réaliser un programme effectuant une brique de traitement sur un signal de parole en sachant quel outil utiliser pour évaluer le résultat.
  • Mettre en œuvre un enchaînement d’étapes pour réaliser une tâche de reconnaissance vocale dans un contexte simple en utilisant des outils logiciels existants ou en implantant un algorithme de base.