Skip to main content
Log in

Étude de l’erreur introduite par la numérisation du signal dans un problème de reconnaissance des formes: Application a la parole

  • Published:
Annales Des Télécommunications Aims and scope Submit manuscript

Résumé

La théorie de la décision s’appuyant sur la règle du maximum de vraisemblance conduit au calcul d’un seuil Squi permet de classer un signal inconnu I,caractérisé par une seule mesure x,entre deux classes Ω1et Ω2.On en déduit, en effet, que Iest issu de Ω1si x ≤S,tandis que Iprovient de Ω2si x > S.Lorsque la mesure xest reçue à travers un convertisseur analogique-numérique, on dispose d’une valeur x0qui ne permet pas toujours de déterminer la position de xpar rapport à S.Ceci amène une incertitude supplémentaire qu’on se propose d’étudier. Souvent, le choix de la numérisation peut permettre de réduire l’incertitude. Sur le plan expérimental, les auteurs illustrent la partie théorique en étudiant les caractéristiques du vocodeur du CNET à Lannion lorsque différents types de numérisation sont proposés. Les résultats obtenus montrent que la numérisation influe sur la reconnaissance, mais que la détermination des seuils Sn’est pas toujours critique.

Abstract

Decision in pattern recognition according to the likelihood theory leads to the determination of a threshold S.Classification of an unknown signal Icaracterized by one parameter x,is made according to the following rule: I = Ω1if x ≤Sand I = Ω2if x > S (Ibelongs to one of the two classes Ω1or Ω2). When xis fed into an analog to digital converter, one gets a quantized value x0; sometimes it is not possible to fix the relative position of xwith regard to Swhen x0is known. The distorsion increase is studied in this paper, a suitable determination of Scan reduce the increase. An experimental illustration is given. Speech recognition is made on data coming from the CNET vocoder in Lannion. The distorsion introduced by quantizing is studied when several thresholds sets are proposed. The influence of numérisation is pointed out; a high accuracy on the thresholds values is not needed and this allows wide applications.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Similar content being viewed by others

Bibliographie

  1. Inaba (H.),Hiramatsu (K.). Caracteristic evaluation function and decision function in pattern recognition (Evaluation de la fonction caractéristique et de la fonction de décision en reconnaissance des formes).J. Inst. electr. Communic. Engrs, Jap. (1967),50, n∘ 3, pp. 118–127.

    Google Scholar 

  2. Berger-Vachon (G.),Mesnard (G.). Evaluation de l’efficacité d’un système de reconnaissance des formes.Onde Electr., Fr. (déc. 1970),50, n∘ 11, pp. 920–933.

    Google Scholar 

  3. Sebestyen (G. S.). Decision making processes in pattern recognition (Processus de prise de décisions en reconnaissance des formes).MacMillan, New York (1962), 162 p.

    Google Scholar 

  4. Haton (J. P.) Reconnaissance de la parole, bilan de 20 années de recherche et tendances actuelles.Ann. Télécommunic, Fr. (1972),27, n∘ 3–4, pp. 77–88.

    Google Scholar 

  5. Berger-Vachon (C.). Conception d’une entrée vocale automatique.Thèse d’Etat, Lyon (1975), 302 p.

    Google Scholar 

  6. Roche (G.). Information utile en reconnaissance des formes et en compression des données. Application à la génération automatique de systèmes de reconnaissance optique et acoustique.Thèse d’Etat, Paris (1972), 223 p.

    Google Scholar 

  7. Mercier (G.).-Reconnaissance des formes, approximation des fonctions de décision et application à la reconnaissance des phénomènes.Thèse de 3e cycle (Math. appl.), Rennes (1969), 109 p.

  8. Berger-Vachon (C.),Mesnard (G.),Gresser (J. Y.). Etude théorique et expérimentale des confusions données par un vocodeur. Applications à la reconnaissance de la parole.Ann. Télécommunic, Fr. (mai-juin 1975),30, n∘ 5–6, pp. 139–148.

    Google Scholar 

  9. Ferrieu (G.), Poncin (J.), Roux (G.), Vincent-Carrefour (J.). Synthèse et reconnaissance de la parole par calculateurs.Echo Rech., Fr. (juin 1968), n∘ 53, pp. 30–42.

  10. Caelen (J.),Castan (S.),Perennou (G.). Reconnaissance de la parole en temps réel.Automatisme, Fr. (1972),17, n∘ 3, pp. 87–89.

    Google Scholar 

  11. Mercier (G.). Segmentation de la parole et reconnaissance des syllabes à l’intérieur des mots.Automatisme, Fr. (mars 1972),17, n∘ 3, pp. 69–75.

    Google Scholar 

  12. Berger-Vachon (G.),Mesnard (G.). Etude de la significativité d’un paramètre au niveau des reconsances de formes. Application au fondamental de la voix.Automatisme, Fr. (1975),19, pp. 257–267.

    Google Scholar 

  13. Abramson (N.). Information theory and coding (Théorie de l’information et du codage).MacGraw-Hill, New York (1962), 201 p.

    Google Scholar 

  14. Richards (D. L.). Distorsions of speech by quantizing (Distorsions du signal introduites par la numérisation).Electron. Letter, G. B. (juin 1967),3, n∘ 6, pp. 230–231.

    Article  MathSciNet  Google Scholar 

  15. Berger-Vachon (C.),Mesnard (G.). Efficacité du codage acoustique.5eJournée d’Etude du Groupe Communication Parlée organisée par le LIMSI, Orsay (15–17 mai 1974), Proc.1, pp. 176–185.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Rights and permissions

Reprints and permissions

About this article

Cite this article

Berger-Vachon, C., Mesnard, G. Étude de l’erreur introduite par la numérisation du signal dans un problème de reconnaissance des formes: Application a la parole. Ann. Télécommun. 31, 321–332 (1976). https://doi.org/10.1007/BF02999891

Download citation

  • Received:

  • Revised:

  • Issue Date:

  • DOI: https://doi.org/10.1007/BF02999891

Navigation