Résumé
La théorie de la décision s’appuyant sur la règle du maximum de vraisemblance conduit au calcul d’un seuil Squi permet de classer un signal inconnu I,caractérisé par une seule mesure x,entre deux classes Ω1et Ω2.On en déduit, en effet, que Iest issu de Ω1si x ≤S,tandis que Iprovient de Ω2si x > S.Lorsque la mesure xest reçue à travers un convertisseur analogique-numérique, on dispose d’une valeur x0qui ne permet pas toujours de déterminer la position de xpar rapport à S.Ceci amène une incertitude supplémentaire qu’on se propose d’étudier. Souvent, le choix de la numérisation peut permettre de réduire l’incertitude. Sur le plan expérimental, les auteurs illustrent la partie théorique en étudiant les caractéristiques du vocodeur du CNET à Lannion lorsque différents types de numérisation sont proposés. Les résultats obtenus montrent que la numérisation influe sur la reconnaissance, mais que la détermination des seuils Sn’est pas toujours critique.
Abstract
Decision in pattern recognition according to the likelihood theory leads to the determination of a threshold S.Classification of an unknown signal Icaracterized by one parameter x,is made according to the following rule: I = Ω1if x ≤Sand I = Ω2if x > S (Ibelongs to one of the two classes Ω1or Ω2). When xis fed into an analog to digital converter, one gets a quantized value x0; sometimes it is not possible to fix the relative position of xwith regard to Swhen x0is known. The distorsion increase is studied in this paper, a suitable determination of Scan reduce the increase. An experimental illustration is given. Speech recognition is made on data coming from the CNET vocoder in Lannion. The distorsion introduced by quantizing is studied when several thresholds sets are proposed. The influence of numérisation is pointed out; a high accuracy on the thresholds values is not needed and this allows wide applications.
Similar content being viewed by others
Bibliographie
Inaba (H.),Hiramatsu (K.). Caracteristic evaluation function and decision function in pattern recognition (Evaluation de la fonction caractéristique et de la fonction de décision en reconnaissance des formes).J. Inst. electr. Communic. Engrs, Jap. (1967),50, n∘ 3, pp. 118–127.
Berger-Vachon (G.),Mesnard (G.). Evaluation de l’efficacité d’un système de reconnaissance des formes.Onde Electr., Fr. (déc. 1970),50, n∘ 11, pp. 920–933.
Sebestyen (G. S.). Decision making processes in pattern recognition (Processus de prise de décisions en reconnaissance des formes).MacMillan, New York (1962), 162 p.
Haton (J. P.) Reconnaissance de la parole, bilan de 20 années de recherche et tendances actuelles.Ann. Télécommunic, Fr. (1972),27, n∘ 3–4, pp. 77–88.
Berger-Vachon (C.). Conception d’une entrée vocale automatique.Thèse d’Etat, Lyon (1975), 302 p.
Roche (G.). Information utile en reconnaissance des formes et en compression des données. Application à la génération automatique de systèmes de reconnaissance optique et acoustique.Thèse d’Etat, Paris (1972), 223 p.
Mercier (G.).-Reconnaissance des formes, approximation des fonctions de décision et application à la reconnaissance des phénomènes.Thèse de 3e cycle (Math. appl.), Rennes (1969), 109 p.
Berger-Vachon (C.),Mesnard (G.),Gresser (J. Y.). Etude théorique et expérimentale des confusions données par un vocodeur. Applications à la reconnaissance de la parole.Ann. Télécommunic, Fr. (mai-juin 1975),30, n∘ 5–6, pp. 139–148.
Ferrieu (G.), Poncin (J.), Roux (G.), Vincent-Carrefour (J.). Synthèse et reconnaissance de la parole par calculateurs.Echo Rech., Fr. (juin 1968), n∘ 53, pp. 30–42.
Caelen (J.),Castan (S.),Perennou (G.). Reconnaissance de la parole en temps réel.Automatisme, Fr. (1972),17, n∘ 3, pp. 87–89.
Mercier (G.). Segmentation de la parole et reconnaissance des syllabes à l’intérieur des mots.Automatisme, Fr. (mars 1972),17, n∘ 3, pp. 69–75.
Berger-Vachon (G.),Mesnard (G.). Etude de la significativité d’un paramètre au niveau des reconsances de formes. Application au fondamental de la voix.Automatisme, Fr. (1975),19, pp. 257–267.
Abramson (N.). Information theory and coding (Théorie de l’information et du codage).MacGraw-Hill, New York (1962), 201 p.
Richards (D. L.). Distorsions of speech by quantizing (Distorsions du signal introduites par la numérisation).Electron. Letter, G. B. (juin 1967),3, n∘ 6, pp. 230–231.
Berger-Vachon (C.),Mesnard (G.). Efficacité du codage acoustique.5eJournée d’Etude du Groupe Communication Parlée organisée par le LIMSI, Orsay (15–17 mai 1974), Proc.1, pp. 176–185.
Author information
Authors and Affiliations
Rights and permissions
About this article
Cite this article
Berger-Vachon, C., Mesnard, G. Étude de l’erreur introduite par la numérisation du signal dans un problème de reconnaissance des formes: Application a la parole. Ann. Télécommun. 31, 321–332 (1976). https://doi.org/10.1007/BF02999891
Received:
Revised:
Issue Date:
DOI: https://doi.org/10.1007/BF02999891