Skip to main content
Log in

Space distortion and decomposition theory

A new approach to pattern recognition by vision

  • Published:
Kybernetik Aims and scope Submit manuscript

Abstract

It is shown that the mathematical methods hitherto used for solving pattern recognition problems are usually not well adapted with respect to the natural class-forming processes of patterns generated from objects of the real world. Especially the well known method using a multidimensional signal space is not suited for typical pattern recognition problems, although its value is unobjected for signal detection problems. The paper proposes to regard the class-forming process of patterns with the aid of spatial transformations, where here the three-dimensional space of the real world is considered. Accordingly, a space distortion theory for both two-dimensional and three-dimensional objects, respectively, has been developed. It leads to recognition schemes using a generalized correlation technique. The generalization consists of an adaptive spatial transformation process prior to correlation. By this way, pattern recognition is supposed to be an adaptive control process using optimization methods. The decomposition theory proposes the application of this method on separate parts of the decomposed picture.

Zusammenfassung

Die bekannten mathematischen Methoden der Mustererkennung benutzen für die Signaldarstellung einen Raum hoher Dimension, den sog. Nachrichtenraum, dessen Koordinaten die Abtastwerte (oder Bildpunkte) des diskret dargestellten Signals sind. Die notwendige Vorverarbeitung (Merkmalsextraktion) und die anschließende Klassifizierung werden als Operation in diesem Nachrichtenraum durchgeführt.

In dieser Arbeit wird gezeigt, daß der Nachrichtenraum für Mustererkennungsaufgaben nicht trivialer Art, wie z. B. handgeschriebene Zeichen oder geometrische Objekte in beliebiger Lage im Raum eine ungeeignete Darstellung des Problems ist. Dies beruht darauf, daß die Verteilung der zu den verschiedenen Klassen gehörenden Muster als Punkte im Nachrichtenraum im allgemeinen durchmischt und daher nicht separabel ist. Daran ändern auch die oft angewandten linearen Transformationen nichts (z. B. FourierTransformation, Loève-Karhunen-Transformation, HadamardTransformation), da diese nur eine Translation, Rotation sowie eine lineare Verzerrung des Nachrichtenraumes bewirken können, ohne seine innere Struktur zu verändern. Es wird daher in dieser Arbeit vorgeschlagen, anstelle des vieldimensionalen Nachrichtenraumes den Raum der realen Welt zu betrachten und in diesem Koordinatentransformationen durchzuführen. Die einfachsten Transformationen dieser Art sind die geometrischen Transformationen infolge der Lageveränderung der Objekte. Sie haben 6 Freiheitsgrade, nämlich 3 Translationen und 3 Rotationen entsprechend den 3 Raumkoordinaten. Bei Einbeziehung der linearen Vergrößerung des Objekts unter Beibehaltung der Form ergeben sich 7 Freiheitsgrade, die wiederum bei Vernachlässigung der perspektivischen Verzerrungen des Objektbildes auf 6 reduziert werden können. Das nach dieser Theorie vorgeschlagene Erkennungssystem führt diese geometrischen Transformationen bzw. Rücktransformationen in adaptiver Weise durch, wobei als Indikator für die Annäherung eine Kreuzkorrelation mit einem die Musterklasse repräsentierenden idealen Prototyp vorgesehen ist. Bei räumlichen Objekten kann für diese Korrelation nur die Projektion des Objektes auf das zweidimensionale Bildfeld verwendet werden, wodurch gewisse Mehrdeutigkeiten nicht absolut auszuschließen sind, es sei denn, das Objekt wird bewegt oder von verschiedenen Seiten her betrachtet. Das Erkennungssystem führt somit eine geometrische Transformation nach 6 oder 7 Freiheitsgraden durch, die adaptiv optimiert wird. Anders ausgedrückt wird ein räumlich-geometrisches Zielfindungsverfahren (tracking) durchgeführt, mit dem der Mustererkennungsvorgang untrennbar verbunden ist. Es ist zu erwarten, daß dieses Verfahren sowohl für planare Objekte, wie z. B. handgeschriebene Zeichen, als auch für räumliche Objekte bei einer relativ einfachen Realisierung zu wesentlich besseren Ergebnissen führt als die bisherigen auf Transformationen im Nachrichtenraum beruhenden Verfahren.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Similar content being viewed by others

References

  • Andrews,H.C.: An introduction to mathematical techniques in pattern recognition. New York: John Wiley and Sons, 1972

    Google Scholar 

  • Nagy,G.: State of the art in pattern recognition. Proc. IEEE, 56, 836–862 (1968)

    Google Scholar 

  • Bibliography on digital image processing and related topics. USCEE Report 410

  • Huang,T.S., Schreiber,W.F., Tretiak,O.J.: Image processing. Proc. IEEE, 59, 1586–1610(1971)

    Google Scholar 

  • Pratt,W.K.: A comparison of digital image transforms. Proceedings of the Mervin J. Kelly Communications Conference, University of Missouri, Rolla, 1970

    Google Scholar 

  • Bremermann,H.J.: What mathematics can and cannot do for pattern recognition. In: Proceedings of the 4th Congress of the Deutsche Gesellschaft für Kybernetik. Berlin-Heidelberg-New York: Springer 1971

    Google Scholar 

  • Hoffman,W.C.: The Lie algebra of visual perception. J. Math. Psych. 3, 65–98(1966); 4, 348–349 (1967)

    Google Scholar 

  • Marko,H.: Die Anwendung nachrichtentheoretischer Methoden in der Biologie. In: Marko,H., Färber,G. (Hrsg.): Kybernetik 1968; pp. 21–44. München; R. Oldenburg, 1968

    Google Scholar 

  • Marko,H.: Die Systemtheorie der homogenen Schichten. Kybernetik 5, 221–240 (1969)

    Google Scholar 

  • Marko,H.: A biological approach of pattern recognition. (In preparation)

  • Marko,H.: Giebel,H.: Recognition of handwritten characters with a system of homogeneous layers. Nachr. techn. Z. 23, 455–459 (1970)

    Google Scholar 

  • Platzer,H.: The simulation of a system of homogeneous layers with coherent light. In: Proceedings of the 4th Congress of the Deutsche Gesellschaft für Kybernetik. Berlin-Heidelberg-New York: Springer 1971

    Google Scholar 

  • Vicar Image Processing System: Guide to System Use. Jet Propulsion Laboratory, Pasadena, California, Fef. 324-IPG/1067, October 1, 1968

    Google Scholar 

  • Reichardt,W.: Musterinduzierte Flugorientierung. Naturwissenschaften 60, 122–138 (1973)

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Rights and permissions

Reprints and permissions

About this article

Cite this article

Marko, H. Space distortion and decomposition theory. Kybernetik 13, 132–143 (1973). https://doi.org/10.1007/BF00270507

Download citation

  • Received:

  • Issue Date:

  • DOI: https://doi.org/10.1007/BF00270507

Keywords

Navigation