Monatshefte für Chemie / Chemical Monthly

, Volume 127, Issue 4, pp 375–389

Analysis of RNA sequence structure maps by exhaustive enumeration II. Structures of neutral networks and shape space covering

  • W. Grüner
  • R. Giegerich
  • D. Strothmann
  • C. Reidys
  • J. Weber
  • I. L. Hofacker
  • P. F. Stadler
  • P. Schuster
Anorganische Und Physikalische Chemie

DOI: 10.1007/BF00810882

Cite this article as:
Grüner, W., Giegerich, R., Strothmann, D. et al. Monatsh Chem (1996) 127: 375. doi:10.1007/BF00810882

Summary

The relations between RNA sequences and secondary structures are investigated by exhaustive folding of allGC andAU sequences with chain lengths up to 30. The technique oftries is used for economic data storage and fast retrieval of information. The computed structural data are evaluated through exhaustive enumeration and used as an exact reference for testing analytical results derived from mathematical models and sampling based on statistical methods. Several new concepts of RNA sequence to secondary structure mappings are investigated, among them the structure ofneutral networks (being sets of RNA sequences folding into the same structure),percolation of sequence space by neutral networks, and the principle ofshape space covering. The data of exhaustive enumeration are compared to the analytical results of arandom graph model that reveals the generic properties of sequence to structure mappings based on some base pairing logic. The differences between the numerical and the analytical results are interpreted in terms of specific biophysical properties of RNA molecules.

Keywords

Neutral networksPercolation of sequence spaceRNA foldingRNA secondary structuresShape space covering

Analyse der Beziehungen zwischen RNA-Sequenzen und Sekundärstrukturen durch vollständige Faltung, 2. Mitt. Struktur neutraler Netzwerke und Erfassung des Strukturraumes

Zusammenfassung

Die Beziehungen zwischen RNA-Sequenzen und ihren Sekundärstrukturen werden durch vollständiges Falten allerGC- undAU-Sequenzen mit Kettenlängen bis zun=30 untersucht. Die aus der Informatik bekannte Technik derTries wird zur ökonomischen Datenspeicherung und für rasches Retrieval der gespeicherten Information angewendet. Die berechneten Strukturdaten werden durch vollständiges Abzählen ausgewertet. Sie dienen unter anderem als eine exakte Referenz zum Testen analytischer Resultate aus mathematischen Modellen sowie zur Überprüfung der Ergebnisse statistischer Probennahmen. Verschiedene neuartige Konzepte zur Behandlung der Zusammenhänge zwischen RNA-Sequenzen und Sekundärstrukturen wurden anhand der gewonnenen Daten eingehend untersucht. Unter ihnen befinden sich die Struktur derneutralen Netzwerke (die Gesamtheit der RNA-Sequenzen, die eine bestimmte Struktur ausbilden), diePerkolation des Sequenzraumes durch neutrale Netzwerke sowie das Prinzip derErfassung des Strukturraumes durch einen kleinen Ausschnitt des Sequenzraumes. Die durch vollständiges Abzählen erhaltenen Daten werden mit den analytischen Ergebnissen eines auf der Theorie der Zufallsgraphen aufbauenden Modells verglichen. Dieses Modell gibt die generischen Eigenschaften von Sequenz-Struktur-Relationen wieder, welche lediglich aus der Existenz einer Paarungslogik resultieren. Differenzen zwischen den numerischen und den analytischen Resultaten können als Konsequenzen der spezifischen biophysikalischen Eigenschaften von RNA-Molekülen interpretiert werden.

Copyright information

© Springer-Verlag 1996

Authors and Affiliations

  • W. Grüner
    • 1
  • R. Giegerich
    • 2
  • D. Strothmann
    • 2
  • C. Reidys
    • 1
  • J. Weber
    • 1
  • I. L. Hofacker
    • 3
  • P. F. Stadler
    • 3
    • 4
  • P. Schuster
    • 1
    • 3
    • 4
  1. 1.Institut für Molekulare BiotechnologieJenaGermany
  2. 2.Technische FakultätUniv. BielefeldBielefeldGermany
  3. 3.Institut für Theoretische ChemieUniversität WienWienAustria
  4. 4.Santa Fe InstituteSanta FeUSA
  5. 5.Institut für Molekulare BiotechnologieJenaGermany