Advertisement

Monatshefte für Chemie / Chemical Monthly

, Volume 127, Issue 4, pp 355–374 | Cite as

Analysis of RNA sequence structure maps by exhaustive enumeration I. Neutral networks

  • W. Grüner
  • R. Giegerich
  • D. Strothmann
  • C. Reidys
  • J. Weber
  • I. L. Hofacker
  • P. F. Stadler
  • P. Schuster
Anorganische Und Physikalische Chemie

Summary

Global relations between RNA sequences and secondary structures are understood as mappings from sequence space into shape space. These mappings are investigated by exhaustive folding of allGC andAU sequences with chain lengths up to 30. The computed structural data are evaluated through exhaustive enumeration and used as an exact reference for testing analytical results derived from mathematical models and sampling based on statistical methods. Several new concepts of RNA sequence to secondary structure mappings are investigated, among them that ofneutral networks (being sets of sequences folding into the same structure). Exhaustive enumeration allows to test several previously suggested relations: the number of (minimum free energy) secondary structures as a function of the chain length as well as the frequency distribution of structures at constant chain length (commonly resulting in generalized forms ofZipf's law).

Keywords

Neutral networks Random graphs RNA secondary structures Zipf's law 

Analyse der Beziehungen zwischen RNA-Sequenzen und Sekundärstrukturen durch vollständige Faltung, 1. Mitt. Faltung, Neutrale Netzwerke

Zusammenfassung

Die globalen Benziehungen zwischen RNA-Sequenzen und Sekundärstrukturen werden als Abbildungen aus einem Raum aller Sequenzen in einen Raum aller Strukturen aufgefaßt. Diese Abbildungen werden durch Falten aller binären Sequenzen desGC-undAU-Alphabets mit Kettenlängen bis zun=30 untersucht. Die berechneten Strukturdaten werden durch vollständiges Abzählen ausgewertet und als eine exakte Referenz zum Überprüfen analytischer Resultate aus mathematischen Modellen sowie zum Testen statistisch erhobener Proben verwendet. Einige neuartige Konzepte zur Beschreibung der Beziehungen zwischen Sequenzen und Strukturen werden eingehend untersucht, unter ihnen der Begriff derneutralen Netzwerke. Ein neutrales Netzwerk besteht aus allen Sequenzen, die eine bestimmte Struktur ausbilden. Vollständiges Abzählen ermöglicht beispielsweise die Bestimmung aller Strukturen minimaler freier Energie in Abhängigkeit von der Kettenlänge ebenso wie die Bestimmung der Häufigkeitsverteilungen der Strukturen bei konstanten Kettenlängen. Die letzteren folgen einer verallgemeinerten FormZipfschen Gesetzes.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

References

  1. [1]
    Schuster P (1995) J Biotechnol41: 239–257Google Scholar
  2. [2]
    Fontana W, Konings DAM, Stadler PF, Schuster P (1993) Biopolymers33: 1389–1404Google Scholar
  3. [3]
    Fontana W, Griesmacher T, Schnabl W, Stadler PF, Schuster P (1991) Monatsh Chem122: 795–819Google Scholar
  4. [4]
    Hofacker IL, Fontana W, Stadler PF, Bonhoeffer S, Tacker M, Schuster P (1994) Monatsh Chem125: 167–188Google Scholar
  5. [5]
    Schuster P, Fontana W, Stadler PF, Hofacker IL (1994) Proc Roy Soc (London) B255: 279–284Google Scholar
  6. [6]
    Wright S (1932) In: Jones DF (ed) Int Proceedings of the Sixth International Congress on Genetics, vol 1, pp 356–366Google Scholar
  7. [7]
    Eigen M, McCaskill J, Schuster P (1989) Adv Chem Phys75: 149–263Google Scholar
  8. [8]
    Weinberger ED (1990) Biol Cybern63: 325–336Google Scholar
  9. [9]
    Fontana W, Stadler PF, Bornberg-Bauer EG, Griesmacher T, Hofacker IL, Tacker M, Tarazona P, Weinberger ED, Schuster P (1993) Phys Rev E47: 2083–2099Google Scholar
  10. [10]
    Schuster P, Stadler PF (1994) Comput Chem18: 295–314Google Scholar
  11. [11]
    Reidys C, Stadler PF, Schuster P (1995) Bull Math Biol (submitted; SFI-Preprint Series No. 95-07-058)Google Scholar
  12. [12]
    Grüner W, Giegerich R, Strothmann D, Reidys C, Weber J, Hofacker IL, Stadler PF, Schuster P (1996) Monatsh Chem127: 375–389Google Scholar
  13. [13]
    Sankoff D, Morin A-M, Cedergren RJ (1978) Can J Biochem56: 440–443Google Scholar
  14. [14]
    Cech TR (1988) Gene73: 259–271Google Scholar
  15. [15]
    Konings DAM, Hogeweg P (1989) J Mol Biol207: 597–614Google Scholar
  16. [16]
    Le S-Y, Zuker M (1990) J Mol Biol216: 729–741Google Scholar
  17. [17]
    Zuker M, Sankoff D (1984) Bull Math Biol46: 591–621Google Scholar
  18. [18]
    Zuker M (1989) In: Waterman MS (ed) Mathematical Methods for DNA Sequences. CRC Press, Boca Raton, FL, pp 159–184Google Scholar
  19. [19]
    Martinez HM (1984) Nucl Acid Res12: 323–335Google Scholar
  20. [20]
    Tacker M (1993) Robust Properties of RNA Secondary Structures. Thesis, University of ViennaGoogle Scholar
  21. [21]
    McCaskill JS (1990) Biopolymers29: 1105–1119Google Scholar
  22. [22]
    Nussinov R, Piecznik G, Griggs JR, Kleitman DJ (1978) SIAM J Appl Math35: 68–82Google Scholar
  23. [23]
    Mironov AA, Dyakonova LP, Kister AE (1985) J Biomol Struct Dyn2: 953Google Scholar
  24. [24]
    Mironov AA, Kister AE (1986) J Biomol Struct Dyn4: 1–9Google Scholar
  25. [25]
    Zuker M, mfold-2.0. ftp://snark.wustl.edu/pub/mfold-sgi-2.2.tar.Z. (Public Domain Software)Google Scholar
  26. [26]
    Hofacker IL, Fontana W, Stadler PF, Bonhoeffer LS, Tacker M, Schuster P. Vienna RNA Package ftp://ftp.itc.univie.ac.at/pub/RNA/ViennaRNA-1.03. (Public Domain Software)Google Scholar
  27. [27]
    Salser W (1977) Cold Spring Harbour Symp Quant Biol42: 985Google Scholar
  28. [28]
    Freier SM, Kierzek R, Jaeger JA, Sugimoto N, Caruthers MH, Neilson T, Turner DH (1986) Proc Natl Acad Sci USA83: 9373–9377Google Scholar
  29. [29]
    Jaeger JA, Turner DH, Zuker M (1989) Proc Natl Acad Sci USA Biochemistry86: 7706–7710Google Scholar
  30. [30]
    Tacker M, Stadler PF, Bornberg-Bauer EG, Hofacker IL, Schuster P (1995) (in preparation)Google Scholar
  31. [31]
    Fontana W, Schuster P (1987) Biophys Chem26: 123–147Google Scholar
  32. [32]
    Konings DAM (1990) (private communication)Google Scholar
  33. [33]
    Hogeweg P, Hesper B (1984) Nucl Acid Res12: 67–74Google Scholar
  34. [34]
    Shapiro BA, Zhang K (1990) CABIOS6: 309–318Google Scholar
  35. [35]
    Sakakibara Y, Brown M, Underwood RC, Saira Mian I, Haussler D (1993) Stochastic Contextfree Grammars for Modeling RNA. Report, UC Santa CruzGoogle Scholar
  36. [36]
    Sakakibara Y, Brown M, Hughey R, Mian IS, Sjölander K, Underwood RC, Haussler D (1993) The Application of Stochastic Context-free Grammars to Folding, Aligning and Modeling Homologous RNA Sequences. Report, UC Santa CruzGoogle Scholar
  37. [37]
    Hamming RW (1950) Bell Syst Tech J29: 147–160Google Scholar
  38. [38]
    Eschenmoser A (1993) Pure Appl Chem65: 1179–1188Google Scholar
  39. [39]
    Sant Lucia Jr. J, Kierzek R, Turner DH (1990) Biochemistry29: 8813–8819Google Scholar
  40. [40]
    Tinoco Jr. I, Chastain M, Chen X (1994) Clin Chem40: 646Google Scholar
  41. [41]
    Pley HW, Flaherty KM, McKay DB (1994) Nature372: 68–74Google Scholar
  42. [42]
    Pley HW, Flaherty KM, McKay DB (1994) Nature372: 111–113Google Scholar
  43. [43]
    Waterman MS (1978) Studies on Foundations and Combinatorics, Advances in Mathematics Supplementary Studies, Academic Press, New York,1: 167–212Google Scholar
  44. [44]
    Hofacker IL, Schuster P, Stadler PF (1993) SIAM J Disc Math (submitted)Google Scholar
  45. [45]
    Zipf GK (1949) Human Behaviour and the Principle of Least Effort. Addison-Wesley, Reading, MAGoogle Scholar
  46. [46]
    Chen YS (1989) Int J Gen Syst15: 232Google Scholar
  47. [47]
    Mandelbrot BB (1983) The Fractal Geometry of Nature. Freeman & Co., New YorkGoogle Scholar

Copyright information

© Springer-Verlag 1996

Authors and Affiliations

  • W. Grüner
    • 1
  • R. Giegerich
    • 2
  • D. Strothmann
    • 2
  • C. Reidys
    • 1
  • J. Weber
    • 1
  • I. L. Hofacker
    • 3
  • P. F. Stadler
    • 3
    • 4
  • P. Schuster
    • 1
    • 3
    • 4
  1. 1.Institut für Molekulare BiotechnologieJenaGermany
  2. 2.Technische FakultätUniv. BielefeldBielefeldGermany
  3. 3.Institut für Theoretische ChemieUniversität WienWienAustria
  4. 4.Santa Fe InstituteSanta FeUSA

Personalised recommendations