Zusammenfassung
Nachdem wir in dem vorangegangenen Kapitel einige grundlegende Algorithmen für das exakte String-Matching vorgestellt haben, werden wir uns in diesem Kapitel mit Problemen auseinandersetzen, die zum Beispiel im Umgang mit fehlerhaften String-Daten auftreten. Da die Daten, die uns in molekularbiologischen Anwendungen zur Verfügung stehen, immer experimentell gewonnen wurden, und somit mit Messfehlern behaftet sein können, wollen wir die Fragestellungen des vorherigen Kapitels verallgemeinern: Statt zwei Strings exakt miteinander zu vergleichen, möchten wir wissen, ob die gegebenen Strings ungefähr übereinstimmen, oder ob ein gegebenes Muster ungefähr als Teilstring in einem gegebenen Text vorkommt. Um dieses Ziel zu erreichen, werden wir in diesem Kapitel verschiedene Ähnlichkeitsmaße für Strings definieren, und Algorithmen zum Vergleich von Strings vorstellen. Die Idee dieser so genannten Alignment-Verfahren besteht darin, die Strings durch Einfügen von Lücken so gegeneinander auszurichten, dass möglichst viele Positionen übereinstimmen.
This is a preview of subscription content, log in via an institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsPreview
Unable to display preview. Download preview PDF.
Literaturhinweise
D. Gusfield: Algorithms on Strings, Trees, and Sequences. Cambridge University Press, 1997.
P. A. Pevzner: Computational Molecular Biology - An Algorithmic Approach. MIT Press, 2000.
J. Setubal und J. Meidanis: Introduction to Computational Molecular Biology. PWS Publishing Company, 1997.
M. S. Waterman: Introduction to Computational Biology — Maps, Sequences and Genomes. Chapman & Hall/CRC, 1995.
S. Henikoff und J. G. Henikoff: Amino acid substitution matrices from protein blocks. Proceedings of the National Academy of Sciences of the U.S.A. 89, 1992, pp. 10915–10919.
W. R. Pearson: Flexible sequence similarity searching with the FASTA3 program package. Methods in Molecular Biology: Bioinformatics Methods and Protocols 132, 2000, pp. 185–219.
S. F. Altschul, W. Gish, W. Miller, E. W. Myers and D. J. Lipman: A basic local alignment search tool. Journal of Molecular Biology 215, 1990, pp. 403–410.
S. F. Altschul, T. L. Madden, A. Zhang, Z. Zhang, W. Miller and D. J. Lipman: Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research 25, 1997, 3389–3402.
R. Rauhut: Bioinformatik — Sequenz — Struktur — Funktion. Wiley-VCH, 2001.
H. Carillo and D.J. Lipman: The multiple sequence alignment problem in biology. SIAM Journal on Applied Mathematics 48, 1988, pp. 1073–1082.
M. Li, B. Ma and L. Wang: Finding similar regions in many strings. Proceedings of the 31st ACM Annual Symposium on the Theory of Computing (STOC’99), 1999, pp. 473–482.
L. Wang und T. Jiang: On the complexity of multiple sequence alignment. Journal of Computational Biology 1 (4), 1994, pp. 337–348.
D. Feng und R. Doolittle: Progressive sequence alignment as a prerequisite to correct phylogenetic trees. Journal of Molecular Evolution 25, 1987, pp. 351–360.
D. Gusfield: Efficient methods for multiple sequence alignment with guaranteed error bounds. Bulletin of Mathematical Biology 55, 1993, pp. 141–154.
D. Gusfield: Algorithms on Strings, Trees, and Sequences. Cambridge University Press, 1997.
Author information
Authors and Affiliations
Rights and permissions
Copyright information
© 2003 B. G. Teubner Verlag / GWV Fachverlage GmbH, Wiesbaden
About this chapter
Cite this chapter
Böckenhauer, HJ., Bongartz, D. (2003). Alignment-Verfahren. In: Algorithmische Grundlagen der Bioinformatik. Leitfäden der Informatik. Vieweg+Teubner Verlag. https://doi.org/10.1007/978-3-322-80043-5_5
Download citation
DOI: https://doi.org/10.1007/978-3-322-80043-5_5
Publisher Name: Vieweg+Teubner Verlag
Print ISBN: 978-3-519-00398-4
Online ISBN: 978-3-322-80043-5
eBook Packages: Springer Book Archive