Zusammenfassung
Große Datenmengen, wie sie üblicherweise bei Expressionsanalysen anfallen, entziehen sich häufig einer direkten Interpretation. Diese Daten stellen eine besondere Schwierigkeit dar, da sie meist aus wenigen Expressionsprofilen mit vielen Werten bestehen. Ansätze des maschinellen Lernens und statistische Verfahren der Mustererkennung und des Data-Mining sind geeignet, diesen Herausforderungen zu begegnen. Jedoch ist auch bei diesen Verfahren Vorsicht geboten, da eine blinde Anwendung oft zu Überinterpretationen führt. Die nachfolgende Übersicht soll das Prinzip moderner biostatistischer Verfahren aufzeigen. Außerdem soll eine mögliche Anwendung zur Analyse von Expressionsprofilen des Prostatakarzinoms skizziert werden.
Abstract
Data emerging from DNA microarray experiments are usually difficult to interpret. While the level of expression of several thousand genes can be measured in a single experiment, only a few dozen experiments are normally carried out, leading to data sets of very high dimensionality and low cardinality. The computational analysis of gene expression data makes significant usage of machine learning and statistical methods. Nevertheless, caution should be used in the blind adoption of these methods, as this usually leads to an over-interpretation of the expression profiles. The following presentation provides an overview of up-to-date principles of biostatistical analysis. A potential application for the analysis of high-dimensional expression profiles of prostate cancer is given.
Literatur
Alizadeh AA, Eisen MB, Davis RE et al. (2000) Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 403 (6769): 503–511
Cherkassky V, Mulier F (1998) Learning from data. Wiley, New York
Debouck C, Goodfellow PN (1999) DNA microarrays in drug discovery and development. Nat Genet (1 Suppl) 21: 48–50
Dhanasekaran SM, Barrette TR, Ghosh D et al. (2001) Delineation of prognostic biomarkers in prostate cancer. Nature 412 (6849): 822–826
Draghici S (2003) Data analysis tools for DNA microarrays. Chapman & Hall/CRC, Boca Raton
Eisen MB, Spellman PT, Brown PO, Botstein D (1998) Cluster analysis and display of genome wide expression patterns. Proc Natl Acad Sci USA 95: 14863–14868
Gress TM, Müller-Pillasch F, Geng M et al. (1996) A pancreatic cancer-specific expression profile. Oncogene 13: 1819–1830
Gress TM, Walrapp C, Frohme M et al. (1997) Identification of genes with pancreatic cancer-specific expression by use of cDNA representational difference analysis. Genes Chromosomes Cancer 19: 97–103
International Human sequencing Consortium (2001) Initial sequencing and analysis of the human genome. Nature 409: 860–921
Kestler HA, Müller A, Schwenker F et al. (2001) Cluster analysis of comparative genomic hybridisation data, Lecture Notes NATO ASI: Artificial Intelligence and Heuristic Methods for Bioinformatics S–40
Kohonen T (1995) Self-oranizing maps. Springer, Berlin Heidelberg New York Tokio
Kuefer R, Gschwend JE, Hautmann RE et al. (2003) Analysis of cDNA expression profiles of prostate carcinoma using a perceptron neural network. Urologe 42 (Suppl 1): 13
Marton MJ, DeRisi JL, Bennett HA et al. (1998) Drug target validation and identification of secondary drug target effects using DNA microarrays. Nat Med 4: 1293–1301
Mattfeldt T, Wolter H, Trijic D, Gottfried H-W, Kestler HA (2002) Chromosomal regions in prostatic carcinomas studied by comparative genomic hybridization, hierarchical cluster analysis and self-organizing feature maps, Anal Cell Pathol 24/4–5: 167–179
Ntzani EE, Ioannidis JP (2003) Predictive ability of DNA microarrays for cancer outcomes and correlates: an empirical assessment. Lancet 362: 1439–1444
Ross DT, Scherf U, Eisen MB et al. (2000) Systematic variation in gene expression patterns in human cancer cell lines. Nat Genet 24: 227–235
Rubin MA, Putzi M, Mucci N et al. (2000) Rapid („warm“) autopsy study for procurement of metastatic prostate cancer. Clin Cancer Res 6/3: 1038–1045
Scherf U, Ross DT, Waltham M et al. (2000) A gene expression database for the molecular pharmacology of cancer. Nat Genet 24: 236–244
Solinas-Toldo S, Lampel S, Stilgenbauer S et al. (1997) Matrix-based comparative genomic hybridization: Biochips to screen for genomic imbalances. Genes Chromosomes Cancer 20: 399–407
Venter JC, Adams MD, Myers EW et al. (2001) The sequence of the human genome. Science 291: 1304–1351
Wilgenbus KK, Lichter P (1999) DNA chip technology ante portas. J Mol Med 77: 761–768
Interessenkonflikt:
Der korrespondierende Autor versichert, dass keine Verbindungen mit einer Firma, deren Produkt in dem Artikel genannt ist, oder einer Firma, die ein Konkurrenzprodukt vertreibt, bestehen.
Author information
Authors and Affiliations
Corresponding author
Additional information
Gefördert durch den Stifterverband für die Deutsche Wissenschaft (Projekt: Forschungsdozenturen)
Rights and permissions
About this article
Cite this article
Kestler, H.A., Küfer, R. Wertigkeit und Notwendigkeit bioinformatischer Methoden zur Mikroarray-Datenanalyse. Urologe [A] 43, 669–674 (2004). https://doi.org/10.1007/s00120-004-0577-7
Issue Date:
DOI: https://doi.org/10.1007/s00120-004-0577-7