Big Data in Medizin und Gesundheitswesen

Leitthema

Zusammenfassung

Das Gesundheitswesen ist eine der Branchen mit dem größten Potenzial für Big Data. Laut der üblichen Definition bezieht sich Big Data auf die Tatsache, dass Datenmengen mittlerweile oft zu groß und zu heterogen sind und zu schnell wachsen, um sie mit herkömmlichen Technologien zu speichern, zu analysieren und nutzbar zu machen. Vorangetrieben wird Big Data durch drei technologische Trends: Geschäftsprozesse werden vermehrt elektronisch durchgeführt, Privatpersonen produzieren immer mehr Daten – z. B. in sozialen Netzwerken – und die Digitalisierung schreitet immer weiter voran, durch Smartphones und Apps bis in den Alltag. Auch in Medizin und Gesundheitswesen zeichnen sich neue Trends zu interessanten neuen Datenquellen und zu innovativen Möglichkeiten der Datenanalyse ab. Dies betrifft zum einen die Forschung. Hier benötigen etwa die Omics-Forschung klar Big-Data-Technologien. In der medizinischen Praxis bieten insbesondere die elektronische Patientenakte, freie öffentliche Daten und der Trend des Quantified Self, also der Vermessung des eigenen Verhaltens, neue Möglichkeiten für die Datenanalyse. Hinsichtlich der Analytik gibt es in der jüngsten Vergangenheit insbesondere deutliche Fortschritte bei der Informationsextraktion aus Textdaten, die viele Daten aus der medizinischen Dokumentation für eine Analyse erschließt. Gleichzeitig ist aber hier durch spezielle fachliche, rechtliche und ethische Rahmenbedingungen in Medizin und Gesundheitswesen die Anwendung von Big Data noch deutlich weniger ausgeprägt als in anderen Branchen. Erste interessante Best-Practice-Beispiele in der Medizin und im Gesundheitsbereich lassen aber innovative Ansätze und Ergebnisse erwarten. Der vorliegende Beitrag gibt eine Übersicht über die Potenziale von Big Data in der Medizin und im Gesundheitswesen.

Schlüsselwörter

Big Data Data Mining Data Science Analyse 

Big data in medicine and healthcare

Abstract

Healthcare is one of the business fields with the highest Big Data potential. According to the prevailing definition, Big Data refers to the fact that data today is often too large and heterogeneous and changes too quickly to be stored, processed, and transformed into value by previous technologies. The technological trends drive Big Data: business processes are more and more executed electronically, consumers produce more and more data themselves − e.g. in social networks − and finally ever increasing digitalization. Currently, several new trends towards new data sources and innovative data analysis appear in medicine and healthcare. From the research perspective, omics-research is one clear Big Data topic. In practice, the electronic health records, free open data and the “quantified self” offer new perspectives for data analytics. Regarding analytics, significant advances have been made in the information extraction from text data, which unlocks a lot of data from clinical documentation for analytics purposes. At the same time, medicine and healthcare is lagging behind in the adoption of Big Data approaches. This can be traced to particular problems regarding data complexity and organizational, legal, and ethical challenges. The growing uptake of Big Data in general and first best-practice examples in medicine and healthcare in particular, indicate that innovative solutions will be coming. This paper gives an overview of the potentials of Big Data in medicine and healthcare.

Keywords

Big Data Data Mining Data Science Analytics 

Literatur

  1. 1.
    McKinsey (2014) The Big Data revolution in US healthcare. http://healthcare.mckinsey.com/big-data-revolution-us-healthcare. Zugegriffen: 3. Januar 2015
  2. 2.
    Mayer-Schönberger V, Cukier K (2013) Big data: a revolution that will transform how we live, work, and think. Houghton Mifflin Harcourt Publishing, Boston, MAGoogle Scholar
  3. 3.
    Gartner (2011) Gartner says solving ‚big data‘ challenge involves more than just managing volumes of data. http://www.gartner.com/newsroom/id/1731916. Zugegriffen: 3. Januar 2015
  4. 4.
    Conway D (2010) The data science venn diagram. http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram. Zugegriffen: 3. Januar 2015
  5. 5.
    Rao A (2014) The 5 dimensions of the so-called data scientist. http://usblogs.pwc.com/emerging-technology/the-5-dimensions-of-the-so-called-data-scientist. Zugegriffen: 3. Januar 2015
  6. 6.
    The Guardian (2014) Why Google has 200 m reasons to put engineers over designers. http://www.theguardian.com/technology/2014/feb/05/why-google-engineers-designers. Zugegriffen: 20. Februar 2015
  7. 7.
    Langkafel P (2014) Intro Big Data for Healthcare. In: Langkafel P (Hrsg) Big Data in Medizin und Gesundheitswirtschaft. Medhochzwei, Heidelberg, S 1–36Google Scholar
  8. 8.
    HiMSS Analytics (2015) U.S. EMR Adoption Model Trends. http://www.himssanalytics.org/docs/EMRAMCriteriaShee2014v2.pdf. Zugegriffen: 3. Januar 2015
  9. 9.
    Holzinger A, Schantl J, Schroettner M, Seifert C, Verspoor K (2014) Biomedical text mining: state-of-the-art, open problems and future challenges. In: Holzinger A, Jurisica I (Hrsg) Interactive knowledge discovery and data mining in biomedical informatics. Springer, Berlin S 5–16CrossRefGoogle Scholar
  10. 10.
    FDA (2015) openFDA. http://open.fda.gov. Zugegriffen: 3. Januar 2015
  11. 11.
    Ginsberg J et al (2009) Detecting influenza epidemics using search engine query data. Nature 457:1012–1014. doi:10.1038/nature07634CrossRefPubMedGoogle Scholar
  12. 12.
    Lazer D, Kennedy R, King G, Vespignani A (2014) The parable of Google Flu: traps in big data analysis. Science 343:1203–1205. doi:10.1126/science.1248506CrossRefPubMedGoogle Scholar
  13. 13.
    Salathe M et al (2012) Digital epidemiology. PLoS Comput Biol 8(7):e1002616 doi:10.1371/journal.pcbi.1002616Google Scholar
  14. 14.
    Saffer J, Burnett V (2014) Introduction to biomedical literature text mining: context and objectives. In: Kumar V, Tipney H (Hrsg) Biomedical Literature Mining. Springer, New York, S 1–10CrossRefGoogle Scholar
  15. 15.
    Frijters R et al (2010) Literature mining for the discovery of hidden connections between drugs, genes and diseases. PLoS Comput Biol 6(9):e1000943, doi:10.1371/journal.pcbi.1000943Google Scholar
  16. 16.
    Patientslikeme.com (2015) http://www.patientslikeme.com. Zugegriffen: 03. Januar 2015.
  17. 17.
    Wicks P et al (2011) Accelerated clinical discovery using self-reported patient data collected online and a patient-matching algorithm. Nature Biotechnology 29:411–414, doi:10.1038/nbt.1837Google Scholar
  18. 18.
    PatientsLikeMe (2015) PatientsLikeMe adds information about patient experiences with medications to Walgreens Pharmacy website. http://news.patientslikeme.com/press-release/patientslikeme-adds-information-about-patient-experiences-medications-walgreens-pharma. Zugegriffen: 20. Februar 2015
  19. 19.
    Mobile Health Economics (2014) mHealth App Developer Economics 2014. http://mhealtheconomics.com/mhealth-developer-economics-report/. Zugegriffen: 3. Januar 2015
  20. 20.
    Röhrig B et al (2009) Types of study in medical research - part 3 of a series on evaluation of scientific publications. Dtsch Arztebl Int 106(15):262–268, doi:10.3238/arztebl.2009.0262Google Scholar
  21. 21.
    Stuart EA (2010) Matching methods for causal inference: A review and a look forward. Statistical Science 25:1–21, doi:10.1214/09-STS313Google Scholar
  22. 22.
    Ihtsdo (2015) What is SNOMED CT? http://www.ihtsdo.org/snomed-ct/what-is-snomed-ct. Zugegriffen: 20. Februar 2015
  23. 23.
    Paraiso-Medina S et al (2015) Semantic normalization and query abstraction based on SNOMED-CT and HL7: supporting multicentric clinical Trials. IEEE J Biomed Health Inform 199(3):10161–101677, doi:10.1109/JBHI.2014.2357025Google Scholar
  24. 24.
    Shen R, Chittibabu G (2014) Applied graph-mining algorithms to study biomolecular interaction networks. Biomed Res Int 2014. doi:10.1155/2014/439476Google Scholar
  25. 25.
    Shera F et al (2014) The p-medicine portal-a collaboration platform for research in personalised medicine. Ecancermedicalscience 8(398). doi:10.3332/ecancer.2014.398Google Scholar
  26. 26.
    The International Society of Paediatric Oncology (2013) SIOP 2013 scientific programme + index. Pediatr Blood Cancer 60:S1–S264, doi:10.1002/pbc.24719Google Scholar
  27. 27.
    Aggarwal C, Yu P (2008) A general survey of privacy-preserving data mining models and algorithms. In: Aggarwal C, Yu P (Hrsg) Privacy-preserving data mining – models and algorithms. Springer, New York, S 11–52CrossRefGoogle Scholar

Copyright information

© Springer-Verlag Berlin Heidelberg 2015

Authors and Affiliations

  1. 1.Fraunhofer-Institut Intelligente Analyse- und Informationssysteme IAIS, Geschäftsfeldleiter Big Data AnalyticsSt. AugustinDeutschland

Personalised recommendations