Skip to main content

Zusammenfassung

Business Intelligence (BI) verfolgt die Erfüllung der Unternehmensziele durch die systematische Analyse von Daten zur Entscheidungsunterstützung. Die dafür eingesetzten analytischen Informationssysteme dienen im Rahmen der BI der Erkenntnisgewinnung und Verbesserung der Unternehmensprozesse, indem Entscheidungsträgern durch den Einsatz verschiedener Analysewerkzeuge relevante Informationen zur Verfügung gestellt werden können. Als wesentliche Komponente zur Unterstützung der BI werden Data-Warehouse-Systeme (DWS) als zentraler, unternehmensweiter Datenspeicher eingesetzt.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 59.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 79.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Vgl. Anandarajan, Anandarajan, Srinivasan /BI/, Kemper, Baars, Mehanna /BI/

  2. 2.

    Vgl. Chamoni, Gluchowski /Integrationstrends/, Mehrwald /Datawarehousing/ 14.

  3. 3.

    Vgl. Inmon /DW/, Bauer, Günzel /DWS/

  4. 4.

    Vgl. Melchert, Winter, Klesse /Process Automation/, Scheer /Enterprise/, Bange, Mack /DW/

  5. 5.

    Vgl. Inmon /Lifecycle/ 7, Dippold et al. /Datenmanagement/ 215, Howard /Architecture/, Markowski, Hahne /Daten/ 46, Gutberlet, Hahne /SLAs/ 38.

  6. 6.

    Vgl. Kimball /DW/ 4, Gluchowski, Kemper /BI/, Anandarajan, Anandarajan, Srinivasan /BI/, Gluchowski, Hahne /Speichertechnologien/ 33, Hahne /SAP/ 5.

  7. 7.

    Vgl. Heinzel /NLS/

  8. 8.

    Vgl. Fischer /SAP ILM/ 5, Howard /Architecture/ 3, Jin, Xiong, Wu /Information Value/

  9. 9.

    NLS beschreibt Speichermedien, auf die Anwendungssysteme auch nach der Verlagerung der Daten in den NLS weiterhin zugreifen können. Ein manuelles Zurückladen der Daten, anders als bei einer Archivierung, ist für die Datenanalyse nicht notwendig.

  10. 10.

    Vgl. Liu, Li, Zhang /Dispatching/, Hahne /NLS/, Heinzel /NLS/

  11. 11.

    Vgl. Loos et al. /IMDM/, Poess, Nambiar /Servers/, Schaffner et al. /Database/

  12. 12.

    Vgl. Lilienthal /Model/

  13. 13.

    Entgegen der Bezeichnung „Information Lifecycle Management“ betrachtet ILM nicht Informationen, sondern Daten. Da sich die Bezeichnung in der Praxis und Wissenschaft jedoch durchgesetzt hat, werden in dieser Arbeit ebenfalls die Begriffe ILM und Informationslebenszyklus verwendet. In dieser Arbeit werden Informationen als durch den Menschen inhaltlich verstandene, gespeicherte Daten verstanden. Daten dienen aus technischer Perspektive der digitalen Darstellung von Informationen und werden erst durch die menschliche Interpretation zu Informationen. Für Details zu Daten und Informationen sowie deren Abgrenzung vgl. Heinrich, Riedl, Stelzer /Informationsmanagement/ und Stahlknecht, Hasenkamp /Wirtschaftsinformatik/.

  14. 14.

    Für Definitionen von ILM vgl. Petrocelli /Data Protection/, Thome, Sollbach /ILM/, Funk et al. /Modellierung/, Peterson /ILM/

  15. 15.

    Daten werden in publizierten Verfahren nach verschiedenen Gesichtspunkten ausgewertet, um geeignete Maßnahmen abzuleiten. Verschiedene Autoren bewerten Daten monetär – vgl. Moody, Walsh /Measuring/, Glazer /Measuring/. Andere weisen den Daten einen Wert zu – vgl. Chen /Information valuation/, Gibson, Miller /Prediction Algorithm/, Turczyk et al. /Methode/ oder klassifizieren die Daten ggf. auch anhand ihres zugewiesenen Wertes – vgl. Mesnier et al. /classification/, Shah et al. /ACE/, Kosler, Matthesius, Stelzer /Klassifizierung/. In der Literatur zu ILM wird konstatiert, dass sich der „Wert“ der Daten über die Zeit ändert. Je nach Publikation kann damit eine zeitliche Veränderung sowohl eines monetären Wertes, eines Zahlenwertes (der zur Bestimmung der geeigneten Datenspeicherung berechnet wird) sowie auch ein Wert im Sinne einer Relevanz und Bedeutung für die Unternehmensprozesse gemeint sein. Im Verlauf dieser Arbeit wird Daten ein Wert zugewiesen, um die geeignete Speicherung abzuleiten. Deshalb wird hier von einer Wertzuweisung gesprochen, sofern es sich nicht um die Wiedergabe von Inhalten in der Literatur handelt.

  16. 16.

    Vgl. Thome, Sollbach /ILM/, Born et al. /Leitfaden/ 6, Turczyk et al. /Approach/ 2.

  17. 17.

    Vgl. Thome, Sollbach /ILM/ 22. Für empirische Ergebnisse bzgl. beobachteter Lebenszyklen von Daten vgl. Chen /Information valuation/ und Jin, Xiong, Wu /Information Value/

  18. 18.

    Eine Vorstellung der Besonderheiten von DWS-Daten findet in den Abschnitten 2 und 3.3 statt.

  19. 19.

    Vgl. Inmon /DW/ 33 ff., Kimball /DW/ 6 ff., Bauer, Günzel /DWS/

  20. 20.

    Vgl. Thome, Sollbach /ILM/, Matthesius, Stelzer /Informationsbewertung/

  21. 21.

    Eine Übertragbarkeit von Dateikonzepten wird in Abschnitt 4.3 untersucht.

  22. 22.

    Vgl. Devlin /DW/ 169 ff., Turczyk et al. /Methode/

  23. 23.

    Vgl. Bhagwan et al. /Management/, Chen /Information valuation/, Shah et al. /ACE/

  24. 24.

    Vgl. Thome, Sollbach /ILM/

  25. 25.

    Vgl. Devlin /DW/ 169 ff., Turczyk et al. /Methode/, Matthesius, Stelzer /Informationsbewertung/, Wijnhoven, Amrit, Bax /Applicability/, Chen /Information valuation/; siehe Fußnote 15.

  26. 26.

    Die Begriffe ‚Daten in DWS‘, sowie ‚DWS-Daten‘ werden im Rahmen dieser Arbeit synonym als Kurzform für Daten verwendet, die in Data-Warehouse-Systemen gespeichert werden.

  27. 27.

    Eine Übersicht, welche Bereiche durch bestehende Ansätze abgedeckt werden, erfolgt im Kapitel 4 zum Stand der Forschung.

  28. 28.

    Vgl. Thome, Sollbach /ILM/, Chen /Information valuation/ und Jin, Xiong, Wu /Information Value/ können durch empirische Untersuchungen von Zugriffsverläufen auf Dateien drei Typen nachweisen: Dateien mit periodisch wiederkehrend häufigen Zugriffen (periodic), über die Zeit konstanter Zugriffsverlauf (constant) und kurz nach der Dateierstellung stark abnehmende Zugriffshäufigkeiten (bursty).

  29. 29.

    Der Begriff Datenobjekt wird im Abschnitt 2.2 definiert.

  30. 30.

    Vgl. Kosler, Matthesius, Stelzer /Klassifizierung/

  31. 31.

    Unter Verfahren wird hier eine vorstrukturierte und nach bestimmten Regeln ablaufende Handlungsempfehlung verstanden (vgl. Bechmann, Hartlik /Bewertung/ 18). Dieses Verfahren soll Anweisungen zum gezielten Einsatz von Methoden enthalten (vgl. Stahlknecht, Hasenkamp /Wirtschaftsinformatik/ 212).

  32. 32.

    Diese können bspw. Zugriffshäufigkeit, Alter oder Inhalt der Daten sein. Weitere Kriterien werden im Laufe der Arbeit untersucht.

  33. 33.

    ‚In-Memory‘ steht hier für die Maßnahme, die Antwortzeit von Datenanalysen zu senken, indem Daten auf leistungsstarken, aber teuren Speichermedien gespeichert werden. Da im Rahmen der Forschung für hauptspeicherbasierte Datenbanken der Begriff ‚In-Memory-Datenmanagement‘ verwendet wird, wird diese Speicherhierarchie „über“ der Stufe ‚online‘ hier als ‚In-Memory‘ bezeichnet.

  34. 34.

    Wird ein online gespeichertes Datenobjekt bspw. als ‚nearline‘ klassifiziert, ergibt sich als ILM-Maßnahme das Verlagern in den Nearline-Speicher. Befindet sich das Datenobjekt bereits im Nearline-Speicher und wird als ‚nearline‘ klassifiziert, so ist die ILM-Maßnahme, dass das Datenobjekt auf seinem Speichermedium belassen wird.

  35. 35.

    Dies betrifft den Betrachtungsgegenstand, für den eine ILM-Maßnahme ergriffen werden soll bzw. der klassifiziert wird, etwa ganze Systeme, Datenobjekte, Datenbanktabellen oder einzelne Datensätze. Das ILM-Verfahren soll folglich diesen Kontext aufgreifen und die ILM-Maßnahme für den geeignetsten Betrachtungsgegenstand bestimmen.

  36. 36.

    Das ILM-Verfahren soll nicht auf einem einzigen Kriterium basieren, sondern mehrere Faktoren berücksichtigen.

  37. 37.

    Es sollte wenig bis keine menschliche Beteiligung notwendig sein.

  38. 38.

    Siehe Fußnote 15.

  39. 39.

    Vgl. March, Smith /Design/, March, Storey /Design science/, Hevner et al. /Design Science/, Österle et al. /Memorandum/

  40. 40.

    Vgl. Österle et al. /Memorandum/, Frank /Fundierung/, Frank /Conception/

  41. 41.

    Vgl. Hevner et al. /Design Science/

  42. 42.

    Vgl. Becker /Prozess/, Österle et al. /Memorandum/; Der Begriff „Analyse“ steht hier für die Analysephase des Forschungsvorhabens und nicht für die bisher erwähnte Analyse von Daten.

  43. 43.

    Vgl. Fettke /State-of-the-Art/

  44. 44.

    Vgl. Webster, Watson /Literature Review/

  45. 45.

    Vgl. WKWI /WI-Orientierungslisten/ 160 ff.

  46. 46.

    Vgl. Peffers et al. /DSR Methodology/

  47. 47.

    Die entsprechende Datenbasis wird in Abschnitt 5.2.1 vorgestellt.

  48. 48.

    Wird bspw. ein Datenobjekt auch nach mehreren Jahren regelmäßig und konstant verwendet ist eine Datenarchivierung nicht zweckmäßig. Kann für einzelne Datensätze des Objekts aber festgestellt werden, dass diese das Ende ihres ILZ erreicht haben und keine Zugriffe mehr zu erwarten sind, sollte das Datenobjekt nicht als Ganzes betrachtet werden, sondern es sollte der Anteil kaum noch verwendeter Daten(sätze) archiviert und als (Betrachtungs)Gegenstand der ILM-Maßnahmen gewählt werden. Der häufig genutzte Teil des Datenobjekts kann dann weiter im Online-Speicher verbleiben.

  49. 49.

    Es sollen aus Literatur und Befragungen lediglich Kandidaten für Kriterien hergeleitet werden. Es soll kein Anspruch darauf erhoben werden, dass die Literatur in diesem Punkt vollständig ist oder für die Kriterien eine Eignung bereits nachgewiesen wurde. Es werden wenige Experten explorativ befragt, die Kriterien anregen können, ohne durch eine Repräsentativität einen Anspruch auf Vollständigkeit zu fordern. Daran anschließend wird untersucht, ob diese Kandidaten für Kriterien für das ILM-Verfahren tatsächlich geeignet sind. Das Vorgehen wird im Folgenden erläutert.

  50. 50.

    Vgl. Wilde, Hess /Methodenspektrum/

  51. 51.

    S. Fußnote 49.

  52. 52.

    Vgl. Wilde, Hess /Methodenspektrum/

  53. 53.

    Vgl. Wilde, Hess /Methodenspektrum/, Leukel, Mueller, Sugumaran /DSR/

  54. 54.

    Vgl. Peffers et al. /DSR/, Schreiner, Hess, Benlian /Wirtschaftsinformatik/, Venable, Pries-Heje, Baskerville /Framework/

  55. 55.

    Vgl. Frank /Erfahrung/

  56. 56.

    Vgl. Peffers et al. /DSR Methodology/

  57. 57.

    Vgl. Baars /Impulse/, Becker et al. /Forschungsmethodik/

  58. 58.

    Vgl. dazu Heinrich, Heinzl, Roithmayr /Wirtschaftsinformatik/

  59. 59.

    Vgl. Dubé, Paré /Rigor/, Kitchenham, Pickard, Pfleeger /Case Studies/

  60. 60.

    Da ILM-Verfahren im DWS-Kontext einen bisher nicht erschlossenen Forschungsbereich darstellen, wird versucht, publizierte Verfahren auf den DWS-Kontext anzuwenden, was nur bei wenigen Verfahren möglich ist. Es werden die Ansätze von Tanaka et al. /Proposal/, Kosler, Matthesius, Stelzer /Klassifizierung/, Heinrich, Stelzer /Informationsmanagement/ S. 525 ff., Chen /Information valuation/ und Wijnhoven, Amrit, Bax /Applicability/ verwendet. Zusätzlich werden die in dieser Arbeit zur Kriterienevaluation erstellten Data-Mining-Modelle (MLP, Entscheidungsbaum, SVM) als alternative Verfahren analysiert.

  61. 61.

    Der Datensatz der Fallstudie wird dabei in zwei Zeiträume geteilt, wobei den Verfahren nur der erste Teil zur Datenklassifizierung zur Verfügung steht. Der zweite Teil dient als eine Testperiode, die verwendet wird, um die Klassifizierung jedes Verfahrens zu evaluieren. Für die Testperiode liegen die tatsächlichen Zugriffshäufigkeiten auf jedes zu klassifizierende Datenobjekt vor, sodass hier bestimmt werden kann, welche Objekte die meisten Zugriffe aufwiesen und damit der Klasse ‚In-Memory‘ zugeordnet werden sollten. Analog können weniger häufig verwendete Objekte der Klasse ‚online‘, folgend der Klasse ‚nearline‘ und ‚offline‘ sowie die Objekte mit den geringsten oder keinen Zugriffen der Klasse löschen zugordnet werden.

  62. 62.

    Vgl. Sonnenberg, vom Brocke /Evaluation/, Sonnenberg, vom Brocke /Evaluations/

  63. 63.

    Eine Beschreibung der Identifikation und Evaluation der Kriterien wird im Abschnitt 5.3 vorgenommen.

  64. 64.

    Vgl. Österle et al. /Memorandum/, Peffers et al. /DSR Methodology/

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Sebastian Büsch .

Rights and permissions

Reprints and permissions

Copyright information

© 2023 Der/die Autor(en), exklusiv lizenziert an Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Büsch, S. (2023). Einleitung. In: Entwicklung und Evaluation eines Verfahrens zur Datenspeicherung in Data-Warehouse-Systemen auf Basis des Information Lifecycle Managements. Forschung zur Digitalisierung der Wirtschaft | Advanced Studies in Business Digitization . Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-40304-1_1

Download citation

  • DOI: https://doi.org/10.1007/978-3-658-40304-1_1

  • Published:

  • Publisher Name: Springer Gabler, Wiesbaden

  • Print ISBN: 978-3-658-40303-4

  • Online ISBN: 978-3-658-40304-1

  • eBook Packages: Business and Economics (German Language)

Publish with us

Policies and ethics