Advertisement

Datenbank-Spektrum

, Volume 12, Issue 1, pp 5–12 | Cite as

Umgang mit semantischer Heterogenität bei der Integration stromverarbeitender Systeme

Wie erzeugt man die vom Benutzer gewünschten Ergebnisse?
  • Frank Lauterwald
  • Michael Daum
  • Niko Pollner
  • Klaus Meyer-Wegener
Schwerpunktbeitrag

Zusammenfassung

Verteilte Datenstromverarbeitung unter Beteiligung heterogener Datenstromsysteme und Sensorknoten erfährt zunehmendes Interesse. Ein Problem dabei ist, dass die heute verfügbaren Datenstromsysteme sich hinsichtlich ihrer Verarbeitungslogik unterscheiden. Das zeigt sich darin, dass für vermeintlich gleiche Anfragen unterschiedliche Ergebnisse erzeugt werden bzw. Ergebnisströme unterschiedliches zeitliches Verhalten aufweisen. Problematisch ist das insbesondere für die automatische Integration heterogener Datenstromsysteme im Sinne einer Föderation, denn hier gibt der Anwendungsentwickler die Kontrolle darüber, wie und von welchem System Ergebnisse erzeugt werden, an einen Koordinator ab. Der möglichen Abweichungen muss sich der Anwendungsentwickler bewusst sein und er muss angeben können, welche davon er in Kauf nehmen will. Dieser Beitrag beschreibt einen Ansatz, der es dem Anwendungsentwickler wahlweise erlaubt, präzise zu definieren, wie eine Anfrage verarbeitet werden soll oder dem System bestimmte Teilaspekte freizustellen, um so Optimierungspotentiale zu nutzen. Unterstützt wird er dabei durch eine Visualisierung der möglichen Unterschiede im Anfrageergebnis.

Schlüsselwörter

Datenströme Verteilung Semantische Heterogenität Qualität 

Literatur

  1. 1.
    Abadi DJ, Madden S, Lindner W (2005) REED: robust, efficient filtering and event detection in sensor networks. In: 31st conference on very large data bases (VLDB), S 769–780 Google Scholar
  2. 2.
    Aberer K, Hauswirth M, Salehi A (2007) Infrastructure for data processing in large-scale interconnected sensor networks. In: 8th international conference on mobile data management (MDM), S 198–205 CrossRefGoogle Scholar
  3. 3.
    Botan I, Cho Y, Derakhshan R, Dindar N, Haas L, Kim K, Lee C, Mundada G, Shan M, Tatbul N, Yan Y, Yun B, Zhang J (2009) Design and implementation of the MaxStream federated stream processing architecture. Tech rep TR-632, ETH Zürich, Department of Computer Science Google Scholar
  4. 4.
    Botan I, Derakhshan R, Dindar N, Haas L, Miller R, Tatbul N (2009) Explaining the execution semantics of sliding window queries over data streams: a work in progress report. Tech rep, ETH Zürich, Department of Computer Science Google Scholar
  5. 5.
    Botan I, Derakhshan R, Dindar N, Haas L, Miller RJ, Tatbul N (2010) SECRET: a model for analysis of the execution semantics of stream processing systems. In: International conference on very large data bases (VLDB’10), Singapore Google Scholar
  6. 6.
    Carney D, Cetintemel U, Cherniack M, Convey C, Lee S, Seidman G, Stonebraker M, Tatbul N, Zdonik S (2002) Monitoring streams—a new class of data management applications. In: 28th conference on very large data bases (VLDB), S 215–226. VLDB endowment. http://portal.acm.org/citation.cfm?id=1287389 CrossRefGoogle Scholar
  7. 7.
    Daum M, Lauterwald F, Baumgärtel P, Meyer-Wegener K (2010) Propagation of densities of streaming data within query graphs. In: 22nd international conference on scientific and statistical database management (SSDBM), S 584–601 Google Scholar
  8. 8.
    Daum M, Lauterwald F, Fischer M, Kiefer M, Meyer-Wegener K (2010) Integration of heterogeneous sensor nodes by data stream management. In: Hara T, Zadorozhny V, Buchmann E (Hrsg) Wireless sensor network technologies for information explosion era. Studies in computational intelligence, Bd 278. Springer, Berlin, S 139–172 CrossRefGoogle Scholar
  9. 9.
    Demers A, Gehrke J, Hong M, Riedewald M, White W (2006) Towards expressive publish/subscribe systems. In: 10th international conference on extending database technology (EDBT), S 627–644 Google Scholar
  10. 10.
    Gurgen L, Roncancio C, Labbé C, Bottaro A, Olive V (2008) SStreaMWare: a service oriented middleware for heterogeneous sensor data management. In: 5th international conference on pervasive services (ICPS), S 121–130 CrossRefGoogle Scholar
  11. 11.
    Jain N, Mishra S, Srinivasan A, Gehrke J, Widom J, Balakrishnan H, Çetintemel U, Cherniack M, Tibbetts R, Zdonik S (2008) Towards a streaming sql standard. Proc VLDB Endow 1(2):1379–1390 Google Scholar
  12. 12.
    Krämer J (2007) Continuous queries over data streams—semantics and implementation. PhD thesis, Philipps-Universität Marburg Google Scholar
  13. 13.
    Li J, Maier D, Tufte K, Papadimos V, Tucker PA (2005) Semantics and evaluation techniques for window aggregates in data streams. In: ACM SIGMOD international conference on management of data (SIGMOD), S 311–322 CrossRefGoogle Scholar
  14. 14.
    Madden SR, Franklin MJ, Hellerstein JM, Hong W (2005) TinyDB: an acquisitional query processing system for sensor networks. ACM Trans Database Syst 30:122–173 CrossRefGoogle Scholar
  15. 15.
    Microsoft (2011) SQL Server 2008 R2—StreamInsight. http://www.microsoft.com/sqlserver/2008/en/us/r2-complex-event.aspx. Abgerufen am 25.10.2011
  16. 16.
    SAP MaxDB—the SAP database. http://maxdb.sap.com/
  17. 17.
    StreamBase Systems, Inc (2011) StreamBase JUnit tests. http://www.streambase.com/developers/docs/latest/testdebug/part-junit.html: Abgerufen am 25.10.2011
  18. 18.
    Tatbul EN (2007) Load shedding techniques for data stream management systems. PhD thesis, Brown University. http://www.inf.ethz.ch/personal/tatbul/publications/phd_thesis06.pdf

Copyright information

© Springer-Verlag 2012

Authors and Affiliations

  • Frank Lauterwald
    • 1
  • Michael Daum
    • 1
  • Niko Pollner
    • 1
  • Klaus Meyer-Wegener
    • 1
  1. 1.Lehrstuhl für DatenmanagementUniversität Erlangen-NürnbergErlangen-NürnbergDeutschland

Personalised recommendations