Skip to main content

News

Auswirkungen von Covid-19 auf Veranstaltungen im Jahr 2021

Auch im Jahr 2021 beeinflusst Corona zahlreiche wissenschaftliche Veranstaltungen. Wegen der unsicheren Prognose für die Situation im September konnte die BTW-Konferenz zum großen Bedauern aller Beteiligten nicht wie geplant als Präsenzveranstaltung in Dresden stattfinden. Die angenommenen Beiträge wurden im Rahmen einer virtuell durchgeführten „Lecture Series BTW2021“ während des Sommersemesters 2021 vorgestellt. Auch die internationalen Keynotes von Stratos Idreos (Harvard University) und Wang-Chiew Tan (Facebook AI) wurden in diesem Rahmen präsentiert. Zusätzliche „Fresh Thinking Talks“ von Jana Giceva (TU München) und Ziawasch Abedjan (Universität Hannover) stellten aktuelle Forschungsthemen vor. Dank der Unterstützung zahlreicher Sponsoren war eine kostenfreie Teilnahme nach vorheriger Registrierung möglich. Die durchweg zahlreiche Teilnahme der Datenbank-Community an den Sitzungen und insbesondere die aktive Diskussion im Anschluß ließ ein wenig Konferenzstimmung aufkommen, auch wenn wir uns natürlich alle wieder auf die nächste BTW 2023 als Präsenzveranstaltung freuen.

In der zweiten Jahreshälfte finden immer noch viele für die DBIS-Community relevanten Konferenzen ausschließlich digital statt, so zum Beispiel die SIGIR (11.–15. Juli) und die CIKM (1.–5. November). Es zeigt sich aber ein Trend zu hybriden Veranstaltungen. Die SIGMOD (20.–25. Juni) ergänzt die Onlinekonferenz durch eine lokale Veranstaltung in Xi’an (China), die sich an die chinesische Datenbank-Community richtet. Die VLDB (16.–20. August) ist ebenfalls als Kombination einer Online-Konferenz mit einer starken physischen Präsenz in Kopenhagen geplant. Man darf gespannt sein, wie gut solche Kombinationsformate funktionieren werden. Auch die Online-Konferenzen experimentieren immer noch mit unterschiedlichen Ansätzen. So werden die Vorträge bei der SIGIR als „Flipped Classroom“gehalten, d. h., die Videos werden vorab veröffentlicht, lediglich etwaige Fragen an die Autoren können zu festgelegten Zeiten gestellt werden.

Die Konferenzen im Jahr 2022 werden derzeit überwiegend als Präsenzkonferenzen geplant, so zum Beispiel die CIDR (11.–15. Januar 2022 in Chaminade, USA), die WSDM (21.–25. Februar 2022 in Phoenix, USA), die ECIR (10.–14. April 2022 in Stavanger, Norwegen) und die EDBT/ICDT (29. März bis 1. April 2022 in Edinburgh, UK).

Workshop Grundlagen von Datenbanken

Der Workshop „Grundlagen von Datenbanken“, der ursprünglich für die Pfingstwoche 2021 im Kloster Nimbschen in der Nähe von Leipzig (Organisation: Andreas Thor) geplant war, musste wegen der Coronabeschränkungen verschoben werden und soll nun vom 8. bis 10. September 2021 stattfinden. Für die Folgejahre sind die Workshops wieder für die Pfingstwoche geplant, und zwar 2022 in Krippen im Elbsandsteingebirge (Organisation: Dirk Habich, TU Dresden) und 2023 im Schwarzwald (Organisation: Holger Schwarz, Universität Stuttgart).

LWDA 2021

Die Konferenz Lernen, Wissen, Daten, Analysen (LWDA) findet aufgrund der Coronabeschränkungen als Online-Veranstaltung vom 1. bis 3. September 2021 statt. Sie wird von der Arbeitsgruppe von Thomas Seidl an der LMU München organisiert. Neben Workshops der Fachgruppen Information Retrieval, Knowledge Discovery und Machine Learning, Business Intelligence und Analytics sowie Knowledge Management gestaltet diesmal auch der Arbeitskreis „Data Engineering for Data Science“ einen Workshop, in dem unter anderem die Beiträge vorgestellt werden, die im kommenden Themenheft „Data Engineering for Data Science“ des Datenbankspektrums erscheinen werden.

Weitere Informationen: https://mcml.ai/lwda2021/

Neuwahl des Leitungsgremiums der Fachgruppe Datenbanksysteme

Im Rahmen einer Online-Fachgruppenversammlung am 31. Mai (als Teil des BTW-Programms) wurde das Leitungsgremium der GI-Fachgruppe Datenbanksysteme neu gewählt. Dabei wurde das bisherige Leitungsgremium einstimmig für weitere drei Jahre bestätigt. Sprecher der Fachgruppe ist weiter Felix Naumann, Vertreter Norbert Ritter. Weiter gehören dem Leitungsgremium Wolf-Tilo Balke, Alexander Böhm, Anika Groß, Melanie Herschel, Alfons Kemper, Meike Klettke und Thomas Ruf an.

In seinem Bericht gab Felix Naumann einen Überblick über die verschiedenen Aktivitäten der Fachgruppe und ihrer Mitglieder, u. a. das Frühjahrstreffen 2020 in Darmstadt, das für viele die letzte Präsenzveranstaltung vor Corona war. Zahlreiche Mitglieder der Fachgruppe wurden in den letzten Jahren ausgezeichnet oder erhielten Preise für die besten Paper bei Konferenzen. Exemplarisch seien hier Volker Markl und Andreas Reuter genannt, die zu ACM Fellows ernannt wurden. Innerhalb der Fachgruppe wurde ein neuer Arbeitskreis zum Thema „Data Management auf Moderner Hardware“ eingerichtet, Sprecher dieses Arbeitskreises sind Dirk Habich, Jens Teubner und Hannes Rauhe.

Neues Schwerpunktprogramm der DFG zu „Disruptive Memory Technologies“

Der Senat der DFG hat im März das neue Schwerpunktprogramm 2377 „Disruptive Memory Technologies“ eingerichtet. Darin geht es darum, die Potentiale neuer Entwicklungen im Bereich der Hauptspeichertechnologien und -architekturen auszunutzen. Auch Projekte im Bereich Datenbanksysteme, die sich zum Beispiel mit der Verwendung der verschiedenen Speichertechnologien für persistente Indexstrukturen beschäftigen könnten, werden dabei explizit genannt. Einer der Initiatoren dieses SPP ist Gunter Saake (Universität Magdeburg). Projektanträge können bis zum 9. November 2021 bei der DFG gestellt werden.

Weitere Informationen: https://spp2377.uos.de/

Produkt-News

Uta Störl

Informix 14.10.xC6

Die neue Informix-Version 14.10.xC6 enthält diverse Erweiterungen zum verbesserten Monitoring des Datenbanksystems sowohl über das GUI Informix HQ als auch über SQL-Schnittstellen. Neben verschiedenen Performance-Verbesserungen ist eine wesentliche Neuerung dieser Version die Möglichkeit, Backups auf einem der per asynchroner Replikation versorgten Remote Standalone Secondary (RSS) Server durchführen zu können.

IBM, https://www.ibm.com/de-de/products/informix

SAP HANA Cloud – neues Release

Das neue Release von SAP HANA Cloud ist mit einer Vielzahl von neuen Datenbankdiensten erschienen. So sind seit März 2021 nun auch der sogenannte „SAP HANA Cloud Adaptive Server Enterprise“ und der dazugehörige Replikationsserver als neue DBaaS-Optionen in SAP HANA Cloud enthalten. Darüber hinaus hat SAP den vormals in SAP HANA integrierten Data Lake nun auch als eigenständige Komponente zur Verfügung gestellt, was vorherigen on-premise SAP-IQ-Kunden die Migration in die Cloud erleichtern soll.

Darüber hinaus bietet SAP HANA Cloud nun eine Hochverfügbarkeitsoption für die SAP HANA-Datenbank durch asynchrone Replikation der Datenbank mit einem autonomen Failover, wodurch geschäftskritische Anwendungen mehr Ausfallsicherheit und eine Verfügbarkeit von 99,95 % erfahren.

Erweiterungen im Bereich Machine Learning und Multi-Model-Datenverarbeitung erhöhen die Einsatzmöglichkeiten von SAP HANA Cloud. So können nun z. B. Text-Klassifikationen durch die sog. Predictive Analytics Library direkt in der SAP HANA-Datenbank durchgeführt werden und heterogene Graphen aufgebaut und analysiert werden.

SAP, https://www.sap.com/germany/products/hana/cloud.html

Graph Data Science 1.5

Seit Februar 2021 steht Neo4j Graph Data Science (GDS) in Version 1.5 zur Verfügung. Die neue Version ergänzt weitere Algorithmen, bietet mehr Möglichkeiten mit Machine Learning (ML) direkt in Neo4j, und vereinfacht die Verwendung von GDS in Produktiv-Systemen. Ganz konkret erlaubt GDS 1.5 das Erstellen von Ende-zu-Ende-Pipelines zur ML-Modellerzeugung und die kontinuierliche Anwendung von ML-Modellen zur Vorhersage auf einem sich fortwährend verändernden Graphen innerhalb von Neo4j.

Neo4J, https://neo4j.com/developer/graph-data-science/

Replication for Continuous Availability für IBM Db2 Warehouse on Cloud

Für Db2 Warehouse on Cloud, einem Managed Service für Data-Warehousing-Anwendungen, der sowohl für die IBM Cloud als auch für AWS verfügbar ist, wird mit der Replication for Continous Availablity eine Active-Active-Replikationsmöglichkeit zwischen zwei solchen Systemen angeboten, die nach dem Pay-As-You-Go-Verfahren lizenziert wird. Diese Replikation dient nicht nur als Hochverfügbarkeitslösung und zur Absicherung gegen Desaster, sondern auch dazu, kontinuierlichen Betrieb bei geplanten Wartungsarbeiten zu ermöglichen.

IBM, https://www.ibm.com/cloud/db2-warehouse-on-cloud

Oracle Application Express 20c

Bei Oracle Application Express (Apex) handelt es sich um ein Entwicklungswerkzeug, welches in jeder Oracle-Datenbanklizenz enthalten ist. Mit der neuen Version 20c gibt es eine Vielzahl von Verbesserungen. Beispielsweise lassen sich über Automations Hintergrund-Prozesse definieren, die über verschiedene Trigger – auch zeitgesteuert – gestartet werden können. Aus Reports in der Anwendung können jetzt ohne externe Hilfsmittel direkt PDF-Reports erstellt werden. REST-Datenquellen können automatisch in lokale Tabellen synchronisiert werden. Der integrierte SQL-Workshop kann JSON-Dateien in entsprechende Collections hochladen und auf Wunsch auch relationale Views dafür erzeugen. Außerdem lassen sich die Anwendungskomponenten jetzt auch in separaten Dateien als Zip-Archiv exportieren, damit Apex besser in CI/CD-Umgebungen integriert werden kann.

Apex lässt sich mit jeder vorhandenen Oracle-Datenbank nutzen, alternativ bietet Oracle mit dem Oracle APEX Application Development auch eine vollständig verwaltete Umgebung in der Cloud an. Bei den autonomen Oracle-Datenbanken ist Apex standardmäßig einsatzbereit vorkonfiguriert, diese lassen sich auch im kostenlosen Cloud Free Tier nutzen.

Oracle, https://apex.oracle.com/de/

Palantir for IBM Cloud Pak for Data

Palantir for IBM Cloud Pak for Data ist die Integration von Palantiers Foundry Software in die Enterprise Insights-Plattform Cloud Pak for Data von IBM, die seit März 2021 verfügbar ist. Damit wird das einfache Erstellen von datenbasierten KI-Anwendungen nach dem „No-Code/Low-Code“-Prinzip ermöglicht.

IBM, https://www.ibm.com/products/palantir-cloud-pak-for-data

Graph Studio für Oracle Autonomous Database

Die Oracle Autonomous Database (ADB) gibt es bisher mit Fokus auf Data Warehouse (ADW) und transaktionale Workloads (ATP) sowie JSON-Dokumente (AJD). Die neueste Erweiterung im Tooling für ADW und ATP ist Graph Studio. Hiermit können über eine Web-basierte grafische Benutzeroberfläche interaktiv und einfach Graphen angelegt, verwaltet, visualisiert, ausgewertet und mit anderen geteilt werden.

Die kollaborative Analyse und Visualisierung von Graphen wird dabei durch die Integration von Notebooks unterstützt. Eine Vielzahl bereits vorimplementierter Graph-Algorithmen können für die Analyse genutzt werden, ebenso wie die Graph-Anfragesprache PGQL (https://www.pgql-lang.org/), welche bekannte SQL-Konstrukte um Graph-spezifische Klauseln erweitert. Wer Daten aus der relationalen Welt in ein Graph-Datenmodell überführen will, um z. B. erweiterte Analysen durchführen zu können, wird über einen in Graph Studio enthaltenen Wizard geführt. Somit können auch bisher eher mit relationalen Datenbanken vertraute Entwicklerinnen und Entwickler intuitiv mit Graphen arbeiten.

Oracle, https://blogs.oracle.com/database/make-graph-databases-easy

Neo4j GraphQL Library

Seit April 2021 steht die Neo4j GraphQL Library zur Verfügung, eine erweiterbare, Low-Code und Open-Source-Bibliothek zum Erstellen von Anwendungen mit der Neo4j-Graphdatenbank. Die Bibliothek stellt die Schicht zwischen Javascript GraphQL und Neo4j Cypher bereit. Damit ist es sehr leicht, aus dem Frontend-Code einer Anwendung direkt auf den Graph in der Datenbank zuzugreifen. Mit der Neo4j GraphQL Library vermeiden Entwickler wiederholtes Modellieren ihrer Daten auf Datenbank- und auf Anwendungsseite. Die Neo4j GraphQL Library soll die volle Performanz der Neo4j-Anfrageverarbeitung an Anwendungen weiterreichen, da sie beliebige GraphQL-Abfragen in jeweils eine einzelne Cypher-Abfrage übersetzt.

Neo4J, https://neo4j.com/product/graphql-library/

Oracle Machine Learning für Python (OML4Py) verfügbar

Oracle hat sein Angebot für Python erweitert. Schon seit einigen Jahren steht die native Schnittstelle cx_oracle zwischen der Programmierumgebung und der Oracle-Datenbank zur Verfügung. Dieses Python-Paket ermöglicht die performante Zusammenarbeit und eine funktionsreiche API zur Arbeit mit Datenbankobjekten.

Nun hat Oracle mit dem OML4Py-Paket eine neue Möglichkeit für Python-Entwickler geschaffen, die es erlaubt, Python transparent in der Datenbank auszuführen. Dadurch entfällt der zeitaufwändige und sicherheitskritische Transport der Daten aus der Datenbank in die Programmablaufumgebung. Die Python-Befehle werden in Datenbankbefehle umgesetzt und laufen dann in der Datenbank auf den Datenbankobjekten.

OML4Py basiert auf den Quasi-Standardbibliotheken pandas, matplotlib, scikit-learn, numpy und weiteren. Dies wird begleitet durch die große Anzahl an ML-Algorithmen in und die Parallelisierungsmöglichkeit durch die Datenbank. Zur Zeit ist die Nutzung in der autonomen Cloud-Datenbank möglich. Zum Testen steht die neue kostenfreie Schnittstelle in der Cloud zur Verfügung und kann auch mit dem Always-Free-Angebot genutzt werden.

Oracle, https://blogs.oracle.com/machinelearning/introducing-oracle-machine-learning-for-python-v2

Dank an Jörg Latza (SAP), Arne Brüning, Karin Patenge, Detlef E. Schröder, Ulrike Schwinn (alle Oracle), Hannes Voigt (Neo4j) sowie Andreas Weininger (IBM) für ihren fachlichen Input.

Rights and permissions

Reprints and Permissions

About this article

Verify currency and authenticity via CrossMark

Cite this article

News. Datenbank Spektrum 21, 165–168 (2021). https://doi.org/10.1007/s13222-021-00383-x

Download citation

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s13222-021-00383-x