Wir steigen in das Thema cloudbasiertes Data-Warehouse ein. Den Anfang machen wir mit Snowflake! Nachdem wir bereits Anfang 2019 für die Visualisierung unserer eigenen Data-Warehouse Daten auf SAC (SAP Analytics Cloud) umgestiegen sind, folgt jetzt der 2. Schritt, der Umstieg von einem On-Premise basiertem Data-Warehouse auf eine Cloud-Solution.
Snowflake ist eine cloud-basierte Datenbank- und Analyse Plattform. Sie ist von Anfang an für diesen Zweck entwickelt worden und wie viele anderen Lösungen an die Cloud adaptiert worden. Snowflake läuft seit 2014 auf Amazon Web Services und seit 2018 auf Microsoft Azure. Es wurde 2019 auf der Google Cloud Plattform eingeführt.
Daten-Speicherung und Rechenleistung sind getrennt voneinander skalierbar und flexibel einstellbar! Der Kunde zahlt den Service auf einer On-Demand-Basis.
Hier ein paar Fakten und Features zu Snowflake:
Über 100 Millionen Queries täglich
Größte Tabelle: 68 Trillionen Zeilen
Größte Datenmenge eines Kunden: > 40 Petabyte
Größte Anzahl an Nutzern eines Kunden: > 10.000
Größte Anzahl an Tabellen in einer Datenbank: 200.000
Kompatibel mit allen führenden BI-/Analytics-Tools (PowerBi, Qlik, Tabeleau, SAP-BI, uvm.)
Daten können grundsätzlich bis zu 90 Tage wiederhergestellt werden (UnDrop).
Instant Data Cloning - Tabellen können binnen Sekunden geklont werden.
Abfrage von unstrukturierten Daten (z.B. JSON)
Standard ANSI SQL
Trennung von Speicher und Rechenleistung
Flexible Skalierung der Rechenleistung bei Bedarf
Data Warehouse Skalierung nach „T-Shirt“ Größen von XS (1 Node) bis XXL (128 Nodes).
AES 256 Verschlüsselung aller Daten
Security - Berechtigungssystem
Snowflake optimiert automatische alle Datenabfragen (Queries) für beste Performance.
Live Data Sharing- Daten können mit anderen Snowflake Kunden in Echtzeit geteilt werden.
Haben wir Euer Interesse geweckt? Mehr Informationen gibt es gerne auf Anfrage!
コメント