Lakehouse-Preise
Die nächste Generation von Amazon SageMaker basiert auf einer offenen Lakehouse-Architektur, die all Ihre Daten aus Amazon Simple Storage Service (Amazon S3) Data Lakes, einschließlich S3-Tabellen, und Amazon Redshift Data Warehouses vereinheitlicht, sodass Sie leistungsstarke Analytik- und KI/ML-Anwendungen auf einer einzigen Datenkopie erstellen können. Sie zahlen nur für die Ressourcen, die Sie im Lakehouse verwenden. Für Metadatenspeicher und API-Anfragen gelten die Preise für den AWS-Glue-Datenkatalog, einschließlich des kostenlosen AWS-Kontingents. Die Kosten für Datenspeicherung und Datenverarbeitung hängen von Ihrer Wahl zwischen Amazon S3 oder Amazon Redshift Managed Storage (RMS) ab. Die Preisgestaltung der zugrunde liegenden Ressourcen wird unten beschrieben.
Metadaten: Datendefinitionen werden mithilfe des AWS-Glue-Datenkatalogs in einer logischen Hierarchie aus Katalogen, Datenbanken und Tabellen organisiert.
- Katalog: Ein logischer Container, der Objekte aus einem Datenspeicher, z. B. Schemata, Tabellen, Ansichten oder materialisierte Ansichten von Amazon Redshift, enthält. Sie können Kataloge unter einem Katalog verschachteln, um die Hierarchieebenen der Datenquelle, die Sie in das Lakehouse übertragen, übereinstimmend darzustellen.
- Datenbank: Datenbanken können verwendet werden, um die Datenobjekte wie Tabellen und Ansichten im Lakehouse zu organisieren.
- Tabellen und Ansichten: Tabellen und Ansichten sind Datenobjekte in einer Datenbank, die beschreiben, wie auf die zugrunde liegenden Daten zugegriffen werden kann, z. B. Schema, Partitionen, Speicherort, Speicherformat und SQL-Abfrage für den Zugriff auf die Daten.
Auf die Metadaten im Lakehouse kann über die AWS-Glue-APIs zugegriffen werden. Für Metadatenspeicherung und API-Anfragen gelten die Preise für Metadaten des AWS-Glue-Datenkatalogs, einschließlich des kostenlosen AWS-Kontingents. Weitere Informationen finden Sie unter AWS Glue – Preise.
Datenspeicher und Zugriff: Während Sie auf Daten im Lakehouse zugreifen, können Sie Daten in Amazon S3 oder RMS lesen und schreiben. Abhängig vom Speichertyp, den Sie zum Speichern von Daten im Lakehouse auswählen, fallen für den Zugriff auf den zugrunde liegenden Speicher zusätzliche Speicher- und Rechenkosten an. Weitere Informationen zu den Speicher- und Rechenpreisen für die einzelnen Speichertypen finden Sie in der Preisübersicht zu AWS Glue.
Statistiken und Wartung von Apache-Iceberg-Tabellen: Sie können die Statistikerfassung für Data-Lake-Tabellen in Amazon S3 automatisieren, um eine schnellere Abfrageausführung und die Wartung von Apache-Iceberg-Tabellen, z. B. Komprimierung, zu ermöglichen und so das Speicher-Layout Ihrer Apache-Iceberg-Tabellen zu optimieren. Wenn Sie diese Features aktivieren, fallen zusätzliche Gebühren an. Weitere Informationen finden Sie unter AWS Glue – Preise.
Berechtigungen: Präzise Berechtigungen werden von AWS Lake Formation ohne zusätzliche Kosten bereitgestellt. Weitere Informationen finden Sie unter Lake Formation – Preise.
Null-ETL-Integration – Kosten
SageMaker verfügt über Zero-ETL-Integrationen mit Anwendungen, wodurch die Notwendigkeit entfällt, ETL-Pipelines (Extrahieren, Transformieren und Laden) zu erstellen und zu verwalten. Zu den unterstützten Anwendungen gehören Salesforce, ServiceNow, Zendesk und mehr.
Diese Integrationen bieten Ihnen Flexibilität, sodass Sie bestimmte Datentabellen in einer Anwendung auswählen können, die automatisch auf Amazon Redshift repliziert werden sollen. Diese Flexibilität ermöglicht es Ihnen, einheitliche Analytik für mehrere Anwendungen und Datenquellen durchzuführen. AWS erhebt keine zusätzliche Gebühr für die Null-ETL-Integration. Sie zahlen für vorhandene Ressourcen, die zur Erstellung und Verarbeitung der im Rahmen einer Null-ETL-Integration erstellten Änderungsdaten verwendet werden. Dazu gehören zusätzlicher Amazon Redshift-Speicher zum Speichern replizierter Daten, Rechen-Ressourcen zur Verarbeitung der Datenreplikation (oder RPUs in Amazon Redshift Serverless) und AZ-übergreifende Datenübertragungskosten zum Verschieben von Daten von der Quelle zum Ziel. Die fortlaufende Verarbeitung von Datenänderungen durch die Null-ETL-Integration wird ohne zusätzliche Kosten angeboten. Weitere Informationen finden Sie unter Amazon Aurora – Preise, Amazon Relational Database (Amazon RDS) für MySQL – Preise, Amazon DynamoDB – Preise und AWS Glue – Preise.