Tutorial: JSON-Grundlagen

Computerdaten können von einer Vielzahl an Geräten wie Servern, Mobiltelefonen, Browsern usw. generiert werden. Von einem Gerät gesendete Meldungen werden als Ereignisse bezeichnet. Ein Ereignis beschreibt jede Einzelaktion oder ein Einzelelement eines Benutzers, das Sie verfolgen möchten. Computer, die eine große Anzahl von Ereignissen sammeln, können diese in Batches organisieren. Ein Batch ist ein Container, der Header-Informationen enthält, die allen Ereignissen gemeinsam sind, z. B. Quellgerät und Benutzerinformationen.

In einem allgemeinen Datenerfassungsszenario sammelt ein skalierbarer Web-Endpunkt POSTed-Daten aus verschiedenen Quellen und schreibt sie in ein Warteschlangensystem wie Amazon Kinesis, Apache Kafka oder RabbitMQ. Ein Ingest-Service/Dienstprogramm schreibt die Daten dann in einen S3-Bucket, von dem aus Sie die Daten in Snowflake laden können.

In diesem Tutorial erfahren Sie, wie Sie JSON-Datenbatches in Ihrem S3-Bucket partitionieren, grundlegende Abfragen auf geladenen JSON–Daten ausführen und optional wiederholte Werte vereinfachen (Entfernen der Verschachtelungen). Der eigentliche Datensammlungsprozess liegt außerhalb des Rahmens dieses Tutorials.

Schnittstelle

SnowSQL (CLI-Client)

Voraussichtl. Zeit

30-40 Minuten

Voraussichtl. Credits

< 1

Bevor Sie beginnen:

Schritte: