チュートリアル:JSON の基礎

マシンデータは、サーバー、携帯電話、ブラウザーなどのさまざまなデバイスで生成できます。デバイスから送信されるメッセージは イベント と呼ばれます。イベントは、追跡する単一のユーザーアクションまたは発生を記述します。多数のイベントを収集するマシンは、それらを バッチ に整理する場合があります。バッチは、ソースデバイスとユーザー情報すべてのイベントに共通のヘッダー情報(例:ソースデバイスとユーザー情報)を含むコンテナーです。

一般的なデータ収集シナリオでは、スケーラブルなウェブエンドポイントがさまざまなソースから POSTed データを収集し、それらをAmazon Kinesis、Apache Kafka、 RabbitMQなどのキューシステムに書き込みます。次に、インジェストサービス/ユーティリティはデータをS3バケットに書き込みます。そこからSnowflakeにデータをロードできます。

このチュートリアルでは、S3バケットの JSON データバッチをパーティション分割する方法、ロードされた JSON データに対して基本的なクエリを実行する方法、オプションで繰り返し値を フラット化 (入れ子を削除)する方法を学習します。実際のデータ収集プロセスは、このチュートリアルの範囲外です。

インターフェイス

SnowSQL (CLI クライアント)

推定時間

30~40分

推定クレジット

< 1

始める前に:

手順: