- カテゴリ:
EXTRACT_SEMANTIC_CATEGORIES¶
注釈
EXTRACT_SEMANTIC_CATEGORIES はレガシー関数です。Snowflakeは、 機密データ分類 を実装する他の方法を使用することを推奨します。
指定されたテーブルまたはビューでサポートされている各列のカテゴリのセット(セマンティックおよびプライバシー)を返します。列のカテゴリを返すには、列で分類をサポートする データ型 を使用し、列にすべての NULL 値が含まれていない必要があります。
カテゴリは、列に含まれるメタデータとデータ、および列とデータに関するメタデータから派生します。プライバシーカテゴリは、生成されたセマンティックカテゴリ(存在する場合)に依存します。
構文¶
引数¶
必須:
object_name分類される列を含むテーブル、外部テーブル、ビュー、またはマテリアライズドビューの名前。データベースとスキーマが現在のセッションで使用されていない場合は、名前を完全修飾する必要があります。
名前は、データベースに保存されているとおりに正確に指定する必要があります。名前に特殊文字、大文字小文字の区別、または空白スペースが含まれている場合は、名前を最初に二重引用符で囲み、次に一重引用符で囲む必要があります。
オプション:
max_rows_to_scan指定されたテーブル/ビューの分類カテゴリを決定するために使用する行のサンプルサイズ。
有効値:
1から10000デフォルト:
10000
戻り値¶
代表例としての JSON オブジェクトの構造は次のとおりです。
条件:
valid_value_ratioサンプルサイズにおける有効な値の比率を指定します。無効な値には、 NULL、空の文字列、256文字を超える文字列などがあります。
recommendation各タグと値に関する情報を指定します。この情報には以下が含まれます。
semantic_categoryセマンティックカテゴリタグの値を指定します。
可能なタグの値については、 機密データ分類のネイティブセマンティックカテゴリ をご参照ください。
privacy_categoryプライバシーカテゴリタグの値を指定します。
可能な値は、
IDENTIFIER、QUASI-IDENTIFIER、およびSENSITIVEです。confidenceこの列は、
HIGH、MEDIUM、またはLOWのいずれかの値を指定します。この値は、列のサンプリングプロセスと、列のデータとSnowflakeがデータを分類する方法の整合性に基づいて、Snowflakeが持つ相対的な信頼性を示します。coverage特定のカテゴリのルールに一致する、サンプリングされたセル値のパーセントを指定します。
detailsSEMANTIC_CATEGORY タグに地理タグ値を指定できるフィールドと値を指定します。
alternates推奨タグ以外の考慮すべき各タグと値に関する情報を指定します。
使用上の注意¶
関数には、稼働中のウェアハウスが必要ですウェアハウスはパフォーマンスとコストに影響を与える可能性があります。
この関数は、 データ分類 の機能強化追加に合わせて更新されなくなりました。
例¶
スキャンする行数のデフォルト(10000)を使用して、 my_db.my_schema.hr_data テーブルのセマンティックカテゴリとプライバシーカテゴリを抽出します。
前の例と同じですが、テーブル内の5000行のみをスキャンするように制限されています。
最初の例と同じですが、結果をテーブルに保存します。
結果がテーブルに保存されたら、 ASSOCIATE_SEMANTIC_CATEGORY_TAGS を使用して適用する前に結果を修正できます。