- Kategorien:
REGEXP_INSTR¶
Gibt die Position des angegebenen Auftretens des Musters des regulären Ausdrucks im Zeichenfolgensubjekt zurück.
Siehe auch Zeichenfolgenfunktionen (reguläre Ausdrücke).
Syntax¶
Argumente¶
Benötigt:
subjectDie Zeichenfolge, nach der gesucht werden soll.
patternAbzugleichendes Muster.
Richtlinien zur Angabe von Mustern finden Sie unter Zeichenfolgenfunktionen (reguläre Ausdrücke).
Optional:
positionAnzahl der Zeichen ab dem Anfang der Zeichenfolge, an dem die Funktion mit der Suche nach Übereinstimmungen beginnt. Der Wert muss eine positive Ganzzahl sein.
Standard:
1(die Suche nach einer Übereinstimmung beginnt beim ersten Zeichen links)occurrenceGibt das erste Auftreten des Musters an, ab dem Übereinstimmungen zurückgegeben werden sollen.
Die Funktion überspringt die ersten
occurrence - 1Übereinstimmungen. Wenn es beispielsweise 5 Übereinstimmungen gibt und Sie3für dasoccurrence-Argument angeben, ignoriert die Funktion die ersten beiden Übereinstimmungen und gibt die dritte, vierte und fünfte Übereinstimmung zurück.Standard:
1optionGibt an, ob der Offset des ersten Zeichens der Übereinstimmung (
0) oder der Offset des ersten Zeichens nach dem Ende der Übereinstimmung (1) zurückgegeben werden soll.Standard:
0regexp_parametersZeichenfolge aus einem oder mehreren Zeichen, in der die Parameter angegeben sind, die zur Suche nach Übereinstimmungen verwendet werden. Unterstützte Werte:
Parameter
Beschreibung
cAbgleich, bei dem zwischen Groß- und Kleinschreibung unterschieden wird
iAbgleich ohne Berücksichtigung der Groß-/Kleinschreibung
mMehrzeiliger Modus.
eUntergeordnete Übereinstimmungen extrahieren
sPOSIX-Platzhalterzeichen
.im einzeiligen Modus stimmt mit\nübereinStandard:
cWeitere Informationen dazu finden Sie unter Angeben der Parameter für reguläre Ausdrücke.
Bemerkung
Standardmäßig gibt REGEXP_INSTR für den gesamten übereinstimmenden Teil des Subjekts den Offset des Anfangs- oder Endzeichens zurück. Wenn jedoch der Parameter
e(für „extrahieren“) angegeben ist, gibt REGEXP_INSTR den Offset des Anfangs- oder Endzeichens für den Teil des Subjekts zurück, der mit dem ersten Teilausdruck im Muster übereinstimmt. Wenn zwareangegeben ist, aber kein Wert fürgroup_num, dann ist der Wert vongroup_numstandardmäßig 1 (die erste Gruppe). Wenn das Muster keinen Teilausdruck enthält, verhält sich REGEXP_INSTR so, als wäreenicht gesetzt. Beispiele, dieeverwenden, finden Sie im Abschnitt Beispiele (unter diesem Thema).group_numDer Parameter
group_numgibt an, welche Gruppe extrahiert werden soll. Gruppen werden im regulären Ausdruck mithilfe von Klammern angegeben.Wenn eine
group_numangegeben ist, erlaubt Snowflake die Extraktion auch dann, wenn die Optionenicht mit angegeben wurde. Die Optioneist implizit.Snowflake unterstützt bis zu 1.024 Gruppen.
Beispiele, die
group_numverwenden, finden Sie unter Beispiele für Erfassungsgruppen in diesem Thema.
Rückgabewerte¶
Gibt einen Wert vom Typ NUMBER zurück.
Wenn keine Übereinstimmung gefunden wird, wird 0 zurückgegeben.
Nutzungshinweise¶
Positionen sind 1-basiert, nicht 0-basiert. Beispielsweise ist die Position des Buchstabens „M“ in „MAN“ 1 und nicht 0.
Weitere Hinweise zur Verwendung der Funktionen für reguläre Ausdrücke finden Sie unter Allgemeine Nutzungshinweise.
Sortierungsdetails¶
Arguments with collation specifications currently aren’t supported.
Beispiele¶
Die folgenden Beispiele verwenden die Funktion REGEXP_INSTR.
Grundlegende Beispiele¶
Erstellen Sie eine Tabelle, und fügen Sie Daten ein:
Suchen Sie nach einer übereinstimmenden Zeichenfolge. In diesem Fall lautet die Zeichenfolge nevermore, gefolgt von einer einzelnen Dezimalzahl (z. B. nevermore1). Das Beispiel verwendet die Funktion REGEXP_SUBSTR, um die passende Teilzeichenkette anzuzeigen:
Suchen Sie nach einer übereinstimmenden Zeichenfolge, beginnen Sie jedoch mit dem 5. Zeichen der Zeichenfolge und nicht mit dem 1. Zeichen der Zeichenfolge:
Suchen Sie nach einer übereinstimmenden Zeichenfolge, aber suchen Sie nach der dritten Übereinstimmung und nicht nach der ersten Übereinstimmung:
Diese Abfrage ist fast identisch mit der vorherigen Abfrage, zeigt jedoch, wie Sie mit dem Argument option angeben, ob Sie die Position des übereinstimmenden Ausdrucks oder die Position des ersten Zeichens nach dem übereinstimmenden Ausdruck erhalten möchten:
Diese Abfrage zeigt, dass bei der Suche nach einem Vorkommen, das über das letzte tatsächliche Vorkommen hinausgeht, die zurückgegebene Position 0 ist:
Beispiele für Erfassungsgruppen¶
In diesem Abschnitt erfahren Sie, wie Sie die „Gruppen“-Funktion von regulären Ausdrücken verwenden.
Die ersten Beispiele in diesem Abschnitt verwenden keine Erfassungsgruppen. Der Abschnitt beginnt mit einigen einfachen Beispielen und setzt sich dann mit Beispielen fort, die Erfassungsgruppen verwenden.
In den Beispielen werden die unten erstellten Zeichenfolgen verwendet:
Die Zeichenfolgen haben die folgenden Eigenschaften:
Die Zeichenfolge mit einer
idvon2hat mehrere Vorkommen des Wortes „the“.Die Zeichenfolge mit einer
idvon3hat mehrere Vorkommen des Wortes „the“ mit zusätzlichen Leerzeichen zwischen den Wörtern.Die Zeichenfolge mit einer
idvon4enthält die Zeichenfolge „the“ innerhalb mehrerer Wörter („thespian“ und „theater“), aber ohne das Wort „the“ selbst.
In diesem Beispiel wird nach dem ersten Vorkommen des Wortes the gesucht, gefolgt von einem oder mehreren Nicht-Wort-Zeichen (z. B. dem Leerzeichen, das Wörter trennt), gefolgt von einem oder mehreren Wort-Zeichen.
„Wortzeichen“ umfassen nicht nur die Buchstaben a–z und A–Z, sondern auch den Unterstrich („_“) und die Dezimalziffern 0–9, jedoch keine Leerzeichen, Satzzeichen und so weiter.
Suchen Sie ab Position 1 der Zeichenfolge nach dem zweiten Vorkommen des Wortes the, gefolgt von einem oder mehreren Nicht-Wort-Zeichen, gefolgt von einem oder mehreren Wort-Zeichen.
Dieses Beispiel ähnelt dem vorherigen Beispiel, fügt jedoch Erfassungsgruppen hinzu. Anstatt die Position der gesamten Übereinstimmung zurückzugeben, gibt diese Abfrage nur die Position der Gruppe zurück, (d. h. den Teil der Teilzeichenfolge, der mit dem Teil des regulären Ausdrucks in Klammern übereinstimmt). In diesem Fall ist der Rückgabewert die Position des Wortes nach dem zweiten Vorkommen des Wortes the.
Wenn Sie den Parameter 'e' (Auszug) angeben, aber nicht group_num, dann ist group_num standardmäßig auf 1 festgelegt:
Wenn Sie group_num angeben, geht Snowflake davon aus, dass Sie extrahieren möchten, auch wenn Sie 'e' (extrahieren) nicht als einen der Parameter angegeben haben:
In diesem Beispiel wird gezeigt, wie die Position des zweiten Wortes aus den ersten, zweiten und dritten Übereinstimmungen eines Zwei-Wort-Musters abgerufen wird, in dem das erste Wort A ist. Dies zeigt auch, dass Snowflake beim Versuch, über das letzte Muster hinauszugehen, 0 zurückgibt.
Erstellen Sie eine Tabelle, und fügen Sie Daten ein:
Führen Sie die Abfrage aus:
Dieses Beispiel zeigt, wie die Position der ersten, zweiten und dritten Gruppe innerhalb des ersten Auftretens des Musters abgerufen wird. In diesem Fall sind die zurückgegebenen Werte die Positionen der einzelnen Buchstaben des Wortes MAN.
Zusätzliche Beispiele¶
Im folgenden Beispiel werden Vorkommen des Worts was abgeglichen. Der Abgleich beginnt beim ersten Zeichen in der Zeichenfolge und gibt die Position des Zeichens in der Zeichenfolge zurück, das auf das erste Vorkommen folgt:
Im folgenden Beispiel wird der Offset des ersten Zeichens des Teils der Zeichenfolge zurückgegeben, der mit dem Muster übereinstimmt. Der Abgleich beginnt beim ersten Zeichen in der Zeichenfolge und gibt das erste Vorkommen des Musters zurück:
Das folgende Beispiel ist dasselbe wie das vorherige Beispiel, verwendet jedoch den Parameter e, um den Zeichenoffset für den Teil des Subjekts zurückzugeben, der mit dem ersten Unterausdruck des Musters übereinstimmt (die erste Menge von Wortzeichen nach the):
Das folgende Beispiel findet Vorkommen von Wörtern, die auf st enden und denen zwei oder mehr alphabetische Zeichen vorausgehen (Groß- und Kleinschreibung wird nicht berücksichtigt). Der Abgleich beginnt beim 15. Zeichen in der Zeichenfolge und gibt die Position des Zeichens in der Zeichenfolge nach dem ersten Auftraten zurück (den Anfang von worst):
Um die nächsten Beispiele auszuführen, erstellen Sie eine Tabelle und fügen Sie Daten ein:
Gibt den Offset des ersten Zeichens im ersten Treffer zurück, das einen Kleinbuchstaben enthält o:
Gibt den Offset des ersten Zeichens im ersten Treffer zurück, das einen Kleinbuchstaben o enthält, beginnend mit dem dritten Zeichen im Subjekt:
Gibt den Offset des ersten Zeichens in der dritten Übereinstimmung zurück, das einen Kleinbuchstaben o enthält, beginnend mit dem dritten Zeichen im Subjekt:
Gibt den Offset des letzten Zeichens in der dritten Übereinstimmung zurück, das einen Kleinbuchstaben o enthält, beginnend mit dem dritten Zeichen im Subjekt:
Gibt den Offset des letzten Zeichens in der dritten Übereinstimmung zurück, das ein klein geschriebenes o enthält, beginnend mit dem dritten Zeichen im Subjekt, Übereinstimmung ohne Berücksichtigung der Groß-/Kleinschreibung: