Język wyrażeń regularnych (regex) – na przykładzie Google Analytics

, Czas czytania: 6:00 min.

wyrażenia regularne regex

Wyrażenie regularne to wzorzec, który aparat wyrażeń regularnych próbuje dopasować w tekście wejściowym. Wzorzec składa się z co najmniej jednego literału znakowego, konstrukcji lub operatora. Jest to technika rozwinięta w informatyce teoretycznej i teorii języka formalnego. Jeśli chcesz dowiedzieć się więcej o wyrażeniach regularnych, zapoznaj się z poniższym wpisem.

Spis treści:

 

Wyrażenie regularne – definicja

Wyrażeniem regex lub regexup, określany również jako racjonalnego ekspresji, to ciąg znaków, które definiują wzór przeszukiwania. Składają się ze stałych, które oznaczają zbiory ciągów i symboli operatorów. Zazwyczaj wzorce te mają zastosowanie w algorytmach przeszukujących ciągi do operacji „znajdź” lub „znajdź i zamień” na łańcuch lub sprawdza poprawność poprawność danych wejściowych.

Najczęściej stosowane znaki w wyrażeniach regularnych

  • ^ (daszek, ang. peak) – rozpoczyna się od – przyporządkowuje wszystkie wyrażenia, które zaczynają się od danego wzoru. W narzędziach liniowych dopasowuje pozycję początkową dowolnej linii.
  • $ (dolar, ang. dollar) – kończy się na – w przeciwieństwie do daszka przyporządkowuje wszystkie wyrażenia, które kończą się na daną frazę. W narzędziach liniowych dopasowuję pozycje końcową dowolnej linni.
  • | (rurka, ang. pipe) – lub – operator wyboru zwany również alternatywą, dopasowuje wyrażenia przed lub po operatorze.
  • . (kropka, ang. dot) – dopasowuje jeden dowolny znak
  • + (plus) – oznacza powtórzenie przynajmniej jednego znaku
  • * (gwiazdka, ang. star) – zastępuje nieskończoną liczbę znaków, po którym następuje
  • [ ] (nawiasy kwadratowe, ang. square brackets) – oznaczają dopasowanie dowolnego pojedynczego znaku w ich ramach.
  • ? (znak zapytania ang. question mark) – oznacza brak wystąpienia lub powtórzenie jeden raz poprzedzającego znaku.
  • – (myślnik ang. dash) – oznacza zakres wyrażeń – najczęściej wykorzystywany z nawiasem kwadratowym
  • \ (ukośnik tylny ang. backslash) – przywraca standardowe znaczenie znaków wykorzystywanych w wyrażeniach regularnych

Wyrażenia regularne – przykład zastosowania

Dopasowanie do dowolnego słowa lub wyrażenia na następującej liście:

  • bzdury

  • głupota

  • fałszywiec

  • podłość

  • niegodziwe oszustwo

  • chamstwo

  • hołota

  • prostactwo

Wyrażenie regularne:

(?i)(\W|^)(bzdury|głupota|fałszywiec|podłość|niegodziwe\soszustwo|chamstwo|hołota|prostactwo)(\W|$)

Użytkownicy wyszukiwarki bardzo często lubią przekręcać znane frazy. Zobrazuje to na przykładzie, którym posłuży mi wyrażenie ^k.r..er$. Interesuje nas jedno słowo i kilka powtarzalnych liter, a reszta jest dowolna.

Wyrażenia regularne

Testowanie wyrażeń regularnych

Aby posługiwać się wyrażeniem regularnym watro je najpierw przetestować na jednym z wielu dostępnych testerów wyrażeń regularnych np.

  • Google Analytics RegEx Filter Tester – tester Google Analytics
  • regexp.pl – tester wyrażeń regularnych w Polsko języcznej wersji
  • InfoByIp.com – Kalkulator wyrażeń regularnych

Wyrażenia regularne wykorzystywane w Google Analytics

w Google

W praktyce najczęściej wykorzystuje się wyrażenia regularne w filtrach i konfiguracji celów, ale można też wykorzystać je w segmentach zaawansowanych.

W Google Analytics mamy do czynienia w co najmniej dwóch miejscach. Pierwsze z nich to filtry zastosowane w raportach. Stosowane są najczęściej, gdy chcemy się przyjrzeć wybranym słowom kluczowym. Analogicznie można wykorzystać to w filtrze w ramach profilu. Przy konfiguracji celów w Google Analytics pamiętajmy o tym, że wybierając dany rodzaj dopasowania adresu URL ustawiamy go również dla konfiguracji ścieżki do celu.

Podsumowanie

Zapewne zdążyliście zauważyć, że wyrażenia regularne dają na ogrom możliwości, a przy ich podstawowej znajomości można szybciej konstruować zaawansowane filtry. Mam nadzieje, ze przez powyższy wpis udało mi się przekonać was do posługiwania się wyrażeniami regularnymi.

  TAGI:

Zostaw komentarz do artykułu: Język wyrażeń regularnych (regex) – na przykładzie Google Analytics

1 Komentarz

  1. Leon

    Czyli dobrze rozumiem regex za pomocą kilku pozwala na precyzyjne wyszukanie z bazy danych interesujących nas elementów? Nigdy nie przestanie mnie zaskakiwać jak wiele rzeczy jeszcze nie wiem. Poważnie d liceum na matematyce a tym bardziej na informatyce nic o tym nam nie wspominali. Chociaż z drugiej strony tak właściwie to nie wiem do czego mi się przyda ta wiedza :p

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Bartek Candyweb

Programuje, śpiewa i gra - istny człowiek orkiestra:)

Ostatnie artykuły

Zainteresowała Cię oferta?

Kompleksowa oferta

Kliknij po bezpłatną wycenę

Wyceń projekt