Регулярные выражения на службе у Интернет-маркетолога

Каждый, кто занимается Интернет-маркетингом, рано или поздно сталкивается с непонятными и пугающими на первый взгляд конструкциями под названием регулярные выражения. Однако, они являются довольно удобным и мощным инструментом при работе с массивами текстовых данных. В данной статье будут представлены азы для начала освоения регулярных выражений.

Что такое регулярные выражения

Регулярное выражение (от англ. Regular Expression, RegExp) – это символьная конструкция для поиска вхождений (совпадений по маске или шаблону) в текстовой строке массива данных. С их помощью можно выявлять в массиве текстовых данных интересующие фрагменты, например, электронные адреса, телефоны, url-адреса страниц с параметрами и многое другое. Чаще всего Интернет-маркетологи сталкиваются в регулярными выражениями при работе с ЯндексМетрикой, Google Analytics и файлом .htaccess, но возможные и другие варианты.

Синтаксис регулярных выражений

«^» (галочка)
Обозначает начало строки. Если используется внутри квадратных скобок «[ ]», то придает обратное значение содержанию или выражению внутри квадратных скобок. Например, нужно найти все ключевые слова, которые начинаются со слова «подписка». Регулярное выражение будет выглядеть так (без учета кавычек): «^подписка». Без данного знака будут найдены все ключевые слова, имеющие в своем составе слово «подписка».

«$» (знак доллара)
Обозначает конец строки. Например, нужно найти все ключевые слова, заканчивающиеся на «подписка». Регулярное выражение будет выглядеть так (без учета кавычек): «подписка$». Без данного знака будут найдены все ключевые слова, имеющие в своем составе слово «подписка».

«.» (точка)
Обозначает один (!!!) любой символ. По отдельности встречается редко и в большинстве случаев используется совместно с другими символами.

«*» (звездочка)
Обозначает любое число предыдущих символов или группы символов, которые находятся перед «звездочкой». Совместно с «точкой» получается комбинация «.*», которая означает любое количество абсолютно любых символов.

«+» (плюсик)
Обозначает любое положительное число предыдущих символов. Основное отличие от «звездочки» заключается в том, что стоящий перед «плюсиком» символ должен встречаться хотя бы один раз.

«?» (вопросительный знак)
Обозначает необязательную встречаемость последнего символа или группу символов. Последний символ или группа символов может встречаться, а может и не встречаться.

«( )» (круглые скобки)
Обозначают группировку конструкций, аналогичная применению в математике. Найденные соответствия в скобках возвращаются в отдельные переменные $1, $2 и т.д., в зависимости от порядкового номера группы.

«|» (вертикальная линия)
Обозначает логический оператор «ИЛИ».

«[ ]» (квадратные скобки)
Обозначают любой из перечисленных внутри скобок символ.

«{ }» (фигурные скобки)
Обозначают повторение символа или группы символов несколько раз. Если указано два числа в скобках (через запятую), то это будет интервалом «от и до».

«» (обратный слеш)
Обозначает экранирование служебных символов (точек, восклицательных знаков)

Таблица-памятка по регулярным выраженимя

Таблица-памятка по регулярным выраженимя
Таблицу-памятку по регулярным выражениям можно скачать по этой ссылке (*.png, 220Kb).

Полезные сервисы

Если у Вас есть вопросы, то Вы можете задать их в комментариях.

Поделится с друзьями: