Функции Язык программирования PHP

preg_split

(PHP 3>= 3.0.9, PHP 4)

preg_split - делить строку регулярным выражением.

Описание

array preg_split (string pattern, string subject [, int limit [, int flags]])

Примечание: параметр flags был введён в PHP 4 Beta 3.

Возвращает массив, содержащий подстроки из subject, разделённого по границам совпадений с pattern.

Если limit специфицирован, то будет возвращены только подстроки до limit, а если limit равен -1, это означает "нет ограничения", что используется для специфицирования flags.

flags может быть комбинацией следующих флагов (с помощью битовой операции |):

PREG_SPLIT_NO_EMPTY

Если это флаг установлен, только непустые участки возвращаются функцией preg_split().

PREG_SPLIT_DELIM_CAPTURE

Если это флаг установлен, выражение в скобках в патэрне ограничителя будет захвачено и возвращено. Этот флаг был введён в 4.0.5.

PREG_SPLIT_OFFSET_CAPTURE

Если это флаг установлен, для каждого найденного совпадения будет также возвращено смещение дополнительной строки. Заметьте, что это изменит return-значение в массиве, где каждый элемент является массивом, состоящим из совпавшей строки в смещении 0 и её строкового смещения в subject - в смещении1. Этот флаг доступен, начиная с PHP 4.3.0.

Пример 1. preg_split(): получение части строки поиска.
// разделить фразу по любому количеству запятых или пробельных символов, 
// куда входят " ", \r, \t, \n и \f $keywords = preg_split ("/[\s,]+/", "hypertext 
language, programming");
Пример 2. Разделение строки на символы-компоненты.
$str 
= 'string'; $chars = preg_split('//', $str, -1, PREG_SPLIT_NO_EMPTY); print_r($chars);
Пример 3. Разделение строки на совпадения и их смещения.
$str 
= 'hypertext language programming'; $chars = preg_split('/ /', $str, -1, PREG_SPLIT_OFFSET_CAPTURE); 
print_r($chars);

это даст

Array ( [0] => Array ( [0] => hypertext [1] => 0 ) [1] 
=> Array ( [0] => language [1] => 10 ) [2] => Array ( [0] => 
programming [1] => 19 ) )

См. также spliti(), split(), implode(), preg_match(), preg_match_all() и preg_replace().


Назад Оглавление Вперёд
preg_replace Вверх Функции qtdom

Синтаксис Патэрна

Отличия от Perl

Эти отличия даны относительно Perl 5.005.

  1. По умолчанию пробельным символом считается любой таковой символ, распознаваемый функцией isspace() библиотеки С, хотя возможна компиляция PCRE с альтернативной таблицей типов символов. Нормально isspace() распознаёт space, formfeed, newline, carriage return, horizontal tab и vertical tab. Perl 5 больше не включает vertical tab в набор пробельных символов. Мнемоника \v, которая долгое время была в документации Perl, фактически никогда не распознавалась. Однако сам по себе этот символ рассматривался как пробельный как минимум до версии 5.002. В 5.004 и 5.005 он не соответствует \s.

  2. PCRE не разрешает повторение квантификаторов или опережающих утверждений/lookahead assertions. Perl разрешает их, но они имеют другое значение. Например, (?!a){3} не утверждает, что три последующие символа не "a". Оно просто утверждает три раза, что следующий символ не "a".

  3. Захваты субпатэрнов, которые возникают внутри отрицательного опережающего утверждения, вычисляются, но их вхождения в векторе смещения никогда не устанавливаются. Perl устанавливает свои числовые переменные из любого такого патэрна, который совпадает до неудачи утверждения при совпадении с чем-либо (продолжая таким образом), но только если негативное опережающее утверждение содержит одну ветвь.

  4. Хотя двоичные нулевые символы поддерживаются в строке-субъекте, они не допускаются в строке патэрна, поскольку он передаётся как нормальная C-строка, оканчивающаяся нулём. Замена "\\x00" может использоваться в патэрне для представления бинарного нуля.