XSLT — страница 34 из 124

Что в действительности это означает? Это значит, что когда нужно проверить, удовлетворяет ли узел образцу, сначала следует применить образец как выражение XPath к самому узлу, затем применить его последовательно ко всем его предкам, вплоть до корневого узла. Если какой-либо полученный при этом набор узлов будет содержать сам узел, узел удовлетворяет образцу. Такой порядок действий имеет смысл потому, что образцы выбора пишутся для применения к текущему узлу или его дочерним узлам.

СЛЕДСТВИЯ ФОРМАЛЬНОГО ОПРЕДЕЛЕНИЯ ОБРАЗЦОВ ВЫБОРА

Приведенное определение образцов в терминах выражений XPath довольно очевидно, но существуют следствия, которые сразу не видны. Например, хотя функция node() определена как функция, выбирающая любой узел, при использовании ее в качестве образца, "node()", в действительности она представляется как "child::node()", как вы увидите позже в этой главе. Помимо прочего, это означает, что образец "node()" может выбирать только дочерние узлы — он никогда не выберет корневой узел. Отметьте также, что нет образцов, которые бы могли выбрать узлы объявлений пространств имен.

W3C дает формальное определение образцов выбора в нотации расширенных форм Бэкуса-Наура (РБНФ), при помощи которой написана и спецификация XML. Объяснение этой грамматики можно найти по адресу www.w3.org/TR/REC-xml (раздел 6). Здесь я привожу формальное определение образцов только для справки. (Разъяснению этого формального определения посвящена целая глава.) В следующем списке приведены используемые здесь лексемы нотации РБНФ:

• 

::=
означает «определяется как»;

• 

+
означает «один или больше»;

• 

*
означает «ноль или больше»;

• 

|
означает «или»;

• 

-
означает «не»;

• 

?
означает «необязательно».

Далее приведено настоящее, формальное определение образцов выбора W3C; когда элемент заключен в одиночные кавычки, как

'child'
или
'::'
, это значит, что элемент должен появиться в образце буквально (как "
child::NAME
"), — такие элементы называются литералами, Literal:

Pattern ::= LocationPathPattern | Pattern '|' LocationPathPattern

LocationPathPattern ::= '/' RelativePathPattern?

 | IdKeyPattern ('/' | '//') RelativePathPattern?

 | '//'? RelativePathPattern

IdKeyPattern ::= 'id' '(' Literal ')' | 'key' '(' Literal '.' Literal ')'

RelativePathPattern ::= StepPattern | RelativePathPattern '/' StepPattern

 | RelativePathPattern '//' StepPattern

StepPattern ::= ChildOrAttributeAxisSpecifier NodeTest Predicate*

ChildOrAttributeAxisSpecifier ::= AbbreviatedAxisSpecifier

 | ('child' | 'attribute') '::'

Определения NodeText (текстового узла) и Predicate (предиката) приводятся в спецификации XPath (

Expr
соответствует выражению XPath, a
NCName
и
QName
были определены в начале главы 2, «Создание и применение таблиц стилей»):

NodeTest ::= NameTest | NodeType '(' ')' | 'processing-instruction' '(' Literal ')'

Predicate ::= '[' PredicateExpr ']'

PredicateExpr ::= Expr

AbbreviatedAxisSpecifier ::= '@'?

NameTest :: = '*' | NCName ':' '*' | QName

NodeType ::= 'comment' | 'text' | 'processing-instruction' | 'node'

Как вы можете видеть, все это больше походит на какой-то код. Давайте начнем его расшифровывать. Во-первых, образец (pattern) состоит из одного (или более) образца пути расположения (location path pattern). Образец пути расположения, в свою очередь, состоит из одного или нескольких образцов шага (step pattern), разделенных / или //, или одним (несколькими) образцом шага в объединении с функциями

id
и
key
(выбирающими элементы с определенными идентификаторами или ключами).

Образцы шага являются строительными блоками шаблонов: в одном пути можно использовать несколько шагов, разделяя их символами / или //, как в образце "

PLANET/*/ NAME
", в котором три шага: "
PLANET
", "
*
" и "
NAME
". Если вы начнете сам образец с символа /, он будет называться абсолютным, так как вы указали образец от корневого узла (как в "
/PLANETS/PLANET
" или "
//PLANET
"); иначе образец называется относительным и применяется начиная с контекстного узла (как в "
PLANET
").

Затем образец шага состоит из оси, условия узла и предикатов (которых может и не быть). Например, в выражении

child::PLANET[position()=5]
,
child
— это имя оси,
PLANET
— условие узла, a
[position()=5]
— это предикат. (Предикаты всегда заключены в квадратные скобки.) Образцы можно создавать при помощи одного или более образцов шага, как, например, образец
/child::PLANET/child::NAME
, который выбирает элементы
, дочерние по отношению к родителю
.

Таким образом, чтобы понять работу образцов, вам необходимо понять работу образцов шага, поскольку образцы состоят из одного или более образцов шага, в таких выражениях, как "

step-pattern1/step-pattern2/step-pattern3
…". А чтобы понять работу образца шага, необходимо понять работу деятельности трех составных частей — осей, условий узлов и предикатов, которыми мы и займемся в следующих разделах.

Образцы шага, часть 1: оси образца

Оси — первая часть образцов шага. Например, в образце шага

child::NAME
, ссылающемся на элемент
, дочерний по отношению к контекстному узлу,
child
называется осью. У образцов две оси:

• ось

attribute
содержит атрибуты контекстного узла;

• ось

child
содержит детей контекстного узла. Если ось явно не задана, ось
child
будет осью по умолчанию.

При помощи осей можно задать шаг расположения (location path) или путь, как в следующем примере, в котором ось

child
используется для задания выбора дочерних узлов контекстного узла, элемента
:

Рассмотрим ряд примеров применения осей:

• 

child::PLANET
. Возвращает дочерние элементы
контекстного узла;

• 

child::*
. Возвращает все дочерние элементы контекстного узла (* выбирает только элементы);

• 

attribute::UNITS
. Возвращает атрибут
UNITS
контекстного узла;

• 

child::*/child::PLANET
. Возвращает всех внуков
контекстного узла.

Хотя, судя по этим примерам, кажется, что можно применять только оси детей и атрибутов, на практике это не совсем так. Когда требуется указать детей, возможности оси

child
несколько ограничены, потому что необходимо указывать каждый уровень, который необходимо выбрать — например "
child::PLANETS/child::PLANET/child::MASS
" выбирает элемент
, дочерний по отношению к элементу
, который, в свою очередь, дочерний по отношению к
. Если вам требуется выбрать все элементы
, появляющиеся в любом месте элемента
, детей, внуков, правнуков и т.д., кажется, что нет способа сделать это в одном образце. В XPath это можно сделать при помощи выражения наподобие "
child::PLANETS/descendant::MASS
", но в образцах нельзя использовать ось потомков (descendant). Помните, однако, что в этих же целях можно применить операцию
//
. Например, образец "
child::PLANETS//child::MASS
" выбирает все элементы
в любом месте внутри элемента
.

Следующий пример (листинг 4.2) демонстрирует работу этого образца, заменяя текст во всех элементах

независимо от того, где они находятся внутри элемента
, на текст "
Very heavy!
". Для того чтобы скопировать в результирующий XML-документ все остальные узлы
planets.xml
, я также установил правило, выбирающее любой узел при помощи условия узла (node test)
node
, с которым мы познакомимся позже. Заметьте, что, хотя образец, выбирающий любой узел, также выбирает все элементы
, образец "
child::PLANETS//child::MASS
" гораздо более специален — поэтому, как объяснялось в главе 3, процессор XSLT задаст ему более высокий приоритет для элементов
.

Листинг 4.2. Выбор элементов

 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">


   Very heavy!

А вот результирующий XML-документ:

Mercury

   Very heavy!

58.65

1516

43.4

Earth

   Very heavy!

1

2107

1

128.4

При задании осей в образцах можно воспользоваться рядом сокращений, применяемых практически повсеместно.

Сокращенный синтаксис

Для образцов существует два правила сокращения осей:

• 

child::childname
может быть сокращено как
childname
;

• 

attribute::childname
может быть сокращено как
@childname
.

В следующем списке перечислен ряд примеров образцов с сокращенным синтаксисом; в конце главы вы увидите много других.

• 

PLANET
. Выбирает дочерние элементы
контекстного узла;

• *. Выбирает все дочерние элементы контекстного узла;

• 

@UNITS
. Выбирает атрибут
UNITS
узла;

• 

@*
. Выбирает все атрибуты контекстного узла;

• 

*/PLANET
. Выбирает всех внуков
контекстного узла;

• 

//PLANET
. Выбирает всех потомков
корня документа;

• 

PLANETS//PLANET
. Выбирает все элементы
, являющиеся потомками дочерних элементов
контекстного узла;

• 

//PLANET/NAME
. Выбирает все элементы
, дочерние по отношению к
;

• 

PLANET[NAME]
. Выбирает детей
контекстного узла, у которых есть дочерние элементы
.

В таком образце, как "

child::PLANET
", "
child
" является осью, a "
PLANET
" — условием узла, что представляет собой вторую часть образцов шага.

Образцы шага, часть 2: условия узла