すらいむがあらわれた

こまんど >  たたかう  にげる

XMLのデザインパターン

XMLユーザメーリングリストを読んでいると、妙な形式のXMLの扱いに苦労している例をよく見かける。業務で使われるXMLデータはもともとはCSVとか他のデータベース製品のデータなどの形式だったものをXMLに移行して作られるので、元のデータ形式を引きずってしまっていることがよくある。
太字にするなどスタイルを指定する部分をタグでなく括弧で囲んでしまうとか、表組を改行で表現してしまうとか、などなど。こうなるとXSLTでの処理が一気にややこしくなる。(XSLTだけで処理することがまったく不可能というわけではないので始末が悪い)
実際のXML関係の作業って仕様さえ分かっていればいいわけじゃなくて、やたらに複雑なXSLTの関数をかかなくてはならなかったり、XSLT一本では処理できなくて変換プログラムをたくさん書いたりと結構泥臭い処理をする必要に迫られることがしょっちゅうある。

そこで、
XMLボキャブラリのデザインパターン(Java World 2004年2月号)
http://direct.idg.co.jp/detail_1.msp?id=989&class=10005&n=2

昔のデータ形式を引きずった妙なXMLを作らないために、処理のしやすいXMLのつくり方を典型例を解説した記事です。XMLマスター:ベーシックは、XMLデータを作る側の人向けの資格と考えればwell-formedなXMLの知識が身に付くのでよいかもしれません。ただ、仕様だけではなくてXMLの構造をどう決めるかという視点も欲しいなと思います。

アンチパターン版の記事もあります。(Java World 2004年6月号)
http://direct.idg.co.jp/detail_1.msp?id=1055&class=10005&n=2

XMLユーザグループ メーリングリストでも紹介されています。
http://www2.xml.gr.jp/log.html?MLID=xmlusers&N=8681