XML技術
HOME  >  XML技術  >  探検 XMLボキャブラリの世界 第1回

探検 XMLボキャブラリの世界 第1回

第1回:ホームページのボキャブラリ ~XHTML~

2008年2月14日 更新
著者:岸 和孝(JAGAT客員研究員)

昨今,様々な分野においてその分野固有の情報を運ぶ容れ物として,XMLが採用されつつあります。情報を運ぶ容れ物のことを情報コンテナと言うことがありますが,電子文書形式と同じ意味合いです。XMLに基づく情報コンテナあるいは電子文書形式を特徴づけているものがXMLボキャブラリです。このコラムでは,そうした様々なボキャブラリについて調べ考えていきます。

ボキャブラリとは,文書の構造を表すタグの集まりですから,ボキャブラリは文書型と同じ意味合いで使われます。例えば,HTMLという,Webで配信する情報を表すタグの集まりは,読者諸兄にはお馴染みのものでしょう。Webブラウザーは,Webコンテンツを表すHTMLボキャブラリを解釈し表示するプログラムです。ちなみに,大半のWebブラウザーは,HTML以外のタグを解釈できません。XML方式のWebシステムでは,サーバー側でXMLからHTMLへボキャブラリを変換してからクライアント側へHTML文書として配信するようにしています。

情報システムとXML

XMLが積極的に採用されるのは,XML方式の採用によって,情報システムの運用効率がよくなり,開発や保守に関わる費用が節減できる,という見通しがあるからです。と言うのも,従来の情報システムは,プラットフォームに深く依存しているために,個別の開発が多くなり,費用がかさむ傾向にありました。一方,XML方式の情報システムでは,XMLというデータ表現形式の統一によってソフトウェアの共通化が図れるために,設計や保守が容易になる,と考えられています。

一方,すでに多くの企業や官公庁の情報システムでは,HTMLベースのWebスタイルが普及しています。それは,社内や部署内の情報交換においてWebブラウザーを主要なユーザーインターフェースとするシステムです。従来の技法でメニューやフォームのユーザーインターフェースを開発する期間と手間は大きな負担となっていましたが,Webブラウザーが無償で提供されるようになってからWebスタイルは急速に普及しました。そうしたこともXML導入が盛んになった理由に考えられます。

クロスメディアとXML

ところで,私がXMLボキャブラリを調べようと思い立ったのは,JAGATが提唱している「クロスメディア」概念の影響があります。XMLに基づく専門的なボキャブラリが各種の業界団体や標準化団体(W3COASISなど)によって盛んに開発され,その応用は様々なサービス業を巻き込んだ形で展開されています。したがって,印刷・出版における営業や企画の段階において,XMLの基礎知識のみならず,その応用力が求められるようになると思いました。さらに,ボキャブラリに含まれるタグは,その応用分野における重要な情報が何なのかをよく表していますので,それらに対する理解をあらかじめ深めておく必要があると考えました。

このコラムでは,際限なく作り出されているXMLボキャブラリを探り,具体的なタグの種類とその目的を出来る限り明らかにしていきたいと思っています。しかし,専門的なボキャブラリを専門外の印刷・出版業が理解することは,企業活動を盛んにする上で極めて有益とは言うものの,実際は困難です。極論すれば,ボキャブラリの種類は,情報システムの数ほどではないにしても,業種や業態の種類の数近く数多く存在する,と考えられるからです。

探検隊にようこそ

正直なところ,私は基本的なボキャブラリは知っていますが,具体的な応用については皆目知らないことだらけです。浅学非才を顧みず「群盲象を評す」の批判を覚悟の上で,文字通りの「探検」を読者の皆さんと一緒に始めたいと思います。私の曲解や誤解に気付かれた方は,ぜひお知らせください。さらに,私の見方に反対の方も,ぜひご投稿ください。より見識を広げたいと念願します。

この「探検」では,すでに存在するボキャブラリの種類は表示,記録,制御,伝達をそれぞれ目的とするものに分類できると想定していますが,実際のところは「探検」してみなければ分かりません。連載を通じて,出来る限り,それらを分類し体系づけていきたいと考えています。なお,XML SchemaXQueryなどの裏方的なボキャブラリについては,それだけでは退屈な話となりますので,必要に応じてコラムで取り上げるつもりです。

エージェントから見たホームページ

今回は,ホームページのボキャブラリとして知っておきたいXHTMLについてお話しします。XHTMLは,従来のHTMLをXMLで再定義したものです。しかし,なぜ再定義ということになったのでしょうか。周知の通り,HTMLはSGMLで定義されたものですが,実際のWebに存在する夥しい数のコンテンツの多くは正しくマークアップされていません。その責任はSGMLにはなく,Webブラウザーにあります。例えば,「<P>これは<EM>強調された</P>文章です。</EM>」のような奇妙なマークアップでも表示されてしまうために,制作者は誤りに気付きません。

たとえそうであっても閲覧できればいいのではないか,という声が聞こえそうですが,私は,やはりXHTMLにすべきだと思っています。最近,その思いを新たにすることがありました。ネット通販を経営する友人から,競合他社のホームページを巡回して商品名とその価格に関する情報を自動的に集めてくるソフトウェアエージェントを開発するように頼まれました。開発にあたって驚いたのがその対象となるホームページには怪しいマークアップが実に多く,個別に細々と解析しなければなりませんでした。

今後のホームページはXHTMLでマークアップすべきでしょう。そのうえに最も肝心な点は手作業でマークアップしないことです。情報の本来の意味を表すXMLボキャブラリから,表示を表すXHTMLボキャブラリへボキャブラリ変換を指示するスタイルシートを組み合わて自動変換すべきです。このパラダイムの転回には,かなりの決断が求められますが,ホームページの継続的な保守を効率化する上で,さらに情報の再利用という観点からも実現したいところです。

携帯電話から見たホームページ

わが国のインターネットユーザーはこの4月で8,000万人を突破したそうです。今や国民一人ひとりがパソコンか携帯電話でインターネットを利用していると看做せるでしょう。しかし,パソコンの広い画面に合わせて設計されたWebコンテンツを携帯電話の狭い画面で閲覧することは物理的というよりも視認性・操作性の点で全く実用的ではありません。通常は,大は小を兼ねますが,こればかりは無理な話です。結局,パソコン向けと携帯電話向けにWebコンテンツは分けられています。

OMAは,ワイヤレス・アプリケーション・プロトコル(WAP)として無線端末向けに規格を策定し,WAP 1.0としてWMLHDMLを推奨してきましたが,コンパクトHTMLという,文字通りHTMLを制約した言語も加わって,携帯電話のWeb世界はパソコンのWebと同様に混沌としています。WAP 2.0では,XHTMLベーシックを基にして従来機向けにはXHTMLトランジッショナル,次世代機向けにはXHTMLモバイル・プロファイルが推奨されています。パソコン以上に進歩が目覚ましい携帯電話の世界がXMLベースへ移行するのは意外に早いかもしれません。

複合文書

さて,ホームページの新ボキャブラリとしてのXHTMLは,単なるHTMLの後継にとどまらず,その他のXMLボキャブラリと組み合わせることもできるようになります。W3Cでは,そうした新しいWebコンテンツの有り様を複合文書として規格化しつつあります。XHTMLと複合できるXMLボキャブラリの一つに,拡大・縮小可能なベクトル図形を表すSVGがあります。SVGは,地図や設計図といった画像を表現でき,アニメーションを表すSMILと互換性を持っています。さらに,数式を表すためのMathMLもXHTMLと複合できます。現時点では,複合文書が閲覧できるWebブラウザーは,xfyAmayaしかありませんが,近い将来,大半のWebブラウザーで閲覧できるようになるでしょう。

ここまでホームページを支えるHTMLの状況を概観してきましたが,Webコンテンツが大きく変わる,あるいは変えるべき段階に入ったことは確かでしょう。ホームページの話は,実に幅広く,限られた紙面では到底言い尽くせません。次回以降も折に触れてお話ししたいと思っています。では,次回をお楽しみに。

社団法人日本印刷技術協会(JAGAT)
PrintersCircle 2006年7月号より転載
探検 XMLボキャブラリの世界

▲このページのTOPへ

  • XMLとは?IT初心者でもすぐわかるXML超入門
  • 無償で使える!XMLDB「NeoCore」
  • サイバーテック求人情報
  • メールマガジン申し込み
  • TEchScore

  • ▲NeoCoreについて記載されています!

  • ▲XMLマスター教則本です。試験対策はこれでばっちり!
Copyright (c) CyberTech corporation ltd. All ights Reserved. | サイバーテックについて | ご利用ガイド