XML技術
HOME  >  XML技術  >  探検 XMLボキャブラリの世界 第12回

探検 XMLボキャブラリの世界 第12回

第12回:オフィス文書のボキャブラリ ~ODF(その1)~

2008年5月8日 更新
著者:岸 和孝(JAGAT客員研究員)

私が最近最も注目しているXMLツールは,OpenOfficeです。それは,Sun Microsystems社のStarOfficeが元になって開発された,オフィス文書向けのワープロ,スプレッド・シート,ドロー,プレゼンテーションなどからなる一揃いのソフトウェア(suiteと呼ばれます)です。もっと手短かに言えば,OpenOfficeは,皆さんがお使いになっているMicrosoft社のOfficeとほぼ同じ機能を持ったツールです。読者諸氏の中にはすでにお使いになっている方もいるかもしれませんね。まだ使っていない,という方には,この機会にぜひOpenOfficeを試していただきたいと思います。

と言うのも,OpenOfficeは,無償のフリーウェアだからです。ちなみに,商用版のStarSuite 8でも3,970円という安さです。さらに,オープンソースなので拡張が自由であり,Windows 98/2000/XP/Vista,Linux,Sun Solaris,FreeBSD,Mac OS Xの各プラットフォームで利用できます。そうしたことが支持されて,海外のみならず国内でもユーザは確実に増えています。とりわけ継続性や透明性が重視される公文書類をOpenOfficeで記録しようという積極的な動きがあります。なお,Mac OS Xユーザの方は,Mac OS X向けのX11版のOpenOfficeよりもNeoOfficeのほうを選んだほうがインストールが容易です。

今,OpenOfficeは,急速に完成と普及に向かっているように見えます。さまざまな関連サイトが充実してきましたので,試用したり学習したりできる環境が整ってきました。関連ブログでは,当然ことながら,OpenOfficeとMicrosoft Officeの機能や互換性の対比,移行時の手間やコスト,Microsoft社とSun Microsystems社の戦略の違い,仕様書のページ数の違いなどといった,まるでSF映画「エイリアン vs. プレデター」の論評のようなことまでがいろいろ議論されていますが,要は,利用者全体の電子文書の相互運用性(interoperability)を長期的に高めていくにはどうしたらよいのか,という立場に立って,この問題は考えなければならないでしょう。

OpenOffice文書のXMLボキャブラリであるOpen Document Format(ODF)はオフィス文書におけるさまざまな構成部品を表わすものです。したがって,印刷・出版の立場でオフィス文書を編集したり加工したりする際に,その理解がきわめて重要になると思われます。XML活用の観点から,ODFのボキャブラリについて説明しますが,その内容は,後述するように大規模なものですから数回にわたってお話しすることになります。今回は,ODFの概要についてお話ししましょう。

XML形式で文書交換

最も肝心なことは,OpenOfficeと2007 Microsoft Officeが共にXML形式で文書交換できる点です。ODFは,ISO/IEC(国際標準化機構・国際電気標準会議)で承認されました。一方,Microsoft社の2007 Microsoft Office文書のボキャブラリであるOffice Open XML File Format(OOXML)は,ECMA(欧州電子計算機工業会)で承認され,現在,ISO/IECへ標準案として提出されています。この二つの規格は全く異なるものです。まさかダブル・スタンダードになるとは思えませんが,符号拡張方式(ISO/IEC 2022,JIS X 0202)とUnicode(ISO 10646)の先例がありますから何とも言えません。その決着には今年いっぱいかかりそうです。

OpenOfficeは,Microsoft Office文書,一太郎文書,WordPerfect文書,Lotus 1-2-3文書などのさまざまな既存の文書データを読み込めますので,とりわけMicrosoft的文書システムからOpenOffice的文書システムへの漸進的な移行が可能になります。OOXML形式の文書をODF形式の文書へ変換するツールも登場しています[10]。一方,Microsoft社は,OpenOfficeに対抗して,ODF形式の文書をMicrosoft Office文書へ変換するトランスレータやプラグインなどを提供するようです。こうした文書処理ソフトウェアにおける主導権争いは,利用者側から見れば,結果としてツール選択の幅が広がり,導入や移行の計画が立てやすくなるのでないでしょうか。

また,Microsoft社のInternet ExplorerがMicrosoft Office文書を直接的に,またはMicrosoft Officeを介して間接的に閲覧できるように,ODFReaderプラグインをインストールすれば,WebブラウザでOpenOffice文書が閲覧できます(現在,Firefoxで実現しています)。近いうちにどのWebブラウザでもOpenOffice文書を直接閲覧できるようになるでしょう。また,多種多様なオフィス文書がその利用者から見えないところでXML化されますので,XMLの役割はDTPにおけるPostScriptのような裏方となって,XMLならではのオフィス文書の再利用が図られるようになると考えられます。

ODFの構造

OpenOfficeで作られたODF形式の文書ファイルは,一見すると,アプリケーション専用のバイナリーファイルのようですが,文書構成部品をXML形式で表したデータが束ねられZIP形式で圧縮されたものです。実際に,そのファイルをStuffIt Expanderなどの解凍ツールで解凍すると,そのXMLデータを得ることができます。OpenDocument Viewerというツールを使うと,OpenOffice文書の文書としての表示とそれを意味するXMLデータを共に閲覧できます。これはODF形式を理解する上で便利です。

さて,そのODFのボキャブラリについては,700ページを超える大部の仕様書が刊行されています。そのボキャブラリを一言で言い表すことは困難ですが,XSLのフォーマティング・オブジェクト仕様SVG仕様といった既存のボキャブラリを包含しているものと言えば,その規模の大きさが想定できるでしょう。ちなみに,OOXMLの仕様書は5200ページを超えています。表1にODF仕様書の目次の訳を示します。これを見ただけでも,ODFが重要であることがお分かりいただけると思います。

▼表1 ODF仕様書の目次

1 概要
2 文書構造
 2.1 文書ルート
 2.2 文書メタデータ
 2.3 本文要素と文書型
  2.3.1 テキスト文書
  2.3.2 ドローイング文書
  2.3.3 プレゼンテーション文書
  2.3.4 スプレッドシート文書
  2.3.5 チャート文書
  2.3.6 画像文書
 2.4 アプリケーション設定
 2.5 スクリプト
 2.6 書体の宣言
 2.7 スタイル
 2.8 ページ・スタイルとレイアウト
3 メタデータ要素
 3.1 定義済みのメタデータ要素
 3.2 利用者定義のメタデータ
 3.3 オーダーメードのメタデータ
4 テキスト内容
 4.1 見出し,段落,基本のテキスト構造
 4.2 ページ列
 4.3 箇条書き
 4.4 テキスト・セクション
 4.5 ページに固定されたグラフィック内容
 4.6 変更履歴
 4.7 テキスト宣言
5 段落要素内容
 5.1 基本のテキスト内容
 5.2 しおりと参照
 5.3 注
 5.4 ルビ
 5.5 テキスト注釈
 5.6 索引マーク
 5.7 変更履歴と変更マーク
 5.8 行内の画像とテキスト・ボックス
6 テキスト項目
 6.1 フィールド要素における共通の特徴
 6.2 文書フィールド
 6.3 変数フィールド
 6.4 メタデータ・フィールド
 6.5 データベース・フィールド
 6.6 その他のフィールド
 6.7 共通フィールドの属性
7 テキスト索引
 7.1 索引マーク
 7.2 索引構造
 7.3 目次
 7.4 図表の索引
 7.5 表の索引
 7.6 オブジェクトの索引
 7.7 利用者定義の索引
 7.8 アルファベット順の索引
 7.9 参考文献
 7.10 索引ソースのスタイル
 7.11 索引表題のテンプレート
 7.12 索引テンプレートの項目
8 表
 8.1 基本の表モデル
 8.2 拡張された表モデル
 8.3 拡張された表
 8.4 拡張された表のセル
 8.5 スプレッドシート文書内容
 8.6 データベースの範囲
 8.7 フィルター
 8.8 データ・プロット表
 8.9 併合
 8.10 DDEリンク
 8.11 スプレッドシートにおける変更履歴
9 グラフィック内容
 9.1 グラフィック・アプリケーションのために強化されたページ機能
 9.2 図形
 9.3 フレーム
 9.4 3次元図形
 9.5 オーダーメードの図形
 9.6 プレゼンテーション図形
 9.7 プレゼンテーション・アニメーション
 9.8 SMILプレゼンテーション・アニメーション
 9.9 プレゼンテーション・イベント
 9.10 プレゼンテーション・テキスト・フィールド
 9.11 プレゼンテーション文書内容
10 チャート内容
 10.1 チャート文書の概要
 10.2 チャート
 10.3 表題,副題,フッター
 10.4 凡例
 10.5 プロット領域
 10.6 チャートの壁
 10.7 チャートの床
 10.8 座標軸
 10.9 系列
 10.10 カテゴリー
 10.11 データ点
 10.12 平均値
 10.13 エラー指示子
 10.14 回帰曲線
11 フォーム内容
 11.1 フォーム
 11.2 XFormsモデル
 11.3 制御
 11.4 共通のフォーム属性と制御属性
 11.5 共通の制御属性
 11.6 イベント
 11.7 特性
12 共通内容
 12.1 注釈
 12.2 数値の形式
 12.3 変更履歴のメタデータ
 12.4 イベント・リスナーの表
 12.5 数学的内容
 12.6 DDE接続
13 SMILアニメーション
 13.1 基本のアニメーション要素
 13.2 アニメーション・モデル属性
 13.3 共通のアニメーション属性
 13.4 アニメーション・タイミング
 13.5 メディア要素
 13.6 特殊な要素
14 スタイル
 14.1 スタイル要素
 14.2 省略時スタイル
 14.3 ページ・レイアウト
 14.4 マスター・ページ
 14.5 表テンプレート
 14.6 書体宣言
 14.7 データのスタイル
 14.8 テキストのスタイル
 14.9 強化されたテキストのスタイル
 14.10 箇条書きのスタイル
 14.11 略述のスタイル
 14.12 表のスタイル
 14.13 グラフィックのスタイル
 14.14 強化されたグラフィックのスタイル要素
 14.15 プレゼンテーション・ページのレイアウト
 14.16 チャートのスタイル
15 フォーマット特性
 15.1 単純なフォーマット特性と複雑なフォーマット特性
 15.2 ページ・レイアウト・フォーマット特性
 15.3 ヘッダー・フォーマット特性,フッター・フォーマット特性
 15.4 テキスト・フォーマット特性
 15.5 段落フォーマット特性
 15.6 ルビ・テキスト・フォーマット特性
 15.7 セクション・フォーマット特性
 15.8 表フォーマット特性
 15.9 表の欄フォーマット特性
 15.10 表の行フォーマット特性
 15.11 表のセル・フォーマット特性
 15.12 箇条書きのスタイル特性
 15.13 線特性
 15.14 塗りつぶし特性
 15.15 テキスト・アニメーション特性
 15.16 テキスト特性とテキスト揃え特性
 15.17 カラー特性
 15.18 影特性
 15.19 線接続部特性
 15.20 寸法特性
 15.21 キャプション特性
 15.22 3次元図形配置特性
 15.23 3次元照明特性
 15.24 3次元外見特性
 15.25 3次元成分特性
 15.26 3次元影特性
 15.27 フレーム・フォーマット特性
 15.28 浮動フレーム・フォーマット特性
 15.29 チャート・フォーマット特性
 15.30 チャート・サブタイプ・フォーマット特性
 15.31 チャート軸特性
 15.32 共通のチャート特性
 15.33 統計的特性
 15.34 プロット領域特性
 15.35 回帰曲線の特性
 15.36 プレゼンテーション・ページ属性
16 データ型とスキーマ定義
17 パッケージ
 17.1 概要
 17.2 ZIPファイル構造
 17.3 暗号化
 17.4 MIMEタイプのスキーマ
 17.5 パッケージ内の国際化識別子(IRI)の用法
 17.6 プレビュー画像
 17.7 目録ファイル

XMLの活用

ODFやOOXMLに匹敵するOpen Document Architecture and interchange format(ISO 8613,JIS X 41**)という,1999年に開発された文書規格があります。ところが,それを実現した実用的なツールはいまだに登場していません。その仕様が複雑で実現が困難で,インターネットの商用化開始時期にあたってHTMLやPDFにオープン文書の座を奪われてしまったために実用になりませんでした。なるほど,文書規格とは文書交換の形式であって,実現を決めているわけではないので,実現されていないことは不思議ではありません。しかし,その開発に多くの資本を投じたにもかかわらず利用者に何ももたらしていないということは,やはり問題です。言うまでもなく,規格を活かすには,それを実現しなければなりません。

OpenOfficeのような高度な機能を実現したアプリケーション・ソフトウェアがフリーで登場したことに,時代の変わり目を感じているのは私だけではないでしょう。この状況を印刷・出版の立場から考えると,今後,OpenOfficeの普及や2007 Microsoft Officeへの切り替えに伴って,XML入稿が生じる可能性はかなり高くなることは間違いありません。そうであれば,XMLを積極的に利用した「川上戦略」あるいは「源流戦略」を立てるというのはどうでしょうか。ここで言う「川上」あるいは「源流」とはデータの発生現場のことです。印刷という川下からそこへ接近して,入稿原稿の質を高めることによってプリプレスの生産性を上げることが可能だと考えています。具体的には,オフィス文書のXMLタグを積極的に利用する枠組みを開発し,それをクライアントへ提案し,現状のワークフローを改善するという仕組みです。

次回からは,ODFのボキャブラリにおける個々の文書構成部品をとりあげていくつもりです。お楽しみに。

社団法人日本印刷技術協会(JAGAT)
PrintersCircle PrintersCircle 2007年6月号より転載
探検 XMLボキャブラリの世界

▲このページのTOPへ

  • XMLとは?IT初心者でもすぐわかるXML超入門
  • 無償で使える!XMLDB「NeoCore」
  • サイバーテック求人情報
  • メールマガジン申し込み
  • TEchScore

  • ▲NeoCoreについて記載されています!

  • ▲XMLマスター教則本です。試験対策はこれでばっちり!
Copyright (c) CyberTech corporation ltd. All ights Reserved. | サイバーテックについて | ご利用ガイド