説明

XMLデータ生成方法及びそのプログラム

【課題】使い慣れたアプリケーションでXMLデータを作成することができ、XMLの特別な知識を必要とせずにXMLデータを作成することができ、かつ、同じアプリケーションで編集が容易にでき、高度な文書管理が可能なXMLデータを作成することができるXMLデータ生成方法及びそのプログラムを提供することを目的とするものである。
【解決手段】XMLデータの文書構造を定義するDTDの要素定義と、アプリケーションの有する文書作成機能に対応した要素定義とを対応させるための変換定義ファイルを作成し、該変換定義ファイルに基く文書属性入力項目が設けられたXML対応文書テンプレートを作成し、該XML対応文書テンプレートを用い、XML対応文書を作成し、該XML対応文書を該DTDと該変換定義ファイルに従い、文書−XML変換プログラムでXMLデータを生成することを特徴とするXMLデータ生成方法である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書構造の定義のためのデータと文書データ本体とを分離して取り扱うことができるXML(eXtensible Markup Language)データの生成方法、及びXMLデータの情報処理プログラムに関する。
【背景技術】
【0002】
近年、官公庁を初めとする様々な組織あるいは企業において、構造化文書の考え方に基づく文書管理が行われている。
【0003】
構造化文書データは、本来SGML(Standard Generalized Markup Language)がそのルーツであり、異なるプラットフォーム間でのデータ交換の標準という考え方からきており、このSGMLでは、文書データと、文書の構造・書式などに係る情報とを分離し、どんな環境からも等しく利用することができるデータを記述する手段を提供しようとするものでした。
【0004】
しかしながら、記述ルール・約束事があまりにも複雑で面倒なものであったため、広く実用化するまでには至らなかった。
【0005】
そんな中で、インターネットの急速な普及に伴ってHTML(Hyper Text Markup Language)が急速に広まり、このHTMLからさらにXML(eXtensible Markup Language)が生まれることとなった。
【0006】
このXMLは、前記のSGMLの文書構造の定義機能を簡素化し、前記のHTMLのウェブにおける利用環境を引き継いで生まれたものであり、インターネット環境の中で異なるプラットフォーム間におけるデータ交換の標準として、特に注目を集めている言語である。
【0007】
これらのXMLを初めとする構造化データの利点は、文書の内容を構造化し、文書中に含まれる個々のデータに意味付けを行うことができるという点である。
【0008】
すなわち、文書に意味を持つタグ付けを行い、要素に分解し、個々の要素データを構造化して表現したものである。
【0009】
また、その要素の属性を定義することにより、文書構造の定義のためのデータと文書データ本体とを分離して取り扱うことができるようにしたものである。
【0010】
このXMLなどの構造化データの利点を活用して、各種のアプリケーションデータの相互のデータ変換が可能となってきた。
【0011】
現在、市販されている印刷用アプリケーションで作られるデータは、独自のファイル形式となっており、他のアプリケーションとの互換性はない。
【0012】
このため、表現されるレイアウトは同じであるにもかかわらず、使用するアプリケーションによって、まったく別のデータが作成されてしまう。
【0013】
そこで、XMLのように、文書構造の定義データと文書データ本体を分離して扱うことが可能な構造化データを基本データとして文書管理し、この構造化データから各種のアプリケーションデータに対して必要データを相互に変換できるようにし、そのための各変換プログラム環境を構築するというものである。
【0014】
例えば、特開2000−76226号などがある。
【0015】
また、前記の構造化データを用いて印刷の前段階である組版処理を行い、スタイル情報を定義して構造化データを効率良く組版できるようにしたものもある。
【0016】
例えば、特開2000−339307号などがある。
【0017】
このように、文書データ管理に、XMLデータが有効であることが広く認識されるようになってきた。
【0018】
しかしながら、このXMLデータの作成には、XML文書の文書構造定義を理解し、本文内容を入力した上で、文書構造定義に沿った要素、属性を付加する(マークアップという)を行わねばならず、一般には熟練者による専用のXMLエディターでの入力作業が行なわれている。
【0019】
このようなXML文書作成の際に生じる問題を軽減乃至解消するため、XML文書の作成を広く普及しているワードプロセッサで行う試みが従来から行われてきた。
【0020】
これは、ワードプロセッサでXMLの要素と属性に対応付けする規則を設定し、作業者が極力要素や属性を直接人力することがないようにし、作成されたワードプロセッサの文書をXML文書にプログラムを用いて変換するものであり、近年では、XML形式で文書ファイルを保存できるワードプロセッサもある。
【0021】
これらの変換プログラムやXML形式で保存されたXML文書は、要素を並列にしたものであることから、特開2005−352880号では、要素の親子関係を作り出すために、ワードプロセッサを使用してXML文書を作成するにあたり、XML文書の要素の親子関係の作成を、ワードブロセッサの表スタイルを使用し、親要素に対応する部分にこの表スタイルを指定し、文書ファイルからXML文書への変換のタグとして機能させるようにしたものが開示されている。
【特許文献1】特開2000−76226号公報
【特許文献2】特開2000−339307号公報
【特許文献3】特開2005−352880号公報
【発明の開示】
【発明が解決しようとする課題】
【0022】
このように、文書データ管理に、XMLデータが有効であることが広く認識されるようになり、XMLデータによる文書管理が盛んに行なわれるようになってきている。
【0023】
このXMLデータの作成においては、XMLの詳しい知識を有しなくても、使い慣れたワープロでXMLデータを作成できることが好ましい。
【0024】
そして、ワープロ文書にタグ設定してXMLデータへの変換プログラムも開発されている。しかしながら、単純にワープロ文書にタグ設定を行い、XMLデータ化しても、特定のワープロと特定のXMLデータの間でのデータのやり取りにしかならない。
【0025】
XMLデータの有効な機能である文書構造の定義データと文書本体データとによる構造化文書となって始めてその有効性が発揮され、異なるアプリケーション間での相互の変換が可能となり、作成から編集、管理にいたるまでを総合的に管理できる文書データベースとして機能するものである。
【0026】
特開2005−352880号では、要素の親子関係を作り出すために、ワードプロセッサの表スタイルを使用してXML文書を作成しているが、この場合には、親子関係の定義や属性などXMLの特別な知識が必要となる。
【0027】
本発明は、上記のような問題点に鑑みてなされたものであり、使い慣れたアプリケーションでXMLデータを作成することができ、文書作成者はXMLの特別な知識を必要とせずにXMLデータを作成することができ、かつ、同じアプリケーションで編集が容易にでき、高度な文書管理が可能である構造化されたXMLデータを作成することができるXMLデータ生成方法及びそのプログラムを提供することである。
【課題を解決するための手段】
【0028】
上記の問題を解決するために本発明の請求項1では、XMLデータの文書構造を定義するDTDの要素定義と、アプリケーションの有する文書作成機能に対応した要素定義とを対応させるための変換定義ファイルを作成し、該アプリケーションのための、該変換定義ファイルに基く文書属性入力項目が設けられたXML対応文書テンプレートを作成し、該XML対応文書テンプレートを用い、該アプリケーションによりXML対応文書を作成し、該XML対応文書を該DTDと該変換定義ファイルに従い、文書−XML変換プログラムでXMLデータを生成することを特徴とするXMLデータ生成方法としたものである。
【0029】
該変換定義ファイルは、各々のアプリケーションが有する、「タイトル」、「見出し」、「箇条書き」、「改ページ」、「太字」などの文書のスタイル設定や機能のすべての要素を、DTDに記載された要素定義であるタグ記述に対して完全に対応させるための対応関係が記載された相互変換用の定義ファイルである。
【0030】
該XML対応文書テンプレートは、文書本文には直接記載されない、各文書に特有の情報、例えば、試験問題であれば、「学年」、「問題形式」、「難解度」などの属性情報を入力するための文書属性入力項目が設けられたテンプレートである。
【0031】
また、請求項2では、前記の作成されたXML対応文書を前記のアプリケーションが有するXHTML出力機能を用いて出力し、出力されたXHTMLデータを前記のDTDと変換定義ファイルに従い、XHTML−XML変換プログラムでXMLデータを生成することを特徴とするXMLデータ生成方法としたものである。
【0032】
該XHTML出力機能は、近年、ワープロソフトに設けられるようになった機能であり、例えば、マイクロソフト社のワープロソフト「Word」では、「XMLドキュメント保存」の機能が設けられ、ワープロ文書をHTMLタグ付きテキストデータで出力できる。
【0033】
また、請求項3では、前記の作成されたXML対応文書に対する非表示のナレッジ情報が記載されたファイルが作成され、前記のDTDに該ナレッジ情報が定義され、該ナレッジ情報とともにXML対応文書を変換プログラムでXMLデータに変換し、該ナレッジ情報を含むXMLデータを生成することを特徴とするXMLデータ生成方法としたものである。
【0034】
該ナレッジ情報は、文書本文中には記載されない(すなわち非表示)が、その文書の独自の属性(作成種別・分類、使用の対象など)や、企画・管理者の独自の考えや評価(難易度、特徴、評価値など)などの情報である。このナレッジ情報を本文とともに管理することにより、文書の高度な分析、高度な文書の作成が可能となる。
【0035】
また、請求項4では、前記のナレッジ情報は、各文書のXMLデータに対するナレッジ項目が記録された表形式ファイルで作成され、XMLデータにリンクされて構成されることを特徴とするXMLデータ生成方法としたものである。
【0036】
該表形式ファイルは、表形式で表示されるファイルであればいずれでも良く、例えば、マイクロソフト社の表計算ソフトの「Excel」のファイルなどが使用できる。
【0037】
また、請求項5では、前記の変換プログラムは、請求項1から請求項3までのいずれかの項に記載のXML対応文書又はXHTMLデータに対して、変換定義ファイルに従い前記のDTDに定義されたデータについては構造化データに変換し、その他のデータはデータ構造を維持したまま変換することで、XML対応文書に含まれるすべてのデータをXMLデータに変換することを特徴とするXMLデータ生成プログラムとしたものである。
【0038】
該その他のデータは、各アプリケーションの独自のファイル記述形態であり、共通性のないデータ構造や記述形式であり、このような独自のデータについては、各アプリケーションの記述をそのままの状態を維持するタグを設定して変換することで、データ形式を壊すことなく、双方向の変換を可能とするものである。
【0039】
また、請求項6では、前記の作成されたXML対応文書と、前記の文書構造用DTDに設定されたタグとの対応関係を比較し、DTDに定義されていない要素の有無をチェックするための要素定義チェック機能を有することを特徴とするXMLデータ生成プログラムとしたものである。
【0040】
該要素定義チェック機能は、DTDに記載されたタグ記述以外のタグを使用していないかどうかをチェックできるプログラムであればいずれでも良く、JAVA(登録商標)やC言語などによるプログラムで実現できる。
【発明の効果】
【0041】
本発明では以下の効果を奏する。
【0042】
1)使い慣れたアプリケーションでXMLデータを作成、編集できる。
【0043】
2)XMLの詳しい知識を必要とせずにXMLデータを作成、編集できる。
【0044】
3)再利用や管理に適した構造化されたXMLデータを容易に作成できる。
【0045】
4)アプリケーションのデータと、XMLデータとの間で双方向変換が可能なXMLデータを作成できる。
【0046】
5)変換定義ファイルにより、DTDに対応したアプリケーションの機能を効果的にXMLデータに変換できる。
【0047】
6)要素定義チェック機能により、変換されたXMLデータに不適切なタグが無くなり、変換前にスタイルや機能の不具合を発見でき、作業効率を高め、信頼瀬の高いXMLデータを作成することができる。
【0048】
7)非表示のナレッジ情報をデータ化でき、XMLデータとして編集、管理することができるので、高度な文書管理が可能となり、再利用価値が飛躍的に高まる。
【発明を実施するための最良の形態】
【0049】
本発明の実施の形態について図面を用いて説明する。
図1は、本発明によるXMLデータの生成方法を示すフロー図である。本例では、アプリケーションとしてマイクロソフト社のワープロソフトである「Word」を使用して文書を作成し、XMLデータとしてデータベース化する場合について説明する。
【0050】
S−1)DTDの解析
構築するXMLデータベースのために設計されたDTDを解析する。DTDファイルのタグの要素名、タグの属性名、または組み合わさったタグ群を調べる。
【0051】
図2にDTDの記載例を示す。(a)の「ルートタグ」は、XMLファイルのトップに配置される。(b)の「理論構造タグ」は、文章をグループに分ける。(c)の「リストタグ」は、文章に記載したい箇条書き項目の列挙をまとめる。(d)の「タイトルタグ」は、グループに分けた文章のタイトルに相当する箇所である。(e)の「インラインタグ 太字」は、指定箇所を太字という文字装飾に適用させる。
【0052】
S−2)変換定義ファイルの作成
解析したDTDの要素名・属性名などをWordの段落スタイル、文字スタイル、またはWordアプリケーションの機能と対応させた変換定義ファイルを作成する。
【0053】
図3(1)に示すように、Wordのスタイル・機能に対応したDTDタグを調べて、(2)に示すように、Wordのスタイル名とDTDのタグ記述の関係を設定する。
【0054】
S−3)Wordテンプレートの作成
Wordの段落スタイル、文字スタイルを規定のスタイル名としてWordテンプレートに登録し、変換定義ファイルに基く、文書属性入力項目が設けられたWordテンプレートを作成する。例えば、試験問題文書などでは、図4に示すように、問題本文に対して「問題ID」、「教科」、「学年」、「単元」、「タイトル」などの属性項目を入力する。
【0055】
S−4)テンプレートによる文書作成
前記のWordテンプレートを使用して、文書属性などを入力して所望の文書を作成する。例えば、試験問題文書などでは、図4に示すように、問題本文に対して「問題ID」、「教科」、「学年」、「単元」、「タイトル」などの属性項目を入力する。
【0056】
S−5)要素定義のチェック
作成された文書に対して、Word文書編集における規定スタイル以外使われていないかをチェックする。すなわち、DTDタグに記載されていないタグがないかをプログラム処理でチェックする。
【0057】
S−6)WordによるXHTML出力
要素定義チェック済みの文書をWordのファイル保存機能の「XMLドキュメント」でXHTML出力する。
【0058】
S−7)XMLデータに変換
出力されたXHTMLデータを、前記の変換定義ファイルとDTDに従って、変換プログラムにより、XMLに再定義して構造化されたXMLデータを生成する。
【0059】
S−8)XMLデータをDBに保存
出力されたXMLデータは、再利用に適したXMLデータベースに保存される。
このように、文書作成者は、Wordテンプレートを用いて文書を作成することにより、自動的に定義がチェックされてXMLデータが生成され、XMLデータベースを構築することができ、文書作成者は、XMLを意識することなく、使い慣れたワープロでいつものように文書を作成することで、XMLデータを容易に生成できる。
【0060】
次に、本発明によるXMLデータ生成方法によるプログラムが組み込まれた、試験問題データベースシステムの実施例について説明する。
【0061】
本実施例では、図5に示すように、問題企画・管理者1と、問題作成者2と、作成された問題を保存するための問題作成管理データベース(DB)3とで構成され、該問題作成管理DB3から検索してブラウザ4で閲覧し、編集・修正・登録はテンプレート付きWord5にて行なわれる。
【0062】
また、図6に示すように、作成されたテンプレート付きWordデータ5は、問題文本文は問題文実体XML6に変換されて登録され、問題文の管理情報(問題プロパティ)7は、マイクロソフト社の表計算ソフトであるExcelデータで保存され、問題IDでリンクされて問題作成管理DB3に記録される。
【0063】
本実施例の使用例について説明する。図7は、本問題DBシステムのメインメニュー画面を示す図である。問題新規登録ボタン11と、エクセルプロパティの登録・修正ボタン12と、マージ処理ボタン13と、問題検索ボタン14と、終了ボタン15とが表示されている。
【0064】
図8は、問題新規登録画面を示す図である。教科選択欄16により、国語、英語、社会、数学、理科の中から登録する教科を選択する。
登録ファイル確定欄の参照ボタン17を押し、ファイル選択ダイヤログを開いて問題ワードデータと問題に必要な画像ファイル群をまとめて圧縮されたZIPファイルを選択する。
【0065】
次に新規登録ボタン18を押し、問題コンテンツ情報であるWord文書をXMLデータに変換する。メインメニューボタン19を押してメインメニューに戻る。
【0066】
図9は、エクセルプロパティの登録・修正画面を示す図である。新規作成の処理は、手順1の教科選択欄20により、登録する教科を選択し、Excelファイルの取得ボタン21を押し、Excelファイルを開く。
【0067】
図10に示すように、問題ID項目に従って、学年、学期、問題形式、設問形式、解説文、科目、分野、大分類、中分類、小分類などの問題文に対する管理情報を記入される。また、問題企画・管理者などのナレッジ情報を記入することができる。このナレッジ情報項目は任意に作成することができ、このナレッジ情報が問題文とリンクされることにより、問題の高度な解析、検索が可能となるものである。
【0068】
作成されたExcelファイルは、手順2の教科選択欄22により、教科を選択し、参照ボタン23を押してファイル選択ダイヤログから選択し、アップロードボタン24を押してアップロードする。メインメニューボタン25を押してメインメニューに戻る。
【0069】
図11は、マージ処理画面を示す図である。上記で作成された問題コンテンツ情報であるXMデータと、問題プロパティ情報であるExcelデータを一つのデータにする。 教科選択欄26により、登録する教科を選択し、マージ処理ボタン27を押し、マージ処理が行なわれ、問題作成管理DBに登録される。 メインメニューボタン17を押し、メインメニューに戻る。
【0070】
図12は、問題検索画面を示す図である。教科選択欄29で目的の教科を選択する。検索項目の絞込み欄30で検索条件を設定し、検索開始ボタン31を押して検索する。32はメインメニューの戻りボタンである。
【0071】
図13、図14は検索結果リストの表示画面を示す図である。問題IDリストが表示され、目的の問題のチェック欄33にチェックを入れる。ビューボタン34を押すと図15に示すブラウザの表示画面が表示され、チェックした問題文の内容を確認できる。削除ボタン35を押すと、チェックした問題文が削除される。また、Wordファイルの作成ボタン36を押すと、図16に示すWord画面が表示され、チェックした問題文の内容を修正することができる。37は、検索メインメニューへの戻りボタンである。
【0072】
このように、本発明によれば、問題文作成者は、まったくXMLを意識するなく、使い慣れたWordにより問題作成ができ、編集・管理者も、XMLを意識する必要はなく、XMLデータによるデータベースを構築でき、細かなナレッジ情報がリンクされるので、詳細な検索ができ、高度な問題分析が可能となる。
【図面の簡単な説明】
【0073】
【図1】本発明によるXMLデータ生成方法を示すフロー図である。
【図2】文書構造用DTDの1例を示す図である。
【図3】DTDタグとWordスタイル・機能との対応を示す図である。
【図4】Wordテンプレートの様式の一例を示す図である。
【図5】問題作成DBシステムの概略構成図である。
【図6】問題作成管理データベースの内部構成を示す概念図である。
【図7】問題DB作成システムのメインメニュー画面を示す図である。
【図8】問題DB作成システムの問題新規登録画面を示す図である。
【図9】問題DB作成システムのエクセルプロパティの登録・修正画面を示す図である。
【図10】問題プロパティ情報が記載されたExcel表データを示す図である。
【図11】問題DB作成システムのマージ処理画面を示す図である。
【図12】問題DB作成システムのマージ処理画面を示す図である。
【図13】問題DB作成システムの検索結果リストの表示画面を示す図である。
【図14】問題DB作成システムの検索結果リストの問題文選択時の表示画面を示す図である。
【図15】問題DB作成システムの問題文のブラウザ表示画面である。
【図16】問題DB作成システムのWord文書修正画面である。
【符号の説明】
【0074】
1 問題企画・管理者
2 問題作成者
3 問題作成管理データベース
4 ブラウザ
5 テンプレート付きWordデータ
6 問題文実体XML
7 問題文の管理情報(問題プロパティ)
11 問題新規登録ボタン
12 エクセルプロパティの登録・修正ボタン
13 マージ処理ボタン
14 問題検索ボタン
15 終了ボタン
16、20、22、26 教科選択欄
17、23 参照ボタン
18 新規登録ボタン
19、25、28、29、32 メインメニューボタン
21 Excelファイルの取得ボタン
24 アップロードボタン
27 マージ処理ボタン
30 検索項目の絞込み欄
31 検索開始ボタン
33 問題のチェック欄
34 ビューボタン
35 削除ボタン
36 Wordファイルの作成ボタン
37 検索メインメニューボタン

【特許請求の範囲】
【請求項1】
XMLデータの文書構造を定義するDTDの要素定義と、アプリケーションの有する文書作成機能に対応した要素定義とを対応させるための変換定義ファイルを作成し、該アプリケーションのための、該変換定義ファイルに基く文書属性入力項目が設けられたXML対応文書テンプレートを作成し、該XML対応文書テンプレートを用い、該アプリケーションによりXML対応文書を作成し、該XML対応文書を該DTDと該変換定義ファイルに従い、文書−XML変換プログラムでXMLデータを生成することを特徴とするXMLデータ生成方法。
【請求項2】
前記の作成されたXML対応文書を前記のアプリケーションが有するXHTML出力機能を用いて出力し、出力されたXHTMLデータを前記のDTDと変換定義ファイルに従い、XHTML−XML変換プログラムでXMLデータを生成することを特徴とする請求項1に記載のXMLデータ生成方法。
【請求項3】
前記の作成されたXML対応文書に対する非表示のナレッジ情報が記載されたファイルが作成され、前記のDTDに該ナレッジ情報が定義され、該ナレッジ情報とともにXML対応文書を変換プログラムでXMLデータに変換し、該ナレッジ情報を含むXMLデータを生成することを特徴とする請求項1または請求項2の項に記載のXMLデータ生成方法。
【請求項4】
前記のナレッジ情報は、各文書のXMLデータに対するナレッジ項目が記録された表形式ファイルで作成され、XMLデータにリンクされて構成されることを特徴とする請求項3に記載のXMLデータ生成方法。
【請求項5】
前記の変換プログラムは、請求項1から請求項3までのいずれかの項に記載のXML対応文書又はXHTMLデータに対して、変換定義ファイルに従い前記のDTDに定義されたデータについては構造化データに変換し、その他のデータはデータ構造を維持したまま変換することで、XML対応文書に含まれるすべてのデータをXMLデータに変換することを特徴とするXMLデータ生成プログラム。
【請求項6】
前記の作成されたXML対応文書と、前記の文書構造用DTDに設定されたタグとの対応関係を比較し、DTDに定義されていない要素の有無をチェックするための要素定義チェック機能を有することを特徴とする請求項5に記載のXMLデータ生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2008−97496(P2008−97496A)
【公開日】平成20年4月24日(2008.4.24)
【国際特許分類】
【出願番号】特願2006−281223(P2006−281223)
【出願日】平成18年10月16日(2006.10.16)
【出願人】(301001878)株式会社デジタルコミュニケーションズ (3)
【Fターム(参考)】