About this project

このプロジェクトは、文書認識関係の実験のためのソフトウェアを公開 しようとするものです。 公開されるソフトウェアは、主にレイアウト解析に 関するものです。 (注: OCRは含まれません)

文書のレイアウトは多種多様なので、文書認識のアルゴリズムの評価には しばしば苦労します。 文字認識の研究のように標準データベースを使ってアルゴリズムの能力を 評価することも考えられますが、標準データで評価できることは限りがあります。 沢山の文書画像を手あたり次第にかき集めた としても、本来チャレンジすべき難しい問題を含む文書の割合が小さければ、 あまり意味のない評価を行うことになります。

実用上に問題となりうることはアプリケーションによって異なり、 何を特に重視しているかは研究者によっても異なります。 研究者は、自分が問題視している点を特に詳しく調べたいと思うでしょう。 そのためには、 アルゴリズムにとって厳しいデータを用意して、従来の手法と比較する ことも有効でしょう。 このような比較を行うには、従来の手法を実現したプログラムが手元にあると 便利です。

ところで、 論文などで公表されている既存のアルゴリズムは、理論的には それほど大げさでなくても、いざインプリメントするとなると意外に労力が 必要なものです。 また、論文ではアルゴリズムの詳細やパラメータ の値が省略されていることがあり、再実験を行うには不十分な 情報しか得られないこともしばしばあります。 再実験のための準備の手間を省いて、研究を効率よく進めるには、誰でも 簡単に使えるようなプログラムが公開されることが一番です。

このプロジェクト(project-O2)は、私や私の共同研究者が開発した手法を インプリメントし、そのプログラムをなるべくソースコードも含めて 積極的に公開しようとするものです。 公開されるプログラム群には、新しい手法が含まれていなくても、多くの 研究者にとって有益と考えられるプログラムも含まれます。

Impacts

このプロジェクトにより、次のような影響(impacts)が期待されます。

手法の改良や新規開発は日進月歩です。 手法は論文として世に出た時点で 既に古くなっています。 しかし、その後の研究において、最低限越える べき目標にはなり得ます。 このプロジェクトは「標準」(standard)となるべきものを提供しようとするものでは ありませんが、過去のある時点での「参考となる物」(reference)を 提供できると考えます。


All Rights Reserved, Copyright (C) Hideaki Goto 1997
Back to Project-O2 Home Page.