Project-O2 home page (About)

About this project

このプロジェクトは、文書認識関係の実験のためのソフトウェアを公開しようとするものです。公開されるソフトウェアは、主にレイアウト解析に関するものです。 (注: OCRは含まれません)

文書のレイアウトは多種多様なので、文書認識のアルゴリズムの評価にはしばしば苦労します。文字認識の研究のように標準データベースを使ってアルゴリズムの能力を評価することも考えられますが、標準データで評価できることは限りがあります。沢山の文書画像を手あたり次第にかき集めたとしても、本来チャレンジすべき難しい問題を含む文書の割合が小さければ、あまり意味のない評価を行うことになります。

実用上に問題となりうることはアプリケーションによって異なり、何を特に重視しているかは研究者によっても異なります。研究者は、自分が問題視している点を特に詳しく調べたいと思うでしょう。そのためには、アルゴリズムにとって厳しいデータを用意して、従来の手法と比較することも有効でしょう。このような比較を行うには、従来の手法を実現したプログラムが手元にあると便利です。

ところで、論文などで公表されている既存のアルゴリズムは、理論的にはそれほど大げさでなくても、いざインプリメントするとなると意外に労力が必要なものです。また、論文ではアルゴリズムの詳細やパラメータの値が省略されていることがあり、再実験を行うには不十分な情報しか得られないこともしばしばあります。再実験のための準備の手間を省いて、研究を効率よく進めるには、誰でも簡単に使えるようなプログラムが公開されることが一番です。

このプロジェクト(project-O2)は、私や私の共同研究者が開発した手法をインプリメントし、そのプログラムをなるべくソースコードも含めて積極的に公開しようとするものです。公開されるプログラム群には、新しい手法が含まれていなくても、多くの研究者にとって有益と考えられるプログラムも含まれます。

Impacts

このプロジェクトにより、次のような影響(impacts)が期待されます。

他の研究者が比較実験を容易に行うことができるようになる
既存の手法の処理能力を、自分の目で簡単に確認できるようになる
文書認識システムの中で必要な処理で、自分たちが持っていないものを、公開されたプログラム群から調達できる
大きな目的とは関係のない方面での工夫や、些細な改良など、論文には書きにくいような細かい技法(Tips)をソースコードから読みとることができる

手法の改良や新規開発は日進月歩です。手法は論文として世に出た時点で既に古くなっています。しかし、その後の研究において、最低限越えるべき目標にはなり得ます。このプロジェクトは「標準」(standard)となるべきものを提供しようとするものではありませんが、過去のある時点での「参考となる物」(reference)を提供できると考えます。

Back to Project-O2 Home Page.