画像圧縮(コンパクトPDF)~メールに便利な小さいサイズのPDF~


Fig.1 Concept of Compact PDF
企業向けのデジタル複合機市場では、各機種の付加価値を高めるために、様々な機能が搭載されています。この中でも、原稿のカラー化に伴い、スキャナで読み取ったドキュメント画像を、従来のJPEG圧縮した画像よりもファイルサイズを小さくしてPDFファイルに変換する技術開発(コンパクトPDF変換)が注目されています。この機能によって、スキャンした画像をメールで送る“Scan to mail”の通信時間が短くなり、より使いやすくなると考えられます。 ファイルサイズを小さく(圧縮)することは、画質とのトレードオフの関係にありますが、本技術開発では、文字と写真を分離して、それぞれ圧縮することにより、画質を保持したまま、ファイルサイズの小さいPDFに変化する技術を確立しました。
このコンパクトPDFに変換するためには、まずドキュメント画像から、精度良く文字と写真を分離する必要があります。その後、文字には文字用の最適な圧縮を、写真には写真用の最適な圧縮を施して、両者をレイヤーとして重ね合わせて、PDFファイルフォーマットで一つにまとめます(Fig.1参照)。これによって、従来の単一の圧縮(例えば.JPEG圧縮)よりもサイズの小さいファイルに変換可能となります。

コンパクトPDFへの変換技術の特徴は、次の2点です。

  1. ドキュメントイメージの“文字”と“写真”の領域に自動的に分離する(写真と文字の複合判別による領域分離)
  2. 文字領域、写真領域を、それぞれに適した圧縮を施してPDFに変換(圧縮とPDFへの変換)

写真と文字の複合判別による領域分離技術

ドキュメント画像中の、写真及び文字の分離に関しては、現在多くの方法が、研究開発されています。この文字と写真の分離は、コンパクトPDF変換技術において最も重要な技術であり、性能を大きく左右します。分離アルゴリズムには、当社が保有する写真・文字画像に対する豊富な研究から生まれた技術を利用して、写真・文字の複合的な判別をする技術を確立しました。
写真と文字の複合判別による領域分離技術の一番の特徴は、これまで一つの基準で写真と文字を判別していたのに対し、写真と文字をそれぞれ別々の基準で判別し、そしてその判別結果を解析して、相関関係から更に正確に分離するところにあります。
写真領域については、様々な特徴を解析して、小さな写真画像でさえも、正確に分離します。従来では、小さな写真画像は、文字として間違って判別するケースが多くありました。しかしこの技術によって、正確に写真の領域を限定して、文字との分離性能を向上することに成功しました。 文字領域については、コピー機の開発で培った文字特性を抽出する技術をベースにして、文字のレイアウト情報を活用して、より高精度に文字のみを分離できます。そのため、これまで問題となっていた、写真の中の一部を間違って文字を判別してしまうミスや、写真に隣接した文字を判別できなかったミスを、大幅に抑制することができました。用紙の下地色にも影響されません。
Fig.は写真と文字の分離処理のサンプル画像です。Fig.2-(1)は、スキャナで取り込まれたドキュメント画像です。Fig.2-(2)は、従来の処理結果です。文字部分は正確に判別して2値化していますが、写真の領域の一部を文字として間違って判別しています。これに対し、本技術を適用したFig.2-(3)では、写真と文字が正確に分離できていることが確認できます。

Fig.2 Result of Photo and Character separating

更に、写真と文字の分離そのものが正確でも、複数の色が混ざった文字には、間違った色をつけてしまうことがありました。そのため、本技術では、文字として判別した箇所に対して、文字の色と文字サイズから、不自然な箇所を抽出して、より正確な文字色へと修正します。Fig.3がそのサンプルです。Fig.3-(2)の従来の処理では、“W”と“r”がそれ以外の文字と接触しているため、単一の文字として誤認識されてしまい、全て黒文字になってしまいます。
本技術ではFig.3-(3)のように、文字毎に分離して、正しい文字色にしています。

Fig.3 Result of Character

圧縮とPDFへの変換

文字と写真を分離した後、それぞれの領域毎にまとめて、PDF用のレイヤー構成に最適な形に変更します。文字は、視認性も考慮して、2値化して、FAXで使われているG4圧縮を施します。写真は、適切な解像度に変換した後、Jpeg圧縮を施します。そしてそれぞれをレイヤーとして、PDFファイルへと変換します。
今後、この技術開発によって、スキャンした画像をメールで送る“Scan to mail”において、これまでサイズの点で敬遠されていたカラーの複数枚原稿送信時も非常にコンパクトかつ高画質に実用的な利用が可能となりました。更にOCR認識率の低下がないので、アーカイブやコピーログなどセキュリティ用途への展開も期待されています。 また現在は、大局的なレイアウト判別を加えることで、本技術のコア部分である、写真・文字分離技術の更なる精度向上と高速化に向けて開発を進めています。

この技術に関連したテクノロジーレポート

ページトップへ戻る