- blogs:
- cles::blog
« Google Labs 終了へ :: 放射性物質対策商品に注意 »
2011/07/22
PDFのテキストにOCRをかけて検索できるようにする
pdf
先日、紙の原稿をスキャンしたかなりのボリュームのPDFをもらったのですが、文字が全て画像なので検索できなくて困っていました。要はOCRをかけて、文字データを埋め込んでしまえば良いのですが何かいい方法がないかと思っていろいろと調べてみたら、 Acrobat *1には OCR を行う機能が標準で備わっているので、それを素直に使えば一撃で解決できることが分かりました。
具体的には「文書」メニュー→「OCRテキスト認識」→「OCRを使用してテキストを認識」を選択すると「テキスト認識」画面が出てくるので、「OK」をクリックするだけ。
同時に画像の傾きも調整してくれるので、文章も読みやすくなって一石二鳥でした。
- *1: Adobe Readerではない。
トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/4344
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form
コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。
OpenID を使ってログインすることができます。
« Google Labs 終了へ :: 放射性物質対策商品に注意 »
サイト内検索
検索ワードランキング
へぇが多いエントリ
- 検察事務官が人事記録を不正... (1)
- draw.io のファイルを編集で... (1)
- おべんとう一番 白山本店(閉... (1)
閲覧数が多いエントリ
1 . アーロンチェアのポスチャーフィットを修理(3214)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(3054)
3 . GitHub が全ての公開リポジトリへのシークレットスキャンを有効に(2494)
4 . 年次の人間ドックへ(2471)
5 . 2023 年分の確定申告完了!(1つめ)(2408)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(3054)
3 . GitHub が全ての公開リポジトリへのシークレットスキャンを有効に(2494)
4 . 年次の人間ドックへ(2471)
5 . 2023 年分の確定申告完了!(1つめ)(2408)
cles::blogについて
Referrers