blogs:
cles::blog
NP_cles()

« Google Labs 終了へ :: 放射性物質対策商品に注意 »

2011/07/22

PDFのテキストにOCRをかけて検索できるようにする

pdf

先日、紙の原稿をスキャンしたかなりのボリュームのPDFをもらったのですが、文字が全て画像なので検索できなくて困っていました。要はOCRをかけて、文字データを埋め込んでしまえば良いのですが何かいい方法がないかと思っていろいろと調べてみたら、 Acrobat ^*1には OCR を行う機能が標準で備わっているので、それを素直に使えば一撃で解決できることが分かりました。

具体的には「文書」メニュー→「OCRテキスト認識」→「OCRを使用してテキストを認識」を選択すると「テキスト認識」画面が出てくるので、「OK」をクリックするだけ。
同時に画像の傾きも調整してくれるので、文章も読みやすくなって一石二鳥でした。

^*1: Adobe Readerではない。

by hsur at 21:52 [5年前][4年前][3年前][2年前][1年前][1年後][2年後][3年後][4年後][5年後] |

こんな記事もあります「傾き文字認識」

・Google が AI によるファイル判別ツールをリリース
・2023 年の人気エントリ Top 100
・人民元の「￥」表記に注意
・Yubikey を SSH の公開鍵認証として使う
・安物の USB-UART を使おうとしたら PL2303HX だったので・・・
・OmniOS/ZFS サーバに wbadmin でイメージバックアップが取れない時に確認すべきこと
・デジカメの単価が急上昇
・Orange Holiday 8GB プリペイド SIM
・Rocky Linux 9 のマシンをロケールとタイムゾーンをコマンドラインから変更する
・極薄の OLED モニタ LG UltraGear 48GQ900-B

トラックバックについて

Trackback URL:

お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]

このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/4344

Trackbacks

このエントリにトラックバックはありません

Comments

愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。

コメントはありません

Comments Form

コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。

OpenID を使ってログインすることができます。

« Google Labs 終了へ :: 放射性物質対策商品に注意 »

Copyright © 2004-2023 by CLES All Rights Reserved.

サイト内検索

検索ワードランキング

へぇが多いエントリ

閲覧数が多いエントリ

1 . アーロンチェアのポスチャーフィットを修理(6299)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(6018)
3 . GitHub が全ての公開リポジトリへのシークレットスキャンを有効に(5083)
4 . 年次の人間ドックへ(5017)
5 . 2023 年分の確定申告完了！（１つめ）(4818)

最新のエントリ

・2024 年の人気エントリ Top 100

・アーロンチェアのポスチャーフィットを修理

・福岡銀がデマの投稿者への刑事告訴を検討中

・年次の人間ドックへ

・GitHub が全ての公開リポジトリへのシークレットスキャンを有効に

cles::blogについて

誰が書いてる？
最近行った場所
サイトポリシー
タグ一覧
検索ワードランキング

Referrers

Nucleus CMS v3.31SP3/w memcached

26607945 (W:137290 Y:102798 T:0617)