FC2ブログ

oniondiary | 日記。時々映画やドラマや小説のレビュー。最近はなんとなく毎日書いてますが無駄話多し。

PDF画像をテキスト変換できないか模索中。

昨日から、スキャンした小説をなんとかテキスト化できないかと、OCRに挑戦しているんだけど、やっぱり上手くいきません。

130910_3.jpg

てか、短い文章ですでに日本語がアヤシイんですけどねw
これはレシピの画像を処理したもの。

130910_1.jpg

そのあと、小説をやってみようと読み込みをしましたが、なんか途中でとまるし……う〜〜ん、一気にやろうとするのが間違いか?
悩んで朝の貴重な憩いの時間が終わった。。。

まあ、こんなことをしているのも、なんだかな〜な買い物しちゃったからですが……それはまた今度。

関連記事

Category : iPhone/iPad
Posted by onion on  | 4 comments  0 trackback

4 Comments

マクノスケ says..."頑張ってるなあ"
いつもスゴイと思って記事を拝見してます。
きっと出来たら便利だろうなあ~。もうウチも本の山で…困っちゃてて…
とにかく例の新聞の小説2年半分はマクタロウに「捨てろ!」と言われてしまいました。(涙)
2013.09.10 09:30 | URL | #GWMyNl/. [edit]
Helva says..."うまくいったら教えてください"
この手の変換は「読んでココ」以来いろいろやってますが「いきなりpdf」とか、OCRのいいソフトがあったらどんなにかいいのにと思います。
読み取ってテキスト化しても手動で訂正しなければならないので手間がかかりすぎ。。。最初から入力した方が早かったなんてことも。
うまくいったらわたしも本の始末が少しはできるかも。
2013.09.11 01:01 | URL | #q6AO.T9M [edit]
onion says..."Re: マクノスケさんへ"
いやあ、上手くはいきませんねえ。
せっかく書き手が苦心して書いたものを、全く違う文章に認識してしまうようでは、ほぼ冒涜かもしれません。
でも、ちょっと必要にかられまして。

新聞小説も、そうやって読んでもらえただけでありがたいものじゃないですかねえ。多くの読者は読み飛ばしてしまうか読まずに捨てているものだし。
大事でも、かといってスクラップして後、どうするかも不明だし……とりあえずiPhoneで撮影して保存とか……それも面倒くさすぎますね。
2013.09.11 06:39 | URL | #- [edit]
onion says..."Re: Helvaさんへ"
> この手の変換は「読んでココ」以来いろいろやってますが「いきなりpdf」とか、OCRのいいソフトがあったらどんなにかいいのにと思います。

ホント、日本語として変じゃないかぐらい認識してくれる賢いOCRありませんかねえ。

> 読み取ってテキスト化しても手動で訂正しなければならないので手間がかかりすぎ。。。最初から入力した方が早かったなんてことも。

そうそう、最初から文書を見ながらテキスト打った方が……なんか、意味のないジタバタを繰り返しているようです。
2013.09.11 06:42 | URL | #- [edit]

Leave a reply






管理者にだけ表示を許可する

Trackbacks

trackbackURL:http://lukeskywalkercool.blog68.fc2.com/tb.php/1422-eb539157
該当の記事は見つかりませんでした。