就寝中にマスク

ノドが弱い。喉です。ノドから風邪を引くことが多いです。すぐに痛くなる。

鼻づまりのせいで、就寝中に口呼吸になってしまいます。乾燥する冬場、起床時にノドが痛いことが多発していた。

ガーゼマスクの装着も試みたけど、

  • 寝てるウチに外れる
  • 息苦しい
  • ガーゼマスクは高い
  • 洗うのが面倒

などで続かなかった。

今は不織布マスクがとても安いですね。でも、外れては意味が無い。そこで、

  • サージカルテープ?でマスクを固定
  • 上部と下部の2箇所で顔に貼り付ける

としたところ、調子がいいです。ノド痛はほとんど無発生。不織布マスクは、ガーゼマスクほと息苦しくありません。

副効用として、アレルギー性鼻炎による鼻づまりも軽減される感じ。日中の鼻づまりレベルが低下したように感じます。

就寝中にハウスダストや布団ダストをたくさん吸い込んでいたのかも。

ということで、寝る前に鏡を見ながらマスクを貼り付けるのがちょっと面倒だけど、継続しています。

オノン服用

長年、アレルギー性鼻炎ハウスダストなどが原因だから通年性。主な症状は鼻づまり。

鼻づまりってイヤですね。スッキリしない。息苦しい。

2年ごとくらいにレーザーで焼いてもらってる。レーザー後は、くしゃみと鼻水が止まった。鼻づまりだけ継続中。

主治医の先生に相談。オノンの服用を勧められる。

服用開始から約半年。割といい感じです。ひどい鼻づまりは解消。寒い冬場はやっぱりつまりやすい。そういうときは、市販の鼻炎スプレーとちょっとだけ噴射。どうしてもの時は、パブロン鼻炎カプセルSを服用。

オノンを飲み始めてから、(時々の)スプレーと鼻炎カプセルSがすごく効くようになりました。鼻炎カプセルSは1日2回、1回2錠だけど、1錠を飲めばその日はOK。

オノンは1ヶ月単位で処方してもらってます。調剤局の方にお聞きしたら、ジェネリックがあるとのこと。4割くらい安い。最初の1ヶ月はオノンでしたが、その後はプランルカストで継続しています。1ヶ月の薬代が2,700円くらいかな?

Acrobat Xのアップデート

Acrobat X Standard、たぶん初めてのアップデートがありました。さっそく、メニューから適用。10.0.0が10.0.1に。

でも、OCRの停止問題は変わらず。1,050ページの雑誌で358ページ目でエラーが発生。相変わらず。

せめて、「エラーを無視してOCRを続行」などの処理が可能だといいのに...

エラー発生時のダイアログには、「この文書のエラーを無視する」といったチェックボックスがあるのですが、チェックを入れても入れなくても変化はないようです。

ロジクールM570(追伸)

シリコンスプレーにはオイル分が入っているようですね。当初のクルクル感は絶妙なのですが、1週間くらいすると滑り度が落ちる。

ボールを取り外して掃除。黒くなった垢?のような小さいゴミが数個、ティッシュに着きます。スプレー無しに比べると、垢ゴミが着きやすい印象。

でも、1週間に一度でよいので、あまり気にしていません。スプレーの再塗布は1ヶ月間隔で十分です。

ヘッドライト磨き

車のヘッドライトを磨きました。ピカール

古タオルにピカールを付けてゴシゴシと。タオルがすごく黄色になりました。びっくり!

新品同様とはいきませんが、黄色・黄ばみが見事に消えた。車の印象がずいぶんと変わりました。ヘッドライトの黄ばみは、見た目の影響が大きいのでしょうね....

その後、Soft99の保護液を塗りました。研磨で表面の保護層が減った?ことへの対策です。

簡単で短時間の作業なので、半年おきくらいで磨いてみよう...

AcrobatのOCRエラー(その後)

スキャンした雑誌PDFファイルは300〜600ページ程度。Acrobatで一気にOCRするとエラーで

スキャンした雑誌PDFファイルは300〜600ページ程度。Acrobatで一気にOCRすると「Paper Capture 認識サービスのエラーにより、ページを処理できません」エラーでアウト。

そこで、ページ分割にチャレンジ。5ページ単位、10ページ単位、1ページ単位など、さまざまなサイズに分割。それらをOCRさせることに。

以下、まとめです。

  • 分割したPDFファイル、2,000〜3,000個をまとめてAcrobatOCRすると、やっぱりエラーは発生する。
  • 発生するけど、エラーでAcrobatが落ちる前までのPDFファイルは、OCR化に成功している。
  • エラーが発生したPDFファイルは、エラー発生のページ以降がOCRナシではなく、全ページがOCRされる状態に。
  • エラー発生のページは、そのページだけ抜き出してもエラーでAcrobatが落ちることが多い。
  • 5ページPDFや10ページPDFは、その中のどのページでOCRが落ちたかどうか探すのが面倒。
  • Acrobatが「〜ファイルの〜ページでOCRに失敗しました」などのダイアログを出してくれる場合も多い(この場合はAcrobat自体が落ちていない)。でも、ログに書き出してくれていないようなので、ダイアログをスクロールして失敗ファイル/失敗ページをメモしないといけない(スクロールキャプチャしたりしました)。

ということで、とても面倒だけど、以下の方向で処理を進めることにしました。

  • 全ページを1ページ単位で分割し、1ページ単位のPDFファイルを作成。
  • 1ページ単位でOCRを実行。Acrobatが落ちるまで多量のファイルをまとめて実行。
  • 分割後、OCR失敗ファイルを探す。
  • 失敗ファイルはテキスト埋め込みの有無で探す(探す方法は人力検索で質問しました)。
  • 失敗ファイルはScanSnapOCR機能でOCR実行。ほとんど上手くいきます。ClearScanはできないけど...
  • 全ページのOCRが終了後、全ページを連結して1つのファイルに。
  • これで終了。


分割や連結はフリーのツールもたくさんあります。面倒になってきたら、分割連結だけはUnix上でスクリプトを書いて実行しようと考えています。

過去の雑誌20年分をOCRテキスト化する意義は大きいので、気長にがんばろうと思います。

AcrobatのOCRエラー(まとめ)

S1500で雑誌類を大量にスキャンした。技術系の雑誌。1冊300〜600ページくらい。

スーパーファイン、カラー自動判別、両面読み取り、「文字をくっきりします」オフ...などの設定でスキャン。スキャン直後の生PDFファイルは500MB前後でした。

OCRをかけてテキストを埋め込みたいなあ... キーワード検索できるといいなあ...という動機で、せっせとスキャンしたのでした。

で、OCRのエラー続出で大半がうまくいかない... 疲れました。以下、試行錯誤を簡単にまとめます(備忘録的)。

  • 「Paper Capture 認識サービスのエラーにより、ページを処理できません」のエラーが続出。
  • 50ページ単位ごとに区切っても発生するときは発生(1〜50ページは成功しても51〜100ページで発生)。
  • エラー発生のページを回避しつつOCRすればよいのかもしれないけど、600ページ雑誌×100冊に対して手動でそれをやる元気はない。
  • スキャン直後の生ファイルはWeb最適化されていない。Acrobatで別名保存すると自動的にWeb最適化されるが、いずれも同様のエラー発生。
  • 「スキャンされた文書の最適化...」や「Acrobat8以降で圧縮保存」などを行った後にOCRをかけても同様。
  • Acrobat8/Professional、Acrobat9/Standad、AcrobatX/Standardでも同様。
  • cleascanでもそうでなくても同様。検索可能な画像... 600dpiや300dpiなどオプションをいろいろ変えてみても同様。
  • メインPCがWin7/64bit/Core-i7なので、Win7/64bit/Core2QuadWinXP/32bit/Pen4マシンなどいろいろなPCで試したけど同様。いずれもメモリは8GBなど潤沢。64bitOSを疑ったけど関係なかった。
  • タスクマネージャーで優先度をあげる、他のアプリを極力落とす...などとしても同様。
  • 「Paper Capture 認識サービスのエラー」の情報が少ない。英語で検索してもヒットはするが、対処法の情報は少ない。Adobeフォーラムでも少ないようだ。


Acrobatの「Paper Capture」機能は、別会社から買収?して導入したような記述も見かけました。Acrobatとの親和性や多ページに対する安定性が十分ではないのかもしれません。

ScanSnap OrganizerでのOCR機能では、まあまあ上手くいきますが、それでもフォルダ単位でまとめて「検索可能なPDFに変換」をすると、エラーで止まっていたりすることがあります。Acrobatに限らず、OCR処理自体があまりこなれていない印象も受けました(マイナーな需要なのかな?)。

雑誌を少数ページに切り出し、OCR化に成功した場合を見てみると、噂とおりclearscan化できた場合は劇的にファイルサイズが縮小しています。100MBが20MBになったりしています。多数の雑誌や書籍を扱う際には、大きな魅力なのですが...

書いてて気づいたのが「セーフモードでWindowsを起動した状態で処理をしてみる」という試み。これもNGでしたら、ScanSnap OrganizerでのOCR化にしてしまうか、「読み取り革命」などの別ソフトを導入してみようと思います。

雑誌は手にとってパラパラ見るのが「閲覧としては」ベストですが、数百冊が自宅スペースを占有している状態では、雑誌を引っ張りだすのも大変だし、戻すのも面倒。書籍雪崩がおきます。キーワード検索できるし散らからないし、所望のページにはすぐにアクセスできるので、電子化すること自体は大いに意味があると思っています!