スキャナを利用した本の電子化について。

どうやっても部屋が片づかない私。
 
「どうして、一向に部屋が片づかないんだ……?」
と、“掃除しないから”という明白な理由を回避して考えた結果、
 
「収納スペースより本が多いから、そもそも片づきようがない」
 
という、恐るべき事実に気が付きました。
 

なんて恐ろしい。*1
 
コミックの電子化については、過去に別な方が優れた記事を書いていますので、そちらを見て頂けば良いかと思います。
http://kyozai.noblog.net/blog/a/10225926.html
 
この記事では、上記記事と同じく、ScanSnapを使用しつつ、コミックでない、文字主体の書籍、主に文庫本について扱います。
 
なぜ主に文庫本かと言うと、単純にサイズ=見やすさの問題です。
 
私が使っているB5ノートの画面で見た時、元が文庫本なら、原本よりページが大きく見えます。
もちろん、もっと大きな書籍でもスキャンできる(A4を横向きにしてスキャンできる=A3版までいける)のですが、そうすると、一ページが画面内に納まらず、収めようとすると字が小さくなり、読みづらくなります。
 
まあ、いずれにせよ、パソコンの画面で長時間字を読んでも平気だ、という方向けなんですが。
 
本の電子化については、Wikiも存在しているのを発見したんですが、そちらは最近になって斜め読みしただけです。
http://wikiwiki.jp/bookjisui/
 
なお、先に書いておきますが、前述の記事の筆者さんほどの時間はかけません。
「慣れると一冊1時間」という作業時間は長すぎる。
 
……というのは、つまりその本をどの程度大事に思っているか、ということです。
この記事では、「読めればよい」ということを第一に、画質とかは気にしないことにします。
 
そもそも、古書店で本を買って、染みとか折れとか日焼けがあっても気にせず読む人なので。自分。
 
「たまにぱらぱらめくって読み返すけど、通読は絶対しない」レベルの本を扱います。
 
なので、「本に対する愛情がない」という批判は甘んじて受けたいと思います。
ただ、もっと本を大事にしつつスキャンする方法もあるわけで、この記事がその手がかりになれば、と思います。
さて。
 

スキャナについて。

いくつかの選択肢があります。
 
フラットベッドスキャナ
さて、いわゆる「ブックスキャナ」として売られているのは、「フラットベッドスキャナ」というものの一種です。
要するにコピー機の親戚みたいな。
 
ただ、普通のスキャナでは、(コピー機同様)台の縁までスキャンすることができません。
従って、ページの全体をスキャンしようと思えば、本を開いて、伏せた状態でスキャンする必要があります。
しかし、本を完全に開いて平たくすることはできない(無理にやろうとすると本が傷む)ため、どうしても本のとじ目に影ができてしまいます。
ブックスキャナは、スキャン台の縁までスキャンすることができるため、1ページずつスキャンすることが可能なわけです。
 
 
・メリット:本が傷まない
・デメリット:手動なので手間がかかる

 
ADFスキャナ(原稿自動送り装置付きスキャナ)
外見はインクジェットプリンタのようなもので、原稿受けに置いた紙を一枚ずつ吸い込んでスキャンします。
表裏両面を同時にスキャンしてくれるのが普通みたいです。
問題は、そもそも書類などをスキャンする機械なので、本の形のままではスキャンできないこと。
なので、何らかの方法で本を分解し、ページ一枚ずつにばらさないとなりません。
 
・メリット:作業が早い
・デメリット:本は破壊される

 
自動ブックスキャナ
真空ポンプでページを吸い付けて、自動的に本をめくってスキャンする機構を具えたスキャナ。
(下のサイトにGIF動画あり)
http://print.johf.com/log/20060516a.html
大きさは、まあ本棚よりはずっと小さいわけで、本が片づくことを思えば許せるサイズです。
 
値段は2625万円(消費税込み:2500万円+消費税125万円)。
http://www.musashinet.co.jp/department/info/info_apt.html
 
・メリット:ほぼ完璧。
・デメリット:完璧に無理。

 
実質2択なわけですが。
私は、ADFスキャナを買いました。
 
スキャン速度自体は、フラットベッドだろうとADFだろうと大差ないんですが。
問題は、フラットベッドだと、人間がつきっきりでないとならない、ということです。
これは、作業効率をものすごく下げるので……。
 
ただ、本が破壊される=古書店に売れないということです。
これは悲しい。
 
金の話ではなくてですね。
どのみち文庫本なんか、一冊10円とかでしか売れないんで。
 
ただ、自分がこの本を手放しても、別の誰かが活用してくれる……という可能性が消え去る、というのは、意外と精神的にくるものがあります。
 
……いや、pdfファイルだって、他人に渡すことはできるんですけどね?
むしろ書籍より楽に。
 
ともあれ、以後、下の機械を使う前提で書いていきます。

 

その他の道具

裁断機。
[rakuten:bunbougu-azumaya:775483:detail]
個人的には必須じゃないかと。
結構でかいし、そこそこ値段も張る道具ですが、薄手の文庫を一瞬でばらせるメリットは手放しがたいものがあります。
ただ、後述するように、本を切りますので、カバーイラストとかは端が切れます。
 
それが嫌な人は、電子レンジで糊を溶かすとか、かんなで削るとかいう方法を採ることになります。
 
PLUSのQ&Aを見ると、
http://bungu.plus.co.jp/sta/support/faq_list.asp?q_genre=03
「刃の研磨の目安はPK-51*シリーズでコピー用紙100枚裁断で約2000回」
つまり、ページ数にして40万ページくらい、ということでしょうか。
 
いい加減な計算ですが、厚さ20mくらい切ると駄目になる、ということのようです。
 
うちの裁断機、そろそろ切れなくなってきました。
……研磨、取扱説明書には、
「刃は研磨することもできます。その際は、購入店へご用命ください」
って書いてあるんですが、通販で買った私はどうすれば。
替刃を買うしかないのか。
 
まあ、刃の右側しか使わないので、逆側で裁断すればまだいけますが。
 

裁断機にスキャナを乗せてみた。
裁断機、けっこうでかい。
(スキャナが小型だ、ってこともあるんですが)
 
しかし、本を片付け終えた暁には、こんな裁断機10個収納しておつりが来るだけの収納スペースが空きます。
 
カッターナイフとセロハンテープ

本をスキャンする前に使います。(後述)
 

文庫を二つに切る

裁断機の裁断厚は、約15mm。
これを超える書籍は、真ん中で二つにばらさないとなりません。
 
もちろん、裁断機に入る厚さの本なら、この工程はとばします。
やってるうちに、ぱっと見ただけで、ばらす必要があるかどうかわかるようになります。
 
さて、今回扱う文庫は厚さ25mm。

見るからに不可能です。
 
まず、背表紙にカッターを当て、カバーの背の中心を切ります。

 
次に、本の中央付近のページで割り開きます。

 
そして、こんどは内側から、カッターで二つに切り分けます。

 

切断終了。
 
そして、カバーをかけたまま、裁断機へ。
 
……本を破壊するのって、やはり罪悪感がぬぐえないんですが。
 
しかし、このままだと、おそらく死ぬまで手放さずに本棚の肥やしですし。
そうして、じわじわと劣化していくよりは、今のうちに資源ゴミに出した方がまだしも……と、無理に自分を納得させて、作業を進めます。
 

さらばだブリン! 大義のための礎となれ!
 
折り返しイラストなどがある場合、裁断する前に開いておきます。
 
裁断機の台には、サイズを示す線が引いてありますので、これに合わせて。
 
文庫の場合、「はがき」サイズに切ると、糊も残らず、文章は切れず、丁度良いみたいです。
(ただ、口絵だけ表紙から離れなかったりしますので、表紙・裏表紙周辺は確認を)
 
なお、私はこれまであまり気に留めたことがなかったのですが、本のサイズって色々なんですね。
うっかり切りすぎてしまって泣きを見ることのないよう、本のサイズ(というか幅)ごとに別にしておくと良いと思います。
 
さて、PK-513には、カットライン表示機能、というものがあり、左側のボタンを押すと、裁断される予定のラインが光って見えます。
 

薄い本であればこのようにくっきり線が見えます。
 
一方、今回のようにぎりぎりの厚みだと、線の大部分は刃のカバーに隠れて見えません。
しかし、カバーに2カ所の切れ込みが入っていて(「刃が出ている さわるな」と書いてある部分)、そこだけ線が見えますので、支障はありません。

フラッシュ焚いたら見えない。
 

フラッシュ切ったらぶれた。うう。
 
誤ってホチキスの針を切ってしまうと、刃が痛むので注意……だそうなんですが、これまでのところホチキスを製本に使った文庫はありませんでしたので、安心して裁断。
(雑誌類では、ホチキスがしょっちゅう使われていますので、よけて切るとか抜くとかいう配慮が必要)
 
切れました。

さっきの画像と比較すると、カバーイラストの右端が切れているのがわかるでしょうか?
 
この本だと、まだそれほど違和感はないと思うのですが……。
 
本によってはこんな感じに。

気になる方は、背表紙の部分だけはさみで切りとれば良いかと思います。
 
カバーを残して、表紙、裏表紙は取り除きます。

(スキャンしたい方はどうぞ)
 
そして、カバーの折り返し部分をセロハンテープで固定します。

止めるのは、赤い楕円で示した辺り。
全体を留める必要はありませんが、固定しないと、スキャンする時にねじれて悲惨なことになります。
 

悲惨。
 
余談ながら、最初のうちは、カバーを一旦取り外し、はさみで中央を切って、文庫本体とは別に裁断する……という手順を踏んでいました。
カッターで切った方が早い、と気付くまでに一週間くらいかかりました。
 
「もっと早く気付け」って?
メガネが発明されたのは13世紀ですが、それを頭に固定することを人間が思いつくまで、200年以上かかったことをご存じでしょうか?
 

ハードカバーの場合


 
文庫と同様、カバーの背の部分を切ります。

 
続いて、見返しの部分にカッターを入れます。

表紙も裏表紙も。
 
で、表紙・背表紙・裏表紙をばりばりとはがします。

 
ハードカバーの場合、厚さ15mmに納まることはまずないので、文庫と同じように中央で切り離します。
(厚さによっては3分割する必要があることも)

あとは文庫と一緒。
 

スキャン

さてスキャン。
 
……の前に、原稿が一体何枚あるのか数えておきます。
別に一枚一枚数える必要はないんですが。
 
まず、本文が、ページ数÷2枚。
 
表紙と裏表紙、それから巻末広告や口絵はページ数に含まれないはずですので、これを本文の枚数に足します。
 
目次がページ数に含まれるかどうかは、文庫によって異なりますので、どこが「1ページ」になっているか確認しましょう。

 
*2008/01/25追記
あらかじめページ数を数えておくよりも、いったん読み取りを終えてpdfファイルとして保存した後、それを開いて確認した方が楽なのに気付きました。
 
pdfファイルとしての「ページ数」と、本のページ番号にはズレがありますが(pdfの場合、表紙が「1ページ」になる)、両者に何ページズレがあるかを確認すれば、楽にマルチフィードが起きたかどうか把握できます。
 
例えば、本のページ番号「1ページ」目が、pdfファイルの「3ページ」として数えられているなら、本の「300ページ」目は、pdfとしては「302ページ」にあたるはずです。
これが、マルチフィードが1回起きると「本の300ページ=pdfの300ページ」になります。
2回起きると「300ページ=298ページ」に。
 
だから、最初のページと最後のページだけチェックすれば、マルチフィードが何回起きたか、あるいは起きなかったかすぐにわかります。
 
マルチフィードが起きたことがわかったら、とりあえず真ん中あたりのページをチェックして、マルチフィードがそこよりも前で起きたのか後で起きたのかをチェックします。
で、さらに残りの半分よりも前なのか後なのか……とチェックしていけば、マルチフィードが起きた箇所を迅速に発見できます。
 
*追記ここまで
 
また、しおりや広告が挟んであると、枚数に数えられてしまいますので、取り除いておきます。
 
で、これを記録したら、紙束となった本を原稿受けに置いていきます。
 

こんな感じに紙をずらして入れると、紙送りがスムーズになる……ような気がします。
また、誤って天地逆に紙を入れてしまうことを防げます。
 
ScanSnapのサイドガイドには、図のようなマークがついています。

取扱説明書によると、読み込める原稿束の厚さは5mmが限界なんだとか。
つまり、この、厚さ25mmの文庫本だと、最低5回に分けて読み込まねばならないことになります。
 
実際には、5mmより多少厚くてもなんとかなりますが、あんまり厚いとマルチフィードの原因になったり、そもそも原稿を吸い込めなかったりするので、無茶は禁物。
 
残念ながら、本を一冊ぽんと置いて、後は機械任せ、というわけにはいきません。
それが嫌な方は2500万円+税を用意するしかない。
 
とはいえ、5mmってことは50枚(100ページ)くらいありますので、そんなに忙しいわけでもありません。
スイッチぽん、の簡単操作で、スキャニング開始。
で、スキャナがヴイヴイうなってる間に、別な文庫をばらして裁断します。
裁断しつつ、時々横目でスキャナを見て、原稿がとぎれそうだったら補充します。
 
さっき計ってみたところ、原稿210枚(本文404ページ)の文庫で、スキャン終了まで約8分かかりました。
 
文庫一冊スキャンする間に、2〜3冊の文庫を解体できると思いますので、休まずやっていくと、徐々に裁断機の隣に裁断した本の山ができていきます。
で、ある程度裁断した文庫が溜まったら、その他の作業を片付けます。*2
 
解体に手間のかかるハードカバーの解体とか。
トイレに行くとか。
食事とか。
 
おわかりのように、この作業のボトルネックになるのは、スキャンの速度です。
なので、可能な限りスキャナを止めないように作業します。
 
スキャンした本はそれで部屋から消え失せるわけではなく、資源ゴミに出して初めて片づくわけですから。
資源ゴミの日までに、可能な限りたくさんの本を片付けることが必要です。
 
ちなみに、裁断した後の本を縛る方法は、
http://www1.ocn.ne.jp/~tatsujin/ropework/nidukuri2/index.htm
を参考にしています。
 
さて、原稿受けに紙がなくなると、図のような画面が表示されます。

あらかじめ数えておいた原稿枚数と食い違いがなければそれでOK。

 
枚数が少ない(=マルチフィードが起きた*3)、という場合には、いったんこのまま保存したあと、どのページが欠けたのかを確認し、欠けたページだけ別にスキャンして、所定の場所に挿入する、という手間がかかります。
 
これは面倒。
 

設定

まず、「継続読み取りを有効にします」にチェック。
これを入れないと、原稿が切れた瞬間、pdfファイルの保存が始まります。
 
コミックの場合、
「1ページ=1ファイル」
なので、問題ではないのですが。
 
書籍の場合、
「1冊=1ファイル」
としたいので、これは困ります。
 
「継続読み取り〜」にチェックしておけば、原稿が切れた時、続きがあるかどうか尋ねられます(さっき掲げた画像)ので、続きがある時は原稿をセットしてそっちをクリック(または、スキャナ本体の「スキャン」ボタンを押しても良い)
一冊の本を一つのファイルにしたいのであれば、忘れずチェックを入れましょう。
(デフォルトではオフになってたはず)
 
続いて、画質は「ファイン」で。
「スーパーファインでなきゃダメだ!」
という意見も聞くんですが。
 
設定をスーパーファインにすると、スキャン速度が目に見えて低下するので、私は避けています。
……画質ノーマルには……したことがありません。
 
ちなみに、下に示したのが、ファインとスーパーファインの例。

 

 
pngに変換した時点で画質が落ちてるんじゃね?」
という意見はさておき、確かに、ファインの方が若干文字がにじんでいるように見えるのは事実。
 
でも、読むのに支障はありませんので。
 
カバーイラストはこんな感じ。

よく見ればノイズが入っていますが、そもそも古本ですので。
 
カラーモードの選択……これはちょっと迷うところ。
 
図は、とある文庫本。

どうしたわけか、右ページが白黒、左ページがカラーとして読み込まれてしまったもの。
 
明らかに「白黒」の方が読みやすいですね。
 
しかし、イラスト(白黒の)を含んだページが「白黒」で読み込まれると、古いコピー機でコピーしたようなありさまになります。

左が「カラー」、右が「白黒」で読み込まれたイラスト。
 
これはひどい
 
図版など、白黒で読み込まれると困るものは、カラーとして認識されるのを祈るか、最初からカラーモード限定に設定して。
なんなら、その部分だけ別に読み込んで、後からpdfファイルを結合することもできますが……。
(読み込む途中でモードを切り替えることはできないっぽいので)
 
「文字をくっきり」は、よくわかりません。
これにチェックを入れると、イラストを変にいじられる率が高まる気もするんですが、冒頭で触れたコミックの電子化では、チェックを入れた方がずっと画質が良くなる、と言っています。
jpegとpdfで違うんでしょうか?
 
「文字列の傾きを自動的に補正」をオン。わりと気休め。
 
「原稿の向きを自動的に補正」。
絶対オンにしないこと!

 
「文字列の傾き」と何が違うのかというと、上下逆に入れた原稿とか、横倒しの原稿とかを自動で判別してくれる、ということ。
それがうまくいくようなら、文庫本を横向きに入れて自動で元に戻させることもできるんですが、実態はさにあらず。
むしろ、ちゃんと向きをそろえて入れた原稿を、勝手に横倒しにしたり上下逆にしたりして、あとで文字認識した時に無意味文字列の塊になってしまったりするので、これはオフ。
 
「白紙ページを自動的に削除」は、しない方向で。
白紙ページを削除すると、見開きイラストが見開きでなくなってしまうこともあります。
白紙ページが一つの“味”になっていることもありますし。
それに、実は白紙じゃないページを白紙と誤認するのでは、という恐れが捨てきれないので。
 

OCR(文字認識)

ScanSnapには、文字認識ソフトが付属しています。
読み込んだ本のページは画像扱いですが、そこに書かれた文字を判別し、透明なテキストをその上に重ねた、「検索可能なpdfファイル」にする、という機能があるのです。
 
じゃあ、元ページの画像はいらないじゃん、って?
 
……正しく読み取れればね……。
 
さっき、「ファイン」と「スーパーファイン」の例として出したページの、OCR結果。
(ちなみに「ファイン」の方)

伝令は評議室の一画にあるカウチにすわり、肩から毛布をはおって、湯気のたつ熱いスープ
をすすっていた。まだ若いチェンだ。ときおりぶるつと身をふるわせるが、なによりもひどく
疲れきっているように見える。危険な旅のばてに、最後には氷のような海水を泳いできたため、
毛皮が濡れそぼり、房状にもつれてかたまっている。
ここまでたどりつけただけでも一貢跡だわ、とメガン・オーーーグルは彼を見ながら思った。最
新の装臘を備え、こちらから上陸させたスパイや偵察隊はlだれひとりとして帰ってこなか
いか超
ったというのに、》」の小さなチムは、木を切って作った小さな筏と手織りのカン.ハス地の帆だ
けで、この隠れ場所の近くまでたどりついたのだ。
しかも、息子からのメッセージを携えて。
メガンはふたたび目をぬぐい、伝令がまつ先にロにしたことばを思いだした。海中洞窟を泳
ぎ、この地中深い隠れ家にたどりついたあと、伝令はまず、こう告げた。

同じく、「スーパーファイン」のOCR結果。

伝令は評議室の一画にあるカウチにすわり、肩から毛布をはおって、湯気のたつ熱いスープ
をすすっていた。まだ若いチェンだ。ときおりぶるつと身をふるわせるが、なによりもひどく
疲れきっているように見える。危険な旅のばてに、最後には氷のような海水を泳いできたため、
毛皮が濡れそぼり、|房状にもつれてかたまっている。
ここまでたどりつけただけでも奇跡だわ、とメガン・オーーーグルは彼を見ながら思った。最
新の装備を備え、こちらから上陸させたスパイや偵察隊はlだれひとりとして帰ってこなか
いかだ
ったというのに、この小さなチムは、木を切って作った小さな筏と手織りのカン韓ハス地の帆だ
けで、この隠れ場所の近くまでたどりついたのだ。
しかも、息子からのメッセージを携えて。
メガンはふたたび目をぬぐい、伝令がまつ先に口にしたことばを思いだした。海中洞窟を泳
ぎ、この地中深い隠れ家にたどりついたあと、伝令はまず、こう告げた。

「違い」はあるが「差」はない、というところでしょうか。(「いか超」とか「いかだ」とかがどこから出てきたのか全く謎)*4
 
いずれにしても、誤読が多く、これ単体では使い物になりません。
以前の記事でも書きましたが、
「“アシモフの科学エッセイ”の中で、クリスマスイブの起源について触れてたのはどの記事だっけ?」
とかいう時に、「クリスマスイブ」で検索をかける、といった、あくまで検索用のデータとして使うのが望ましいでしょう。
 
当然といえば当然ですが、複数の単語で検索をかけることはできないので注意。
 
どうでもいいけど、縦書きの文だと誤読が多いです。
縦書きの文を想定してない、ってことはないんでしょうが(現に読めるわけだから)、「オニーグル」を「オーーーグル」とか、普通に考えてあり得ないから。(横書きならともかく、縦書きだと、「ー」と「ニ」は、90度向きが違うから)
 
OCRは、全行程で一番時間がかかるところです。
パソコンの性能にもよるでしょうし、よくわからないんですが、大体文庫一冊15〜20分くらい?
 
「空き時間に実行」だとおそろしく時間がかかるので、「今すぐ実行」を選びます。
 
途端にファンが全力運転を始めますが、まあ、大丈夫……かな?
 
そしたら寝ます。
朝になってもまだ作業してたりしますが、仕事で使うわけじゃないので、こっちが仕事が終わって帰るまでには終わります。
 
OCRが終了すると、ファイルサイズが一割くらい増えます。
ファイルサイズと本のページ数にはおおまかな相関がありますが、それ以外の要素も大きいようで、よくわかりません。
(「知性化戦争」、上下巻で厚みは大差ないのに、上巻は75MB、下巻は21MBになりました)
イラストが多い本だと大きくなるような気はしますが、そもそもスキャンしたページは全部画像扱いになっているはず。
カラー扱いで読み込むとファイルサイズが大きくなるはずなので、古くなって縁だけ黄色くなったような本は容量が大きくなるのかな? と思っていますが、検証はしていません。
 

マルチフィード

ScanSnapについて、マルチフィードが起きやすいと主張する人もいれば滅多に起きないと主張する人もいます。
 
これまで使った限りでは、
「紙質による」
というのが真相のようです。
 
薄くてなんだか表面がつるつるしているような紙、あるいは逆に、コミック雑誌のような極端にざらざらしている紙でマルチフィードが起きやすいようです。
 
これまで試した限りでは、ハードカバー・ソフトカバーの本では、ほとんど問題は起きませんでした。
問題が起きるのは文庫。
 
それも特定の。
 
以下、私がやってみた範囲での、文庫ごとの危険度を書いてみました。
 
・だいたい大丈夫な文庫
(一冊スキャンする間、一度もマルチフィードが起きないことを期待して良い。でも枚数確認は必須)
講談社現代新書
岩波現代文庫
徳間デュアル文庫
ハヤカワ文庫
富士見文庫
河出文庫
角川スニーカー・G文庫
角川スニーカー文庫
ログアウト文庫
中公新書
 
・注意が必要な文庫
(一冊のうちに何回か起きることもある。起きないこともある)
岩波新書
中公文庫
富士見ドラゴンブック
 
・駄目
(頻繁に起きる)
創元推理文庫
角川スニーカー文庫
学研M文庫
 
ラインナップの偏りは華麗にスルーして頂ければ。
 
なお、リストの中には、一冊しかスキャンしてない本もありますので、あくまで参考程度に。
「一冊」と言っても枚数的には百枚を超えるわけですが、本が古くなると紙質が変化しますので(一冊の本だと、枚数がいくらあっても状態はみんな同じ)。
 
また、同じ文庫でも年代によって紙が変わっていることもあるようです。
角川スニーカー文庫」が2回出てくるのは、古い文庫だとうまくいったけど、新しい文庫だとページが薄くてつるつるになっていて、うまく取り込めなかったことによります。
妖魔夜行シリーズと百鬼夜翔シリーズで違った、と書いておきます)
 
特に、新しい角川スニーカー文庫、ひどい時には5枚くらいまとめて取り込んだりして。
 
隣でじっと監視していて、マルチフィードが起きた瞬間にカバーを開けて(直前にスキャンしたイメージが保存されなくなる)、もう一度やりなおし、とかしたんですが。
どうしたわけか、同じところで何度もマルチフィードが起きるんですよ……。
別にページに何か付いているわけでもないんですが。謎です。
 
すでに書きましたが、一度に大量の原稿を原稿受けに置くと、マルチフィードが起きやすくなるようです。注意。
 

総評

「便利ではあるが、決定的ではない」
というところ。
 
本の山を片付け、検索可能・携帯可能な状態にする、というのは極めて魅力的な話です。
 
それだけだったら、迷わず万人にお勧めするのですが。
 
しかし、残念ながら、マルチフィードなど、ハード面の信頼性と、不確かなOCRというソフト面の信頼性、双方に不満があるのが実際です。
 
私の場合は、その程度の精度でもまずまず満足しているわけですが、不満を感じる方も居ると思います。
(冒頭で掲げた、コミックの電子化に取り組んでいる人とか)
 
また、「部屋をを片付ける」という意味に限れば、すでに述べた通り、「スキャン速度=1冊8分」が、片付ける最高の速度となります。
一時間作業しても文庫7.5冊分しか部屋が片づかないわけですから、普通に掃除した方がずっとマシ、ではあります。
 
ですから、冒頭記したような、本が多すぎて根本的に片付けようがない、という状態でなければ、部屋の整理としての電子化には意味がないと思います。
 
あえて言えば、ハードカバーやソフトカバーの本は、体積/ページ数の比が大きいので、部屋を片付けるには向いているかも知れません。

偉大なる指導者、向山洋一先生の著作。
厚さ2cm近くあるのに本文220ページ。(知性化戦争[下]は596ページ)
3倍以上の効率で部屋が片づくことに。*5
素晴らしい。
 
ともあれ、近い将来、OCRの精度が今より向上して、真空ポンプ式の自動ブックスキャナもひょっとしたらもっと安くなるかも知れません。
 
本を置くスペースに余裕があって、それを待つことができるなら、待ってみても良いかも知れませんね。

*1:正直に書いておくと、元からこんなに本に埋もれていたわけではなくて。
電子化を開始してから欲が出て、長年実家に置きっぱなしだった本もアパートに持ってきたんです。
それでこんな有り様に。

*2:フラットベッドスキャナだとそうはいきません。

*3:複数枚の原稿が同時に送られること。

*4:いずれも、「知性化戦争」(デイヴィッド・ブリン著 酒井昭伸訳)……を、ScanSnap Organizerが認識したもの。

*5:そもそも判型が大きいので。