Entry

ScanPi!で書籍を電子化してみたのでレポート

スキャンピ! | 低価格 書籍のスキャンサービス 1冊100円〜 | ScanPi!

ScanPi!という書籍電子化サービスを利用して、手持ちの書籍を電子化してみたので、そのノウハウや感想などをつらつらと書いてみる。次に依頼する機会があった時の備忘録も兼ねて。
あと、これから書籍の電子化を考えている人向けの参考資料として役立てば幸いと、かなり詳細に書いてみた。

ちなみに、結論から先に話すと、個人的にはここに電子化を依頼して良かったと思ってる。

動機

そもそも書籍の電子化を思い立った理由は、他の大勢の人間と同様、書籍が邪魔すぎて生活空間を圧迫してきたから。400冊ぐらい。これでも6畳間には厳しい…。
本当は、裁断機とスキャナを買って自炊しようかとも思ったのだけど、初期投資が結構かかるし、書籍を排除した空間を裁断機とスキャナが圧迫したら本末転倒だろう、という判断によりアウトソーシングすることにした。いつでもどこでもすぐに電子化できるのは魅力的だけどね…。
ただ、スキャン依頼についても依頼本の準備や輸送コストがかかったりるというデメリットが発生するので、判断基準は人それぞれだと思う。

選択基準

利用サービスは以下のサイト等で調査。

書籍スキャンサービス比較
BookFire – 書籍 スキャン PDF サービス比較まとめ

選択の判定基準は以下の通り。

  • きちんと読める画質であること。
  • 表紙スキャン対応。折り返しまで含む。
  • カラー対応。
  • 安い。

そんな条件で色々調べてみたり、実際にスキャンで送ったりしてみた結果、ScanPi!が適切だと判断。1冊100円で表紙までスキャンしてくれる。自分が依頼した時は、サービス期間中につきファイル名打ち込みまでやってくれた。
ちなみに、最初の条件の「画質」については、安価な書籍化サービスを行う業者は大抵の場合、自炊定番アイテムScanSnap S1500を使っているようなので、どこに出してもそう大きく変わらないと思う。
参考までに、PDF-XChangeで見た書籍のプロパティ画面

電子化依頼手順

電子化のフローとしては、以下のような感じ。

  1. 電子化する図書を決定し、冊数及びページ数を数える。ページ数によって多少割り増しになる点に注意する。
  2. 荷造りする。自分の場合は書籍カウントと荷造りをセットでやってた。
  3. ScanPi!のページから電子化依頼。割増料金を加味した金額を入力。あとは、必要に応じて追加サービスを依頼。
  4. スキャン開始日と料金が指示されたメールが届くので、PayPalで料金を支払う。
  5. スキャン開始日の前後辺りに届くよう、書籍を発送する。
  6. スキャン完了後、メールで指定されたURLからダウンロードする。

ScanPi!はスキャン依頼からスキャン開始までの期間は、2~3週間ぐらい。混み具合にも依るようだ。すぐに書籍データが欲しい人にはあまり向かないかも。

依頼冊数と食い違いがあった場合は、書籍受領の時点で振込依頼が来る(一度やってしまった)。ページ数に間違いがあった場合は、スキャン完了後に振込依頼が来るとのこと。(少なかった場合は知らない。)

書籍発送

発送時に気を付ける点としては、宅配業者は多くの場合、荷物の上限が25~30kg程度なので、ある程度小分けにする。本の種類や紙質にもよるが、40x35x35の47L段ボールいっぱいに本を詰めると、40kg近くにはなる。
ただまぁ、集荷依頼した場合は宅配業者が重量を厳密に量ることはないと思う。実際、30kgオーバーの段ボールはそのまま持って行かれた。気になる場合は、「飛脚フリーサイズパッケージ」のある佐川を利用するのも手(通常の宅配便申し込みをして、規定を超える荷物はこちらの料金になるそうな)。
佐川で集荷を頼んだ場合、配送日指定は最長で集荷日から1週間先までなので、スキャン開始日に合うように集荷依頼日のタイミングを合わせる。

データ受領

ダウンロード時は、自アカウント内のページからダウンロードする。最初に依頼した時は、zipファイルが4つ配置され、その中にpdfファイルがまとまって入っていたので、ダウンロード自体は楽だった。
ところが、次のタイミングで依頼かけた時は、pdfファイルが全部バラバラで配置されていた。200冊以上あったというのに、何たる仕打ち(笑)。ダウンローダも使えなかったので、一つ一つぽちぽちクリックしましたともさ。さらに悪い事に、ダウンロードURL構成の関係上、一度URLをクリックするとページの上端まで戻されてしまうというおまけつき。
面倒臭いので、zipでくれ。

なお、ダンロード時に何らかの事情でファイルが壊れたのか、開けないPDFファイルがあった。これは再ダウンロードする事で解決した。そういう事も希に起こるので、ダウンロードした書籍はダウンロードの有効期限が切れる前にすぐに確認すること。

電子データ詳細

PDFファイルの基本構成は以下のような構成になっている(サンプル)。

1ページ目:表表紙のみ(表紙がある場合)
2ページ目:表紙全体(表紙がある場合)
3ページ目以降:本体表紙~内容~本体裏表紙まで(ハードカバーの場合は表紙無し)

1ページ目は2ページ目から表表紙のみを貼り付けた物。これは、PDFファイルのサムネイルが生成された際に表紙が表示されるようにするための配慮だそうで。

2ページの表紙は、折り返し含めて全体がスキャンされる。ここで意外だったのは、ごく希に表紙の裏側におまけの内容が描いてある書籍があったのだけど、それもきちんとスキャンして3ページ目に入れてくれたこと。例えば、「Cプログラミング診断室という本の表紙の裏側には、このような漫画が描いてあるけど、ちゃんとスキャンしてくれた…って、こんな漫画、今回電子化して初めて気付いたわ(笑)。
ただし、この表紙全体ページが無い書籍も結構あった。調べてみると、どうやらA4サイズの書籍については除かれているようだ。スキャナの読み取りサイズ上限の問題だろうか。面倒なので問い合わせはしなかった。表紙が貴重な本については自前で何とかする事をお勧め。

書籍本体のスキャンは、白紙だろうと何だろうと一切飛ばさず全部スキャンされる。
あと、中に折り込まれたページがあった場合もきちんとスキャンされる。例えば、コミック「紅 kure-nai」には、表紙を開いた次のページに、カラーイラストが折り込んであるが、きちんとカラースキャンして入れてくれた(サンプル画像 – 5,6ページ目)。
発送する際は、作業者が折り込みページの存在を認識できるように外に出しておく。

なお、出来上がった書籍を開くのは多少高いスペックPCでもちょっと重いと思った。これは電子化書籍の通常の重さなのか、圧縮率が高いのかは、経験が無いのでよく分からない。

オプション

今回、ファイル名付けサービスが無料で自動的にファイル名が設定された状態だったので、本来のファイル名は知らない。
付けられたファイル名は、「書籍名-巻数-作者」が基本形式…らしい。ただ、巻数が漢数字表記の場合はそのまま漢数字だし、書籍名と巻数の間にハイフンが無い場合もあるし、書籍名にハイフンが入っていてもそのまま入力されてくる。要するに、書籍の表記を素直にそのまま持ってくる。C#が「C#」ではなく「C♯」と打ち込まれていた忠実さにはさすがにビックリだ(笑)。
つまり何が言いたいかと言うと、正規表現等を駆使した機械的な変換は難しいので、自分でファイル名のスタイルを決めている場合は、やっぱりある程度は手打ちで打ち直さないといけない。もっとも、パッと見て何の本かすぐ分かるので、作業は楽なんだけど。
(参考までに、Flexible Renamer変換しようと試みた時の画面。)

それから、今回は技術書関連についてOCRも申し込んでみた。
これについては、精度の程はイマイチよく分からない。軽く見た感じでは、高い精度で文字を認識しているようなので、実用性はあると思う。ただ、カラーページの精度は図形と認識されやすいのか、あんまり良くないようだ。まー、気になる場合は自分でソフト買って納得いくまでやるのも手。時間はかかるだろうけどね。

感想

今回、ScanPi!に依頼して良かったと思うのは、以下のポイントが好印象だったから。

  • 安価
  • サムネイルへの配慮
  • 表紙・本体の状態をを切り貼りせず完全に維持。
  • 表紙裏や折り込みなど、多少変則的な本にも対応。
  • (今回のサービス期間中に限り)ファイル名設定。

あと個人的に、ページ構成はScanPi!のやり方がベストだと思っている。特に表紙関係。
以前、試しに別の業者に出してみたところ、表表紙、裏表紙、表紙の折り返しを全部切断して別々にスキャンされ、表表紙とその折り返しは先頭に、裏表紙とその折り返しは最後に持ってくる、という構成だったところがあった。
正直、そんな手間かけなくていい。電子化されている以上、最後のページに裏表紙が来る必要は無いし、表紙全体の1枚から切断状態に加工する事は簡単でも、切断状態から1枚に持っていく事は難しい。ついでに言うと、折り返しまでイラストが描かれている表紙は、変な所でイラストが切断されてしまう。
そんなわけで、表紙が1枚でスキャンされてくるScanPi!の構成は自分としては好ましい。

サービスの難点としては、別にここに限らずどのスキャンサービスにも共通するけれど、裁断されるため端が切れることと、微妙に角度が斜めになってるページがあること。
どのくらい切断されるかと言うと、以下のサンプルを見ると分かりやすいと思う。上が本来の表紙。下が電子化後の表紙。

20101128_book_sample4a.jpg
20101128_book_sample4b.jpg

また、パッと見て一番気になった斜めのサンプルはこちら
こればっかりは、大量処理している以上しょうがないなぁ、と諦める他ない。

今回、ScanPi!で電子化をしてみたわけだけど、100円というコストにしては、結構高い品質のサービスが受けられたと思っている。次の機会があれば多分、またここで依頼するんだろうなぁ、とは思うけれど。
そんな感じで、以上今回の書籍電子化についてのレポートでした。コレ書くのに3日もかかった。何やってんだか…。
長々としてあまりまとまりの無い文章になってしまったけれど、何かの参考になれば幸いです。

関連記事

本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました – GIGAZINE

追記

談。
自分は集荷サービスを使ったことが無かったけれど、宅配便のウェブ依頼サービスはサービスが細分化していて、どの業者も非常に分かりにくかった。今回利用した佐川の場合、「Web集荷サービス」と「飛脚人宅配受付サービス」はどう違うのか?違いは伝票の有無と調べて分かったけど、何故入力内容が異なるのか?など、疑問点が多過ぎて新規ユーザーに対して不親切。
Web上にフローチャートを置いてほしいなぁ…と思う。

以下、個人的なメモ。
書籍の各部名称について。
「本」の部分の名称

追記

ちなみに、電子化を依頼した冊数は338冊で、約30GB。漫画は6割ぐらい。残りは、もう読まない技術書とか読み物とか。全体の9割ぐらいは、350ページ未満で収まっているはず。今回、段ボールに収まらなかった本があと100冊ぐらいあるけど、これはある程度溜まったらまた出すことにする。
それよりも次の段階では差し当り、実家に置いてきた本を何とかしたいな…。

Comments (2 件)

Melog より:

電子化した書籍を保管する方法を考える

Melog: Archives > Entry – ScanPi!で書籍を電子化してみたのでレポートで書いたとおり、自宅の本を電子化して、約30GBの電子…

Melog より:

iPadでサーバ上のpdfファイルを読む

先日電子化した書籍のサイズは全部で30GB程ある。 これを読むためにiPadを使用するつもりだが、生憎自分の持っているiPadは16GB。全部収めるには足…

コメントを残す

メールアドレスが公開されることはありません。