2021年10月22日金曜日

LaTeXの出力pdfにグリッドラインを引く(自炊pdfの画像位置調整)

普段購入した専門書をスキャンしてpdfファイルにし、ipadやPC画面で読むようにしています。書籍のスキャンにはAvisionのFB2280Eを利用しています(国内の代理店での価格は私が購入した海外の通販サイトの値段の3倍くらいになっているようです)。国内では同じくらいのスペックのブックスキャナーとしてPlustekのOpticBook 4800が手に入りやすく、私もこちらを所持していましたが故障のため買い替えました。FB2280は後発のためスキャン速度はOpticBook 4800より速いです。しかし付属のソフトがよろしくないことと、スキャン位置とボタン位置が離れていてスキャンし辛いなどの短所もあります。

本体付属ソフトは使いづらいため、スキャンソフトはNAPS2を利用しています。

また非破壊のスキャナーであるために、解体・裁断してスキャンするよりもページごとの位置ずれがかなり大きくなります。また、スキャンしたときに本の背に近い部分は光が届かず黒い帯がでます。

黒い帯部分の削除にはBrissというJava製のソフトを利用しています。GUI操作で偶数ページと奇数ページを分けて一度にcrop操作を行えるので便利です。

pdfをcropしてもreaderで表示される部分が変わるだけで、元の画像情報は残っています。表示されない部分を完全に消してしまうには、今の所AdobeのAcrobat PRO DCの「非表示情報を検索して削除」を利用する方法しか寡聞にして知りません。非表示情報の削除と傾き補正、OCR処理にはAcrobat DC Proを利用しています。

自炊したpdfの余白についてwebで検索すると、ipadなどで読むために余白を削りたい人が多いようです。私は適切に余白があるほうが圧迫感が無く読みやすいと感じるので,cropしたpdfをpdfTeXで処理して余白の追加をしていました。

最近はページごとの上下左右の振れが気になってきたので、余白の調整に試行錯誤しています。以下からが本題です。

TeX-LaTeX Stack Exchangeのこの記事を元に、eso-pic, pdfpages, tikzパッケージを利用してpdfファイルの全面にグリッドを表示させるようにしてみました。画像では画像位置の調整のためのガイドラインの表示も行っています。


これらの画像を表示するためのLaTeXソースファイルは以下の通りです。
\documentclass{article}

\usepackage[paperwidth=142mm,paperheight=210mm]{geometry} 

\newif\ifesopic
\esopictrue
%\esopicfalse

\ifesopic
\usepackage[texcoord]{eso-pic} %各ページ前面にグリッドを描くのに利用.texcoordで左上が原点.
\fi

\usepackage{pdfpages} %\includepdfコマンドを利用

\ifesopic
\usepackage{tikz} %グリッドの描画に利用
\usetikzlibrary{calc,math}
\fi

\ifesopic
%eso-picで使う新しい長さのコマンドを設定
\newlength{\myleftmargin}
\newlength{\myrightmargin}
\newlength{\mytopmargin}
\newlength{\mytopmarginii}
\newlength{\mytopmarginiii}
\newlength{\mybottommargin}
\newlength{\mycenterposition}

%margins
\setlength{\myleftmargin}{16mm}
\setlength{\myrightmargin}{16mm}
\setlength{\mytopmargin}{15mm}
\setlength{\mytopmarginii}{20.5mm}
\setlength{\mytopmarginiii}{36mm}
\setlength{\mybottommargin}{18mm}
\setlength{\mycenterposition}{71.00mm}

%グリッドと版面ガイドラインの描画
\AddToShipoutPictureFG{%
\begin{tikzpicture}[remember picture, overlay,
                   help lines/.append style={line width=0.1pt,
                                             color=blue!50},
                   minor divisions/.style={help lines,line width=0.2pt,
                                           color=red!50},
                   major divisions/.style={help lines,line width=0.3pt,
                                           color=red},
                   guide lines/.style={line width=0.5pt,color=blue},
]
 \draw[help lines] (current page.south west) grid[step=1mm]
                   (current page.north east);
 \draw[minor divisions] (current page.south west) grid[step=10mm]
                        (current page.north east);
 \draw[major divisions] (current page.south west) grid[step=50mm]
                        (current page.north east);

\draw[guide lines] ($(current page.north west) + (\myleftmargin,0)$)--($(current page.south west)+ (\myleftmargin,0)$); %left
\draw[guide lines] ($(current page.north east) - (\myrightmargin,0)$)--($(current page.south east)- (\myrightmargin,0)$); %right
\draw[guide lines] ($(current page.north west) - (0,\mytopmargin)$)--($(current page.north east)- (0,\mytopmargin)$); %top
\draw[guide lines] ($(current page.north west) - (0,\mytopmarginii)$)--($(current page.north east)- (0,\mytopmarginii)$); %top2
\draw[guide lines] ($(current page.north west) - (0,\mytopmarginiii)$)--($(current page.north east)- (0,\mytopmarginiii)$); %top3
\draw[guide lines] ($(current page.south west) + (0,\mybottommargin)$)--($(current page.south east)+ (0,\mybottommargin)$); %bottom
\draw[guide lines] ($(current page.north west) + (\mycenterposition,0)$)--($(current page.south west)+ (\mycenterposition,0)$); %center
\end{tikzpicture}%
}
\fi

\def\firstpagenum{1} %開始ページの数字を入れる(pdfの一部を読み込むとき)
\setcounter{page}{\firstpagenum}
\usepackage[pdfstartpage=\firstpagenum]{hyperref}

\def\target{images/hogehoge.pdf} %読み込むpdfのパス

\begin{document}
\includepdf[pages={32},scale=1.0,angle=0,noautoscale,bb=8.18mm 4.93mm 117.45mm 180.86mm,offset=-0.36mm 2.03mm,frame]{\target}
\includepdf[pages={33},scale=1.0,angle=0,noautoscale,bb=8.86mm 10.45mm 118.14mm 185.70mm,offset=0.36mm 2.37mm,frame]{\target}
\end{document}
グリッドの表示にはpdfTeXで2回処理が必要です。includepdfコマンドでpdfファイルを読み込むことができます。offsetの部分で読み込んだpdfの左下端点の座標を調整しています。

以前は1ページごとにこれらを調整していたのですが、流石に時間が掛かり過ぎるため、現在ではOpenCVを利用して画像の版面の枠を検出させて半分自動で位置調整をできるようにしました。それらについては後日記事にしたいと思います。

追記:2021/12/11:位置調整の記事を書きました。