csatblogspotdotcom

Wednesday, July 6, 2016

扫描版pdf的优化

一台杂牌电纸书,极低价位,分辨率800×600,黑白屏,反应很慢,支持txt、pdf、epub等格式,不支持mobi格式,下载了下载了人类简史(不超过5M,非扫描版,手机WPS可调整字体大小适应屏幕)放进去虽然可调字大小但调整之后就像linux虚拟桌面一样只能显示一部分,上下左右移动才能看到其余部分,找了另一版(不超过5M,非扫描版)放进去恰好适应;另外下载了pdf扫描版的全球通史,字太小没法看,这样的电纸书如何使用?只有在外部把pdf优化制作好了之后喂给它才行,方法是切边+调整大小+压缩,下面是步骤: 1.首先需要切边/切白边,即切除页面中空白部分,很多软件可以操作,但多少有些缺陷,例如a-pdf(包含诸多小工具)中的切边工具收费,而试用的话又包含水印,而且需手动设置距离;Adobe acrobat切割也需手动设置距离,同时有删除白边选项但实际只是隐藏;Adobe acrobat的插件Quite Imposing Plus也是需手动设置裁剪区域;跨平台的免费软件k2pdfopt可以考虑,该软件的trim模式可去除上下左右的白边但偶尔会切除一些行数的文字,另外一种方式是可以选择页面之后所有页面被重叠在一起,手动选取裁剪区域;推荐的方法是基于java的开源软件briss,类似于k2pdfopt,页面被重叠在一起,不同的是加载文件后页面被自动分组,每组自动生成一个裁剪区域,可以手动挑选页面单独成组,手动调整裁剪区域,可以预览,觉得OK后另存为新文件。 2.利用briss切边后,基本上所有页面左右空白被切掉,少量页面上下白边残留,接下来的这一步使用k2pdfopt的fitwidth模式选中接近的设备类型,设置好分辨率、DPI,输出时设置好横屏/竖屏(landscape/portrait)、是否带颜色等,软件自动调整页面适应屏幕,自动切掉白边。这一步生成的结果放在电纸书里面显示的效果比较好,字体变大了不少,虽然文件比较大(与原文件相比减少了三分之一)。 3.如果嫌文件大,可以使用多种方法压缩:大量在线压缩网站(文件过大时部分站点不支持,压缩比不高等缺点),或者利用Adobe acrobat菜单中另存为“优化的PDF”(设置好DPI等,压缩比不高)或“缩小大小的PDF”(压缩为原来的不到二分之一但压缩质量不太好),或者使用“编辑”中“动作向导”(推荐使用此方法)选择“优化扫描的文档”,压缩为不到原有的四分之一,优化过程中伴随OCR扫描等,所以原页面朝右或左时,有部分页面被自动调整为朝上的正面,只有把页面先旋转正后再优化,结果页面全为正。 最终的这些结果文件,尝试了下,对于手机而言,crop+fitwidth+up+优化(briss切边、k2pdfopt调整页面适应横屏以达到字体放大效果、acrobat旋转页面为正、acrobat压缩)比较合适,既看得清字,字也不会太小,文件也小,对电纸书而言,crop+fitwidth即可,文字能看清且全,再继续up或优化后反而看不见内容或内容显示不全。 总结:先用briss切边,再用k2pdfopt来fitwidth达到放大效果(竖屏变横屏),后面再根据需要使用Adobe acrobat旋转页面方向、优化(压缩);另外acrobat的OCR、提取页面另存为 功能不错。

Labels: ,