实测三步批量合并PDF：排序防丢页

上周我在整理项目结案报告，手头有87份扫描件和电子签名的PDF文件，文件名混合了日期、编号和项目名。我用之前惯用的在线合并工具一拖——结果顺序完全打乱，一份几十页的合同被拆到不同位置，气得我连夜实测了三种本地工具。最终发现只要做好三步预处理，就能保证合并后既保持原始顺序，又不会漏掉任何一页。

第一步：统一文件名规则，按需排序

我先把所有PDF拖进一个文件夹，用批量重命名工具（比如Advanced Renamer）给每个文件加上三位数字前缀，比如001_客户合同（1）.pdf、002_客户合同（2）.pdf。这样文件管理器的排序就和实际要合并的顺序一致。实测中遇到过文件名里带汉字导致排序混乱的情况，所以建议只用纯数字+英文短描述。如果原文件页码顺序本身就是乱的，可以先用Adobe Acrobat打开单文件，在“组织页面”里手动拖动调整页码顺序再保存——这一步虽然费时，但对长文档是必备操。

第二步：选择不丢页的合并工具

我对比了四款工具：在线版Smallpdf合并后丢失了第23页；Free PDF Merger的免费版最多合10个文件；PDFtk Free命令行版速度最快但没图形界面；最终我选了PDFsam Basic（开源免费）。打开后直接把排序好的文件夹拖入，选择“合并”模式，注意勾选“保留书签”和“保持页面尺寸不变”。实测100份文件总大小2.8GB，合并耗时仅47秒，且每页内容完全一致。如果你用Python脚本，推荐PyMuPDF库，代码五秒跑完，且能通过检查元数据避免重复文件。

第三步：校验合并结果并压缩瘦身

合并后的PDF往往体积膨胀——我的2.8GB变成了3.1GB。我用PDF24的“压缩PDF”功能，选择“高质量打印”预设，压缩到1.4GB，文字依然清晰。然后随机抽检第1页、第35页和第87页，通过对比原始文件的数字签名或水印位置来确认顺序正确。另外我还写了一个小脚本，用文件名哈希比对去重，把87份文件中重复的2份历史版本自动剔除，最后输出85份的合并版。现在这个文件已经发给客户，没再出过顺序问题。

问：合并后顺序乱了，有没有快速补救办法？

答：如果已经合并但顺序错乱，可以用Adobe Acrobat的“组织页面”功能手动拖拽，或者用PDFtk的‘cat’命令按特定页码序列重新拼接。但更推荐在合并前先用文件名排序确认。

问：合并后的PDF太大，线上传输很慢怎么办？

答：我实测过三种压缩方案：在线压缩（hilive压缩后质量下降明显）、本地软件（PDF24无损压缩可选项多）、Adobe Acrobat的“优化扫描”功能。最佳实践是先合并再压缩，配合‘降低采样分辨率’到150dpi，体积能降到原大小的一半。

问：怎么判断合并过程中有没有丢失页面？

答：我用过两种验证方法：一是对比原始PDF的页数总和与合并后的总页数，二是随机抽取原始文件的中间几页，在合并文档中搜索对应文本或图片特征。如果总页数对不上，很可能是某份文件损坏或读取错误，需要单独替换。