你发的 PDF 里藏着什么?发送合同和标书前,一定要先清除元数据
一个真实案例:
某律所把合同草案发给对方律师。对方右键 → 属性 → 看到了文档作者名(上一位客户的姓名)、创建公司(另一个客户的名称),以及修改记录里第 5 版的批注内容。
不是黑客攻击。只是元数据没清。
PDF 元数据是什么?你的文件在悄悄泄露什么
每份 PDF 在创建时自动写入元数据,包含:
| 元数据字段 | 可能泄露的信息 |
|---|---|
| 作者 | 你的真名、同事姓名 |
| 创建者/制作工具 | 公司名称、软件版本(如 "Wang & Partners LLP") |
| 创建/修改时间 | 文档的制作时间线 |
| 修改历史 | 哪些人编辑过、什么时间改过 |
| 标题 | 原始文件名(可能是 "最终版v3_改2_真的最终.pdf") |
| 批注/注释 | 编辑过程中的内部讨论内容 |
大多数人从来没检查过这些信息,因为它不显示在文档正文里。
三个不清理元数据就会出事的场景
场景一:律所发合同草案
你拿到一份对方合同模板,修改后发给自己的客户。客户打开属性一看——作者是对方律所的名字,创建工具显示对方公司名。
客户想:这合同到底是谁写的?你们有没有认真看?
场景二:投标提交 PDF
技术标书发出去,对方在属性里看到「创建者:竞对公司名」。因为你的模板最初是从竞对那拿到的。
这个标,基本废了。
场景三:论文投稿
提交的 PDF 里修改历史显示:初稿是另一个学生写的,然后你导入了 ChatGPT 生成的文字,第三版做了大改。
审稿人看元数据比看正文还快。
用 OOCCRR 免费在线清除,两步搞定
工具地址:
👉 https://www.ooccrr.com/zh/pdf-metadata-clean/
第一步:拖入 PDF
支持任意大小、任意页数。拖入后工具自动读取当前元数据,先把所有隐藏信息列出来给你看。
看到那些你不认识的信息了吗?——那些就是要清掉的。
第二步:一键清除
点击"清除元数据",工具会在浏览器本地处理,PDF 文件不上传任何服务器。
下载干净的 PDF,此时文件属性里只剩最基本的信息,作者、创建者、修改历史等全部移除。
清除前后对比
| 元数据字段 | 清除前 | 清除后 |
|---|---|---|
| 作者 | 张三 / ABC 公司 | (空) |
| 创建者 | WPS Office / 某律所全称 | (空) |
| 创建时间 | 2024-01-15 14:32:08 | (空) |
| 修改时间 | 2024-03-22 09:15:44 | (空) |
| 修改历史 | 5 次编辑记录 | (已移除) |
| 页面内容 | (不变) | (不变) |
正文内容、排版、图片、字体完全不受影响。删的是"便签",不是"正文"。
和 PDF 加密配合使用
元数据清除解决的是"信息泄露"问题,PDF 加密解决的是"访问控制"问题。两者是互补关系:
发送前 PDF 安全检查清单:
- ✅ 清除元数据(去作者、去公司名、去修改历史)
- ✅ 清除批注和隐藏注释
- ✅ 检查是否有隐藏图层/不可见文字
- ✅ 按需设置打开密码(控制谁能看)
- ✅ 按需设置权限密码(控制能否打印/复制)
- ✅ 最后再发送
完整发送前检查流程参考:PDF 发送前隐私安全检查清单
不是只有"机密文件"才需要清
你可能会想:"我就是个普通员工,发的都是日常文档,不用清吧?"
但元数据泄露不挑文档级别:
- 发给客户的报价单 → 暴露模板来源
- 公司内部流转的流程文档 → 暴露创建者的个人软件信息
- 公开发布的 PDF 白皮书 → 暴露内部编辑者姓名
养成习惯:每份要离开你电脑的 PDF,默认清一次元数据。花 10 秒,省一堆麻烦。
常见疑问
Q:Word/PPT 转 PDF 会带元数据吗?
A:会。而且带得更多——Word 文档的元数据包括作者、公司、修改时间、总编辑时长、甚至文档摘要和分类标签。转成 PDF 后这些信息全部继承。
建议:Word 里先清一次文档属性(文件 → 信息 → 检查文档 → 检查),转 PDF 后再用本工具清一次。
Q:清除后文件会变大或变模糊吗?
A:不会。元数据是附加信息,占据的字节数通常只有几 KB,清除后文件反而略小。
Q:对方真会看元数据吗?
A:对你不重要。但可以假设:只要有一个对方看了,且发现了不该发现的信息,这个后果就够你受的。
