淘客熙熙

主题:【请教】如何改变PDF格式文件的大小 -- 宝贝小猪

共:💬23 🌺38 新:
分页树展主题 · 全看首页 上页
/ 2
下页 末页
  • 家园 【请教】如何改变PDF格式文件的大小

    小猪经常需要把更改通知之类的文件扫描成PDF文件,再用电邮发给工程公司,一个文件少说有几M大小,请问各位牛人,PDF格式的文件可以resize么?

    多谢哈。

    • 家园 如果原件清楚

      直接用black/white 格式按文字扫描。(刚看见下面贴子,如果有图,此条作废)

      或者装个ocr软件,转换成电子档,再转换成pdf。网上有 pdf creator (freeware)。安装后,自动加上一个pdf printer。生成的电子档直接用这个打印机输出pdf。

      不过,这个年头, 都还发纸件的?如果通知不是在 server (unix system) 上,拿上面的 pdf printer 输出一下。不过如果是 unix,输出pdf应该更容易了。先到 .ps, 再 ps to pdf. 或者直接 dvi 输出都可以。

    • 家园 PDF Compress (Freeware)

      Reduce the actual size of PDF files by compressing text and graphics. Compressed PDF files can be opened and viewed normally by Adobe Acrobat Reader all versions.

      Webpage: [URL=]http://www.bureausoft.com/products.html#PDF Compress (Freeware)[/URL]

      Download: http://www.bureausoft.com/pdfinfo.exe

    • 家园 支付卦资

      这是第二朵.

    • 家园 如果只是文本

      1. 扫描或者扫描后期处理的时候注意输出分辨率,对于文字,一般150~200dpi看起来就很舒服了,100dpi也凑合。

      2. 压缩色彩空间。如果文本只有黑白两色,存图片的时候就用256级灰度。这样在不压缩的文件里,每象素仅仅占用8个bit,否则的话如果用RGB模式存储就会是24bit或更多。

      如果不需要看起来很舒服,还可以在photoshop里进一步压缩色彩空间,改成4bit/pixel,然后存成tiff。tiff要选择lzw压缩。

      如果特吝啬,还可以试试2bit/pixel,这样出来的东西可以读,不过一般的来说会巨难看。

      如果文本带有有限的几种彩色,那么扫描时还是扫3通道,但在扫描完成后,在photoshop里把模式从RGB改成indexed color,这样每个象素只占8bit,然后存成gif文件,这种格式是会自动进行lzw压缩的,对于文字为主的图片来说,文件应该会相当小。记住勾掉仿色,不然出来的东西到处是麻点。

      3. 为了得到尽量小的文件,扫描参数要仔细调,扫完以后也要仔细调黑白点,使得背景是单一的纯色,而不要把纸的纹路什么的还留着。这样在压缩的时候不会为背景信息浪费空间。对于lzw压缩的tiff和gif格式,背景越干净,压缩效果越好,一张A4的纯文本,压出来只有几十K绝不稀奇。

      4. 选择合适的图片压缩算法。在压缩扫描的文字图片的时候,一般来说用lzw算法的效率会比用jpeg好,除了lzw是无损压缩算法(因此线条周围不会像压缩过度的jpeg图片那样出现明显波纹)之外,jpeg面对大部分是均匀空白的文字图片的确也不如lzw压的小。当然前提是你背景处理的要得当,如果搞得背景全是纸的花纹,会严重影响lzw的压缩效率。

      以上是扫描成图片时如何节省空间同时保证最高质量。

      5. 除了在图片格式上做手脚,也可以试试acrobat的OCR功能,这样出来的pdf的文字部分是字符而不是图片。acrobat应该可以对英文文本OCR。不过我没有试过。

      关键词(Tags): #pdf文件(当生)#pdf(当生)元宝推荐:爱莲,
      • 家园 二狗兄的解释真是太专业了,谢谢
      • 家园 煮酒说得对。能整理一下,发一主帖么?
      • 家园 二狗兄实在专业。私以为够加精级别了

        建议把您前后这几个贴的内容集中、整理一下,单开一个主题贴,这样可以让更多的人看到并受益。俺出国前好歹也算对平面设计和印刷方面略知一二(俺是公司里负责marketing communication),但好多东西当时根本闹不清,问做平面设计的或搞印刷的,他们也一概都稀里糊涂一知半解,直到看过您这一贴,才有豁然开朗的感觉。谢谢谢谢。

    • 家园 能拿到原来的文件吗?

      假如是text file, 可能只需要几十到几百K.

      如果不行,扫成150-300 dpi 的黑白gif 文件也能省地方。要是有好的OCR软件,可以先转成文本文件再PDF.

    • 家园 可以把扫描出来的图片改变size(压缩)后再转成 PDF

      只是小心,图片被压缩的狠了,字就看不清了

    • 家园 为什么要直接扫描成PDF呢?

      如果你的纸面文件基本上是线图和文字,可不可以先产生某种向量(vector)格式,然后再存成PDF呢?

      另外,还可以考虑用有损压缩格式,比如JPEG,代替PDF。

      最好的办法当然是实现无纸化,直接从数据库里产生PDF文件。

      • 家园 文字存向量图不算最经济

        用OCR软件变成字符文件才是最经济的。

        对于中文,用台湾产的尚书软件作,效果不错。

        对于英文之类的拼音文字,可用的软件就很多了,大部分效果都很好。acrobat本身似乎也可以做OCR,不过我还没试验过。

        • 家园 “工程变更通知”一般都会配图,纯文字的恐怕不多。

          另外,一定要输出到纸面上再扫描进电脑,应该是为了让当事人签名。

          当然,最经济的是OCR配合某种向量格式,再转成PDF。

          我不太明白的是,扫描仪出来的是点阵数据,为什么“宝贝小猪”的扫描仪会设置为直接生成PDF?PDF本质上是一种向量格式。

分页树展主题 · 全看首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河