您的位置:

在线PDF文件的各种操作

一、在线PDF文件压缩

1、PDF文件中图像或文字过多时,文件大小会变得很大,传输、存储都会带来麻烦。在线PDF文件压缩工具可以帮助我们压缩文件大小,使其更便于传输。

2、例如我们使用PDF压缩器的API功能,实现如下:

from pdfcompressor import compress_pdf_file
compress_pdf_file('input.pdf', 'compressed_output.pdf')

3、这个API会将“input.pdf”文件压缩后,输出到“compressed_output.pdf”文件中。

二、下载学籍在线验证报告PDF文件

1、在某些情况下,我们需要向学校或教育机构提供学籍在线验证报告的PDF文件。这时,我们需要找到可靠的下载链接进行下载。

2、例如,我们可以使用以下代码从学籍在线验证网站下载PDF文件:

import requests

url = 'https://www.xuejiqianzhi.com/find'

data = {
    'name': '姓名',
    'idcard': '身份证号',
}

resp = requests.post(url, params=data)

with open('report.pdf', 'wb') as f:
    f.write(resp.content)

3、根据个人情况填写姓名和身份证号,并将网站提供的URL替换为上述代码中的URL,就可以下载学籍在线验证报告的PDF文件。

三、在线PDF文件怎么下载

1、有时候我们在网上看到一篇PDF文章或者文档,想将其下载下来保存,这时我们需要知道其下载链接。

2、这里以chrome浏览器为例,只需要在文件链接上右键,选择“复制链接地址”即可得到下载链接,然后将链接粘贴至下载工具中即可进行下载。

四、PDF文件在线压缩免费

1、有些在线PDF文件压缩工具需要收费才能使用,但是我们同样可以找到免费的在线PDF文件压缩工具。

2、例如,我们可以使用Soda PDF提供的在线PDF压缩器:

import requests

url = 'https://www.sodapdf.com/upload/'

files = {'file': open('input.pdf', 'rb')}

resp = requests.post(url, files=files)

with open('compressed_output.pdf', 'wb') as f:
    f.write(resp.content)

3、这个API会将“input.pdf”文件压缩后,输出到“compressed_output.pdf”文件中。

五、在线PDF文件转换txt格式

1、有时候我们需要将PDF文档转换成txt格式,这时我们可以使用PDFminer来实现。

2、下面是使用PDFminer将PDF转换成txt的例子:

from pdfminer.high_level import extract_text

text = extract_text("input.pdf")

with open("output.txt", "w", encoding="utf-8") as f:
    f.write(text)

3、这个API会将“input.pdf”文件转换成txt格式,并输出到“output.txt”文件中。

六、PDF文件在线转图片

1、如果我们需要将PDF文件的每一页转换成图片,就需要使用PDF转图片的工具。

2、例如,我们可以使用pdftoppm工具来完成转换:

import subprocess

subprocess.call(['pdftoppm', '-png', 'input.pdf', 'output'])

3、这个API会将“input.pdf”文件转换成PNG格式的图片,输出到名字为“output”的文件夹中。这个文件夹中包含PDF文档中所有页面的图片。

七、在线PDF文件瘦身

1、有时候我们需要将PDF文件的体积变小,以便于传输和存储。

2、PDF文件瘦身的工具有很多,例如Ghostscript,可以通过以下方式来实现:

import subprocess

subprocess.call(['gs', '-sDEVICE=pdfwrite', '-dCompatibilityLevel=1.4', '-dPDFSETTINGS=/default', '-dNOPAUSE', '-dBATCH', '-sOutputFile=output.pdf', 'input.pdf'])

3、这个API将会使用Ghostscript将“input.pdf”文件瘦身并输出到“output.pdf”文件中。

八、在线拆分PDF文件

1、有时候我们需要将一个大的PDF文件拆分成多个小的PDF文件。

2、例如,我们可以使用PyPDF2来实现:

import PyPDF2

pdf_file = open('input.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)

for i in range(pdf_reader.getNumPages()):
    pdf_writer = PyPDF2.PdfFileWriter()

    pdf_writer.addPage(pdf_reader.getPage(i))

    with open(f'output_{i+1}.pdf', 'wb') as pdf_output_file:
        pdf_writer.write(pdf_output_file)

3、这个API会将“input.pdf”文件拆分成多个名字为“output_X.pdf”的文件,其中X为拆分后的页码。

九、在线PDF文件分割器

1、有时候我们需要将PDF文件分割成多个部分,这时我们可以使用Pypdf2。

2、例如,下面的代码可以将“input.pdf”文件的前两页转换成一个单独的PDF文件:“output.pdf”:

import PyPDF2

pdf_file = open('input.pdf', 'rb')
basic_pdf_reader = PyPDF2.PdfFileReader(pdf_file)

pdf_writer = PyPDF2.PdfFileWriter()
pdf_writer.addPage(basic_pdf_reader.getPage(0))
pdf_writer.addPage(basic_pdf_reader.getPage(1))

with open('output.pdf', 'wb') as pdf_output_file:
    pdf_writer.write(pdf_output_file)

3、这个API会将“input.pdf”文件的前两页转换成一个单独的PDF文件:“output.pdf”。