是否可以以某种方式自定义 QTabWidget？

Question

andrewpost

Asked:2024-12-11 01:27:34 +0000 UTC2024-12-11 01:27:34 +0000 UTC 2024-12-11 01:27:34 +0000 UTC

使用 PyMuPDF 在 Python 中将 pdf 文件逐页拆分为单独的文件

772

示例：有一个包含付款单的pdf文件（例如50页），任务是将文件分为付款单，即收到 50 个文件，每个文件都有一张支付卡。我查了很多资料都没有找到解决办法。
尝试过这个：

    import pymupdf
    
    doc1 = pymupdf.open("pp_docs.pdf")
    doc2 = pymupdf.open()
    cnt = 0
    
    for page in doc1:
         
         doc2.insert_pdf(doc1,from_page=cnt, to_page=cnt, final=0)
         
         f_name = 'pdf_'+ str(cnt)+ '.pdf'
         doc2.save(f_name)
         doc2.close
         cnt +=1
    doc1.close

结果：生成了 50 个文件，这些文件中不是每个页面，而是由于某种原因生成了一组页面：

第一个文件的第一页；
第二个与第一个和第二个；
第三与第一、第二、第三等
最后一个文件包含所有页面。

请告诉我我做错了什么以及如何将文件拆分为单独的页面，即每笔付款都在单独的文件中吗？

3 个回答

Voted

VitoR InA · Answer 1 · 2024-12-11T02:58:58Z

Best Answer

VitoR InA

2024-12-11T02:58:58Z2024-12-11T02:58:58Z

错误在于您将所有内容写入一个文件并以不同的名称保存，因为即使在使用 .close() 方法之后，该文件仍保留为包含其所有数据的变量。

import pymupdf
    
src_doc = pymupdf.open("") #Ваш PDF файл

for page in src_doc:
    dst_doc = pymupdf.open() #ОШИБКА ТУТ
    dst_doc.insert_pdf(src_doc, from_page=page.number, to_page=page.number) #Лучше использовать атрибут страницы

    file_name = f"pdf_{page.number}.pdf" #f строки удобнее
    dst_doc.save(file_name)
    dst_doc.close

src_doc.close

1

MarianD · Answer 2 · 2024-12-11T03:44:44Z

MarianD

2024-12-11T03:44:44Z2024-12-11T03:44:44Z

移动命令

doc2 = pymupdf.open()

进入循环：

for page in doc1:
     doc2 = pymupdf.open()
     doc2.insert_pdf(doc1,from_page=cnt, to_page=cnt, final=0)

解释：

问题是您在循环中重复使用同一文档（仅在开始时doc2创建为空），并逐渐向其中添加下一页和下一页。

笔记：

cnt您可以将其用作循环变量，而不是手动操作该变量，即而不是命令

for page in doc1:

使用命令

for cnt in range(doc1.page_count)

另一种方法是.select()：

import pymupdf

DOC_PATH = "pp_docs.pdf"

doc = pymupdf.open(DOC_PATH)
pages = doc.page_count

for page in range(pages):
     doc = pymupdf.open(DOC_PATH)
     doc.select([page])                # сохранит только страницу page, остальные уберет
     doc.save(f'pdf_{page+1:02d}.pdf') # pdf_01.pdf, pdf_02.pdf, ...,  pdf_50.pdf
doc.close()

1

ZxNuClear · Answer 3 · 2024-12-11T02:37:56Z

ZxNuClear

2024-12-11T02:37:56Z2024-12-11T02:37:56Z

尝试图书馆PyPDF2：

from PyPDF2 import PdfWriter, PdfReader

pdf = PdfReader(open("pp_docs.pdf", "rb"))

for i in range(len(pdf.pages)):
    output = PdfWriter()
    output.add_page(pdf.pages[i])
    with open("page-%s.pdf" % (i+1), "wb") as outputPDF:
        output.write(outputPDF)

0

使用 PyMuPDF 在 Python 中将 pdf 文件逐页拆分为单独的文件

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

使用 PyMuPDF 在 Python 中将 pdf 文件逐页拆分为单独的文件

3 个回答

相关问题