打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式
userphoto

2023.10.24 广东

关注

pdf2docx是Python的一个库,可以很方便的将PDF文档转换为word格式,首先安装这个库。

然后在ChatGPT中输入提示词:

你是一个Python编程专家,要完成一个文档格式转换的任务,具体步骤如下:

打开F盘的Books文件夹;

读取里面的PDF文档,用pdf2docx库将其转换为word文档;

注意:每一步都要输出相关信息

使用多线程以加快转换速度;

源代码如下:

import os

from glob import glob

from pdf2docx import Converter

from concurrent.futures import ThreadPoolExecutor, as_completed

# 定义PDF转Word的函数

def pdf_to_word(pdf_file):

# 创建输出的Word文件名

docx_file = pdf_file.rsplit('.', 1)[0] + '.docx'

# 创建一个转换器对象

cv = Converter(pdf_file)

# 将PDF转换为Word

cv.convert(docx_file, start=0, end=None)

cv.close()

print(f'Successfully converted {pdf_file} to {docx_file}.')

# 获取F盘Books文件夹下的所有PDF文件

pdf_files = glob('F:/Books/*.pdf')

# 创建一个线程池

with ThreadPoolExecutor(max_workers=5) as executor:

# 使用线程池中的线程来执行转换任务

futures = {executor.submit(pdf_to_word, pdf_file): pdf_file for pdf_file in pdf_files}

# 打印转换进度

for future in as_completed(futures):

pdf_file = futures[future]

print(f'Finished processing file: {pdf_file}')

运行成功:

图片和表格都成功转换了:

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
办公自动化:几行代码将PDF文档转换为WORD文档(代码实战)!
手把手教你把 md 文件(markdown)转换为 docx 或者 pdf
只用Word,将docx和PDF文件互相转换!
word批量处理批量转换式批量转换文档格式,支持doc格式、docx格式和PDF格式。
PDF转Word完全指南:3大方法满足各种场景!
Python 抽取PDF、DOCX文档内容
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服