# doc2ppt **Repository Path**: zhou-jiming/doc2ppt ## Basic Information - **Project Name**: doc2ppt - **Description**: 根据docx文档,利用api调用人工智能,提炼成演讲稿 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-10-23 - **Last Updated**: 2025-10-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 1. # Word文档转PPT智能生成工具 - 使用说明文档 ## 工具简介 Word文档转PPT智能生成工具是一个基于Python开发的自动化工具,能够将Word文档内容智能转换为PowerPoint演示文稿。该工具支持两种模式: - **AI智能提炼模式**:使用DeepSeek API对文档内容进行智能分析和提炼 - **基础提取模式**:使用内置算法提取关键内容 ## 功能特点 ### 🚀 核心功能 - **智能结构分析**:自动识别Word文档的章节结构 - **内容提炼**:将长篇文档提炼为PPT适用的要点 - **自动排版**:生成专业美观的PPT布局 - **AI增强**:利用大模型技术优化内容表达 ### 📊 输出内容 - 封面页 - 目录页 - 章节标题页 - 内容幻灯片 - 核心要点总结页 - 结束页 ## 环境要求 ### 系统要求 - Windows/MacOS/Linux - Python 3.7 或更高版本 - Microsoft PowerPoint(用于查看生成的PPT文件) ### Python依赖库 bash ``` pip install python-docx python-pptx requests ``` ## 安装步骤 ### 方法一:直接运行 1. 确保已安装Python 3.7+ 2. 安装所需依赖库 3. 下载 `apidoc2ppt.py` 文件 4. 运行程序 ### 方法二:从源代码运行 bash ``` git clone cd project-directory pip install -r requirements.txt python apidoc2ppt.py ``` ## 配置说明 ### API密钥配置(可选) 如需使用AI智能提炼功能,需要配置DeepSeek API密钥: **方式一:直接修改代码** python ``` # 在main()函数中取消注释并填入API密钥 DEEPSEEK_API_KEY = "sk-your-actual-api-key-here" ``` **方式二:环境变量** python ``` import os DEEPSEEK_API_KEY = os.getenv('DEEPSEEK_API_KEY') ``` ### 获取API密钥 1. 访问 [DeepSeek官网](https://www.deepseek.com) 2. 注册账号并获取API密钥 3. 确保账户有足够的额度 ## 使用方法 ### 基本使用流程 1. **启动程序** bash ``` python apidoc2ppt.py ``` 1. **输入文档路径** - 程序启动后会提示输入Word文档路径 - 可以直接拖拽文档到命令行窗口 - 或手动输入完整路径 2. **等待处理完成** - 程序会自动分析文档结构 - 根据配置模式处理内容 - 生成PPT文件 3. **查看结果** - 程序会自动打开生成的PPT文件 - 输出文件保存在原Word文档同目录下 ### 命令行参数(可选修改) 在代码中可调整的默认参数: python ``` # 默认文档路径(如不输入则使用) docx_path = r"e:\temp\img2ppt\doc_folder\06-第1章.docx" # 输出文件命名规则 output_ppt_path = f"{base_name}_{'AI提炼' if converter.use_api else '基础版'}.pptx" ``` ## 文档格式要求 ### 支持的文档格式 - `.docx` 格式的Word文档 - 不支持 `.doc` 旧格式 ### 文档结构建议 为了获得最佳转换效果,建议Word文档具有清晰的结构: **推荐格式:** text ``` 第1章 章节标题 1.1 小节标题 正文内容... 1.2 小节标题 正文内容... 第2章 章节标题 2.1 小节标题 正文内容... ``` **标题样式:** - 使用Word的"标题1"、"标题2"等样式 - 或包含"第X章"、"X.X"等明显标识 ## 输出效果 ### PPT结构 1. **封面页**:文档标题 + 生成模式标识 2. **目录页**:自动生成的章节目录 3. **章节页**:每章开始有概述页 4. **内容页**:每小节的核心要点 5. **总结页**:文档核心要点汇总 6. **结束页**:谢谢观看 + Q&A ### 视觉样式 - 专业商务风格 - 统一字体和颜色 - 清晰的层级结构 - 适中的文字密度 ## 模式对比 ### AI智能提炼模式 **优点:** - 内容更精炼准确 - 逻辑结构更清晰 - 表达更专业 - 自动生成概述和总结 **要求:** - 有效的DeepSeek API密钥 - 网络连接 - API调用额度 ### 基础提取模式 **优点:** - 无需API密钥 - 离线使用 - 处理速度快 **限制:** - 内容提炼相对简单 - 依赖文档原有结构 - 概述和总结较基础 ## 故障排除 ### 常见问题及解决方案 **1. 文件不存在错误** text ``` 错误: 文件 'xxx.docx' 不存在! ``` - 检查文件路径是否正确 - 确保文件扩展名为 `.docx` **2. 依赖库缺失** text ``` ❌ 缺少必要的库: ModuleNotFoundError ``` - 运行 `pip install python-docx python-pptx requests` **3. API调用失败** text ``` ❌ API密钥无效或已过期 ``` - 检查API密钥是否正确 - 确认账户余额充足 - 检查网络连接 **4. 内容识别不准确** - 确保文档使用标准标题样式 - 检查文档结构是否清晰 - 尝试使用AI模式获得更好效果 **5. 生成PPT格式问题** - 确保安装了Microsoft PowerPoint - 检查文件权限 - 尝试以管理员身份运行 ### 调试建议 1. **查看控制台输出**:程序会详细显示处理进度和错误信息 2. **检查文档结构**:使用简单的测试文档验证功能 3. **分步测试**:先使用基础模式,再尝试AI模式 4. **查看生成日志**:程序会输出分析结果和幻灯片数量 ## 高级用法 ### 自定义修改 **调整幻灯片布局**: python ``` def _create_content_slide(self, prs, section, key_points): # 修改字体大小、颜色、布局等 p.font.size = Pt(18) # 调整字体大小 p.font.color.rgb = RGBColor(0, 0, 0) # 调整字体颜色 ``` **添加公司Logo**: python ``` def _create_title_slide(self, prs, title): # 在封面页添加Logo logo_path = "company_logo.png" left = Inches(1) top = Inches(1) slide.shapes.add_picture(logo_path, left, top, width=Inches(1.5)) ``` ### 批量处理 可以修改代码实现批量文档处理: python ``` def batch_convert(docx_folder): for file in os.listdir(docx_folder): if file.endswith('.docx'): docx_path = os.path.join(docx_folder, file) converter.convert(docx_path) ``` ## 技术支持 ### 获取帮助 如遇问题,请提供以下信息: 1. 程序运行的完整错误信息 2. 使用的文档样本(如可能) 3. 操作系统和Python版本 4. 使用的模式(基础/AI) ### 版本信息 - 当前版本:v1.0 - 最后更新:2024年 - 兼容性:Python 3.7+ ## 免责声明 1. 本工具为辅助工具,生成内容需人工审核 2. API使用需遵守相关服务条款 3. 文档内容版权归属原作者 4. 不对生成内容的准确性作担保 ------ **开始使用**:运行 `python apidoc2ppt.py` 并按照提示操作! **祝您使用愉快!** 🎉