这是一个使用LangChain和通义千问大模型为PowerPoint演示文稿批量添加注解的工具。该工具可以分析PPT幻灯片的内容,并为每张幻灯片生成简洁、有见解的注解,添加到演讲者备注中。
- 批量处理多个PPT文件
- 提取幻灯片标题和内容
- 使用通义千问大模型生成专业的演讲注解
- 将注解添加到演讲者备注中
- 支持通义千问、OpenAI等多种大模型提供商
- Python 3.8+
- 必要的Python包:
pip install -r requirements.txt
在项目根目录创建一个.env文件,包含以下内容:
# 通义千问API设置(默认使用)
DASHSCOPE_API_KEY=your_dashscope_api_key
# 或者使用OpenAI(可选)
# OPENAI_API_KEY=your_openai_api_key
# 或者使用Azure OpenAI(可选)
# AZURE_OPENAI_ENDPOINT=your_azure_endpoint
# AZURE_OPENAI_API_KEY=your_azure_api_key
# AZURE_OPENAI_DEPLOYMENT=your_azure_deployment
-
处理单个PPT文件:
python ppt_annotator.py --input path/to/your/presentation.pptx --output path/to/output/presentation.pptx -
批量处理目录中的所有PPT文件:
python ppt_annotator.py --input path/to/input/directory --output path/to/output/directory -
指定使用的模型(默认为qwen-plus):
python ppt_annotator.py --input path/to/input --output path/to/output --model qwen-turbo
通义千问支持多种模型规格,包括:
- qwen-max(最高性能,适合高质量注解需求)
- qwen-plus(默认,性能与速度的平衡)
- qwen-turbo(标准性能,速度更快)
- qwen-lite(轻量级模型,适合简单任务)
您可以根据需要的性能和成本选择合适的模型规格。
如果您想使用OpenAI或Azure OpenAI,请参考示例文件,您可以通过创建自定义的注解器类来使用其他LLM提供商。
from ppt_annotator import PPTAnnotator
# 创建注解器
annotator = PPTAnnotator(model_name="qwen-plus")
# 处理单个文件
annotator.add_annotations_to_ppt("presentation.pptx", "presentation_annotated.pptx")
# 或批量处理目录
annotator.batch_process("input_directory", "output_directory")要使用通义千问模型,您需要:
- 访问阿里云灵积平台
- 注册账号并创建API密钥
- 将API密钥添加到
.env文件中
- 处理大型PPT文件可能需要较长时间
- API调用会产生费用,请注意控制使用量
- 对于内容复杂的幻灯片,生成的注解质量可能会有所不同
- 模型名称和参数可能随时更新,请参考灵积平台最新文档
MIT