网站自动截图及报告文档生成工具

项目简介

网站自动截图及报告文档生成工具是一个自动化工具，用于批量获取网站截图并生成报告文档。该系统可以读取Excel文件中的网站信息（包括序号、网站名称和网站域名），自动访问这些网站并进行截图，最后将所有信息整合到Word文档中，形成一份完整的网站截图报告。

主要功能

Excel数据读取：自动读取指定Excel文件中的网站信息
网站访问与截图：自动访问网站并进行截图，支持HTTP/HTTPS协议自动切换
异常处理：对无法访问的网站生成404错误图片
并发处理：使用多线程技术提高批量处理效率
Word文档生成：将网站信息和截图整合到Word文档中
分页处理：支持大批量数据的分页文档生成

项目部署说明

环境要求

Python 3.8或更高版本
Chrome浏览器（用于网站截图）

安装步骤

克隆仓库到本地

git clone https://github.com/loveyxh/website-screenshot.git
cd website-screenshot

安装依赖包

pip install -r requirements.txt

依赖包包括：

pandas>=2.0.0：用于Excel数据处理
selenium>=4.0.0：用于网站访问和截图
python-docx>=1.0.0：用于Word文档生成
openpyxl>=3.0.0：用于Excel文件读取
webdriver-manager>=4.0.0：用于Chrome驱动管理

项目结构

├── main.py              # 主程序
├── requirements.txt     # 依赖包列表
├── list.xlsx           # 网站数据文件
├── screenshots/        # 截图保存目录
├── website_screenshot.log  # 运行日志
└── 网站截图报告(0-100).docx  # 生成的报告文档

自定义配置

如需修改程序配置，可编辑main.py文件：

修改并发线程数：调整ThreadPoolExecutor的max_workers参数
修改截图分辨率：调整set_window_size的参数
修改每页记录数：调整page_size变量

项目运行说明

准备数据

准备一个名为list.xlsx的Excel文件，放在项目根目录下
Excel文件需包含名为sheet1的工作表
工作表需包含以下列：
- 序号
- 网站名称
- 网站域名

运行程序

python main.py

运行过程

程序启动后，会自动读取list.xlsx文件中的网站信息
对每个网站进行访问和截图，截图保存在screenshots目录下
生成Word文档，每100个网站生成一个文档，文档命名格式为网站截图报告(起始序号-结束序号).docx
程序运行日志保存在website_screenshot.log文件中

注意事项

程序会自动处理网站协议（HTTP/HTTPS），无需在Excel中指定
对于无法访问的网站，会生成404错误图片
程序使用多线程处理，默认并发数为5，可在代码中调整
截图分辨率固定为800x600像素
文档中每个网站记录包含序号、网站名称、网站域名和截图

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

网站自动截图及报告文档生成工具

项目简介

主要功能

项目部署说明

环境要求

安装步骤

项目结构

自定义配置

项目运行说明

准备数据

运行程序

运行过程

注意事项

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
screenshots		screenshots
README.md		README.md
list.xlsx		list.xlsx
main.py		main.py
requirements.txt		requirements.txt
website_screenshot.log		website_screenshot.log
网站截图报告(0-100).docx		网站截图报告(0-100).docx
说明.md		说明.md

Folders and files

Latest commit

History

Repository files navigation

网站自动截图及报告文档生成工具

项目简介

主要功能

项目部署说明

环境要求

安装步骤

项目结构

自定义配置

项目运行说明

准备数据

运行程序

运行过程

注意事项

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages