轻量级网页爬虫和内容提取工具,支持 JS 渲染、数据导出和增量抓取。
- JavaScript 渲染(Playwright)
- CSS 选择器 / XPath 提取
- 自动去重 + 增量抓取
- 导出 CSV / JSON
- 并发控制 + 限速
- 代理支持
pip install -r requirements.txt
playwright install chromium# 抓取单页
python scraper.py --url "https://example.com" --selector "h1"
# 批量抓取 + 导出 CSV
python scraper.py --urls urls.txt --selector "article h2" --output results.csv
# 带代理 + 限速
python scraper.py --url "https://example.com" --proxy "http://127.0.0.1:1080" --delay 2需要定制爬虫方案?联系我们 价格:¥500 - ¥5000(根据复杂度)