Skip to content

kaising-openclaw1/webscraper-pro

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 

Repository files navigation

WebScraper Pro

轻量级网页爬虫和内容提取工具,支持 JS 渲染、数据导出和增量抓取。

特性

  • JavaScript 渲染(Playwright)
  • CSS 选择器 / XPath 提取
  • 自动去重 + 增量抓取
  • 导出 CSV / JSON
  • 并发控制 + 限速
  • 代理支持

安装

pip install -r requirements.txt
playwright install chromium

快速使用

# 抓取单页
python scraper.py --url "https://example.com" --selector "h1"

# 批量抓取 + 导出 CSV
python scraper.py --urls urls.txt --selector "article h2" --output results.csv

# 带代理 + 限速
python scraper.py --url "https://example.com" --proxy "http://127.0.0.1:1080" --delay 2

定制开发

需要定制爬虫方案?联系我们 价格:¥500 - ¥5000(根据复杂度)

About

专业级 Web 爬虫框架 - 反爬虫+代理池+分布式

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages