更贴近 Sea 当前前后端联调栈的推荐测试数据包。
- 保留
recommendation_test_seed_v2原样不动,v3旁路生成。 - 用户使用双标识:
seed_user_key保留seed_user_0001这类稳定内部键username改为更像真实用户的中文句柄,例如合肥阅读01
- 文章使用双标识:
seed_article_key代替旧的伪主键语义- 真正的系统文章 ID 只在导入后写入
state/article_map.jsonl
extra_info全部标准化为字符串。- 每篇文章补齐
secondary_tags,同时保留稳定的manual_type_tag一级标签。 - 为了适配当前后端审核链路,导入使用的是自动生成的
.png封面;原始.svg封面仍保留在数据包中。 - 导入器改为走本地前端 BFF,并以文章最终发布成功
status=2为完成条件。
users/articles/covers/scripts/build_dataset.pyscripts/seed_site.pyscripts/seed_site.shscripts/validate_dataset.pystate/logs/
- 用户数:500
- 文章数:5000
- 分类数:10
- 每位用户:10 篇文章
- 每位用户:10 个不同分类
python3 ./scripts/build_dataset.py
python3 ./scripts/validate_dataset.py .默认配置文件:
./scripts/seed_site.sh ./config/local.frontend.json先做小范围冒烟:
./scripts/seed_site.sh ./config/local.frontend.json --user-start 1 --user-end 3中断后恢复:
./scripts/seed_site.sh ./config/local.frontend.json --resume- 预检:
3000前端 BFF 可达- 文章列表接口可达
- 推荐服务健康检查可达
- 封面上传接口
/api/article/v1/upload可用 - 如果目标环境已非空但没有 manifest,会中止以避免重复灌数
- 用户阶段:
- 注册
- 登录
- 获取资料并记录
uid
- 文章阶段:
- 有界并发
6创建文章 - 接受
200/1003 - 缺失
article_id直接判失败
- 有界并发
- 发布阶段:
- 轮询文章详情
- 直到
status == 2
state/manifest.jsonstate/user_map.jsonlstate/article_map.jsonl
其中:
user_map.jsonl记录seed_user_key -> username -> uidarticle_map.jsonl记录seed_article_key -> system_article_id -> final_status
- 前端 BFF:
http://127.0.0.1:3000 - 推荐服务健康检查:
http://127.0.0.1:20721/health - 封面上传接口:
http://127.0.0.1:3000/api/article/v1/upload