面向系统综述、Meta 分析和证据整合项目的本地优先工作台。它把文献导入、保守去重、规则筛选、人工复核、质量评价、PRISMA 2020 导出和审计包放在同一个浏览器流程里。
English | 简体中文
系统综述的难点通常不在画一张 PRISMA 图,而在前面的每一步都要说得清楚:哪些文献进来了,哪些被去重,哪些被规则筛掉,全文阶段为什么排除,最后的数字能不能复核。这个项目围绕这些真实问题设计,默认在浏览器本地运行,适合处理还不方便上传到云端的研究资料。
| 研究工作中的问题 | 这个工作台的处理方式 |
|---|---|
| 中文数据库、PubMed、Web of Science 等来源格式混杂 | 支持 CSV / TSV / RIS / ENW / BibTeX / RDF / TXT / NBIB,可混合导入 |
| 自动去重容易误删 | 分成硬重复和疑似重复,硬重复才自动移除,疑似重复交给人工复核 |
| 大文件导入时页面像是卡住 | 常用格式使用 Worker 增量解析,并记录导入阶段、字节进度和记录数 |
| PRISMA 图里的数字难以追溯 | V2.2 增加 AuditEvent 和 ScreeningDecision,计数可从审计数据重算 |
| 全文排除理由分散在表格或备注里 | 内置标准 exclusion reason taxonomy,并导出排除理由汇总 |
| 质量评价经常脱离筛选流程 | 纳入研究可以进入质量评价队列,保留研究设计和证据等级基线 |
| 后续要接 AI 辅助,但又担心不可解释 | AI 默认关闭;后续 AI 建议必须进入人工确认和审计日志 |
| 用户 | 适合的使用场景 |
|---|---|
| 医学、护理、公卫、管理学研究生 | 完成系统综述或 Meta 分析的文献筛选和 PRISMA 输出 |
| 医院、科研团队和课题组 | 在本地整理多来源数据库导出,保留筛选过程证据 |
| 循证医学和卫生政策研究者 | 需要保守去重、双人复核、质量评价和审计记录的项目 |
| 中文数据库使用者 | 处理 CNKI / 万方 / 维普 / PubMed / RIS / RDF 等真实导出问题 |
| 方法学或软件论文准备者 | 需要可复现测试、benchmark 和 audit-ready 输出的开源工具链 |
flowchart LR
A["导入文献"] --> B["保守去重"]
B --> C["配置筛选规则"]
C --> D["标题/摘要筛选"]
D --> E["全文复核"]
E --> F["质量评价"]
F --> G["PRISMA 与审计包导出"]
| 阶段 | 关键产物 |
|---|---|
| 导入 | 标准化文献记录、来源文件信息、导入事件 |
| 去重 | 硬重复移除列表、疑似重复候选列表、去重证据 |
| 规则筛选 | 标题/摘要阶段的纳入、排除和不确定记录 |
| 人工复核 | 全文阶段最终判断、排除理由、复核备注 |
| 质量评价 | 研究设计建议、工具族建议、证据等级基线 |
| 导出 | PRISMA SVG、结果表、筛选报告、V2.2 审计包 |
| 版本线 | 路径 | 状态 |
|---|---|---|
| V2.2 audit-ready | literature-screening-v2.2/ |
当前开发主线,已加入审计模型、工作流事件和审计包导出 |
| V2.1 stable | literature-screening-v2.0/ |
GitHub Pages 当前稳定路径,保留 6 步工作流和质量评价入口 |
| v1.7.x | 根目录旧入口 | 历史维护版本,保留早期 PRISMA 工具能力 |
V2.2 的重点是让筛选过程形成可复核的数据链。审计事件类型与内部设计文档 AUDIT_LEDGER_DESIGN.md 对齐,导出采用稳定的 snake_case 字段命名,同时兼容旧版本存储的数据格式。新增导出包括:
| 文件 | 用途 |
|---|---|
project_manifest.json |
项目基本信息、PRISMA 版本、AI 模式、设置 |
events.jsonl |
导入、去重、筛选、复核、质量评价和导出的事件日志 |
screening_decisions.csv |
可持久化的筛选决策表 |
exclusion_reasons.csv |
排除理由 taxonomy 和计数 |
prisma_counts.json |
从决策和事件重算的 PRISMA 计数 |
audit_summary.md |
可读的审计摘要和注意事项 |
| 能力 | 当前状态 |
|---|---|
| 多格式文献导入 | 支持 CSV / TSV / RIS / ENW / BibTeX / RDF / TXT / NBIB |
| 常用格式增量解析 | CSV / TSV / RIS / NBIB / ENW 走 Worker 分块解析 |
| 保守去重 | 硬重复自动移除,疑似重复进入人工复核 |
| 规则筛选 | 支持语言、年份、关键词、标题、作者、期刊等条件 |
| 全文复核 | 支持快捷键、排除理由、备注和单篇翻译入口 |
| 双人复核 | 支持主审 / 副审模式,后续会强化冲突解决闭环 |
| 质量评价 | 已有质量评价队列、研究设计建议和证据等级基线 |
| PRISMA 2020 导出 | 支持多主题 SVG、纳入/排除表和筛选报告 |
| 审计导出 | V2.2 已支持 manifest、event log、decision ledger、counts 和 summary |
| 操作 | 数据量 | 结果 | 说明 |
|---|---|---|---|
| IndexedDB 写入 | 30,000 条 | 约 3-5s | 500 条一批写入 |
| 分页查询 | 100 条 | 约 213ms | 使用索引查询 |
| 虚拟列表渲染 | 30,000 条 | 约 16ms/帧 | 只渲染可见区域 |
| 自动删除精确率 | benchmark | 1.000 |
保守策略下避免误删 |
| 综合 Candidate F1 | benchmark | 0.957 |
疑似重复候选输出更稳定 |
基准数据来自 docs/benchmarks/dedup/post-implementation-benchmark-report.md。不同设备上的导入速度会有差异,README 中只保留已经有仓库证据支撑的数字。
workspace.html -> 工作台页面与步骤结构
app.js -> 主流程、规则筛选、复核、导出和状态管理
audit-engine.js -> V2.2 审计模型、决策序列化和审计包构建
db-worker.js -> IndexedDB 数据层
parser-worker.js -> 多格式解析和后台消息编排
streaming-parser.js -> 常用格式增量解析状态机
quality-engine.js -> 研究设计、工具族和证据等级基线
import-job-runtime.js -> 导入任务阶段、进度和项目状态
dedup-engine.js -> 保守去重引擎
virtual-list.js -> 大规模列表渲染
当前回归入口:
node tests\run-all-regressions.js当前覆盖范围包括:
- audit model、workflow hooks、audit package export
- dedup engine、candidate duplicate export、benchmark smoke/regression
- import job state、parser chunk boundaries、import hardening
- quality engine、study-design classifier
| 阶段 | 目标 |
|---|---|
| V2.2 | 审计基础层、事件日志、可重算 PRISMA counts、审计包导出 |
| V2.3 | PRISMA-trAIce 数据模型、AI usage registry、AI suggestion log、透明报告 |
| V2.4 | 质量评价模板、evidence table、GRADE summary |
| V2.5 | 双人复核隔离、冲突队列、resolver workflow、agreement metrics |
| V2.6 | Conservative AI screening、ranking、prompt registry、provider abstraction |
| V3.0 | landing page、demo dataset、benchmark、paper skeleton、发布材料 |
V2.2 audit-ready(当前开发主线,2026-04)
- 新增
literature-screening-v2.2/独立工作区 - 新增
audit-engine.js - 新增
ProjectManifest、AuditEvent、ScreeningDecision - 导入、去重、规则筛选、全文复核、质量评价和导出节点写入审计事件
- 审计事件类型规范化:自动映射旧名称到
AUDIT_LEDGER_DESIGN.md设计文档标准名称,保证旧数据兼容 - 审计导出采用稳定的
snake_case字段命名(project_id、screening_stage、human_decision等) - 新增审计包导出:manifest、events、decisions、exclusion reasons、counts、summary
- AI 模式默认保持
off
V2.1 stable(当前 GitHub Pages 稳定路径,2026-04)
- 工作流升级为 6 步,新增质量评价 / 证据等级步骤
- 常用格式
CSV / TSV / RIS / NBIB / ENW改为 Worker 增量解析 - 新增
quality-engine.js、import-job-runtime.js、streaming-parser.js - 导入任务状态支持项目级持久化与阶段化显示
- 保留
literature-screening-v2.0/访问路径以兼容既有链接
V2.0(上一代主版本,2026-03)
- 新增独立首页 / 登录页 / 工作台结构
- 新增独立
dedup-engine.js去重引擎 - 去重改为“硬重复自动移除 + 疑似重复人工复核”
- 修复 CSV / TSV 跨行摘要解析
- 全文复核弹窗新增单篇翻译入口
- 修复上传展示、页面滚动、步骤衔接和双人复核共享状态问题
v1.7.x(稳定维护版,2026-03)
- 补全 PubMed
.nbib导入支持 - 修复单人 / 双人模式 session 接线问题
- 修复去重后无法继续进入后续步骤的问题
欢迎提交 Issue 和 Pull Request。
git checkout -b feature/your-feature
git commit -m "feat: 描述你的改动"
git push origin feature/your-feature如果这个工具对你的研究有帮助,欢迎点一个 Star。