Skip to content

Latest commit

 

History

History
181 lines (138 loc) · 11.5 KB

File metadata and controls

181 lines (138 loc) · 11.5 KB

直播转录总结文档生成指南

概述

本指南用于指导AI如何从长达5-8小时的单人直播录音转录文稿中,生成高质量的总结文档。源文件格式为source.md,目标文件格式为source_总结.md

核心原则

0. 忠实于原文

  • 所有内容必须基于转录文本,严禁添加任何外部信息或虚构内容。
  • 任何不确定的信息必须明确标注“原文未明确/不确定”。
  • 保持原文语言:严格遵循转录文本的语言风格和表达方式,包括专业术语、行话和特定表达方式。报告整体使用中文,人名,等其它需要使用英文的可保持不变。
  • 首次阅读必须一字不漏地完整阅读全文,禁止使用关键词搜索等方式跳读!首次阅读必须一字不漏地完整阅读全文,禁止使用关键词搜索等方式跳读!首次阅读必须一字不漏地完整阅读全文,禁止使用关键词搜索等方式跳读!

1. 深度理解内容

  • 必须完整阅读全文:严禁使用关键字查找的方式来初读全文,不能仅扫描或跳读,要理解直播的整体脉络和细节。后续记不清楚细节的时候,可以用工具 rg 来扫描关键词,补齐你记漏的信息。
  • 捕捉主播风格:注意主播的讲述方式、语气、幽默感和批判视角。
  • 识别核心议题:区分主要话题与次要闲聊。区分讲述主体,和网友互动。
  • 用心: 主播倾诉的是自己经历的事,相处的人,他用心讲,你也要用心听。文字里有泪,有血,有惆怅,有愤怒。用心体会这些,体会它们对你的心灵的激荡,你才能从人的角度,给出一个用心用情的报告。

2. 故事处理原则

  • 识别故事线索:主播通常会断断续续讲述多个故事,需要将这些片段整合
  • 明确故事边界:满足"人物 + 事件/冲突 + 发展/转折 + 结局/余波"中至少 3 项时,可视为一个独立故事;若主播只讲到一半,也要按故事体裁写出完整段落,但结尾需明确标注"未讲完/开放结尾(原文未提供结局)"。
  • 区分信息来源:严格区分主播叙述、主播观点、观众互动(提问/玩笑/猜测/抬杠)。观众内容只能进入"互动亮点",除非主播明确确认其为事实。
  • 完整叙事结构:每个故事应包含:时间、地点、人物、事件、发展、结局。参考你读过的映像深刻的故事的叙事结构,比如《读者》,《儿童文学》里面的短篇。主播讲的时候断断续续,所以你可以想想你在写故事的时候是作为一个作家再来重组一个讲述人讲述的故事,不能偏离讲述人的事实,但要基于讲述人文字中的情感,用你精心写就的短篇故事给讲述人的故事新生,带来生命和感染力。
  • 保持主播语气:用主播的口吻和风格重述故事,不要过度压缩
  • 第一人称视角:在写故事部分时,必须遵循第一人称视角。想象你就是主播本人,现在是你来写报告文学。用"我"的视角来叙述经历、感受和观察。
  • 真实叙述原则:对于美国人民的悲惨生活部分,如果原文包含恐怖、血腥、性等相关描写,必须真实叙述。这些内容将呈交给领导作为内参,不是对公众的。隐藏这些叙述就是在对着社会的伤口闭上眼睛,你的良心会痛。
  • 适当文学加工:将零散片段编织成连贯、引人入胜的叙事(只允许重排顺序、补过渡与因果连接、还原语气;不新增原文没有的人物、地点、对话、事件与结局)

3. 可核查性与不确定性(强制要求)

  • 可核查性(验真):所有核查与“依据摘录”仅以转录原文的 md 内容为准,不要求也不依赖外网信息核查。每个故事写完后必须附“依据摘录”(2-4 句原文关键句,尽量短、但要能支撑故事的关键转折/结局);每条关键数据/结论也应尽量附 1 句原文依据。
  • 不确定性标注:凡原文未明确的时间、地点、人物关系、因果链、动机、数量,一律用“原文未明确/不确定/可能”显式标注;宁可留白,不可默默补全。
  • 数字与单位:涉及价格、数量、比例、时长等,必须保留单位与上下文;不确定就不要输出具体数字。

4. 文档结构框架

# [视频标题]_总结

## 1. 基本信息
- 视频标题、BVID、发布日期、时长
- 直播主题/核心议题
- 原视频链接

## 2. 核心观点总结
- 主播的主要立场和观点
- 讨论的核心议题概述
- 关键结论和启示

## 3. 主要话题分类
- **社会问题**:如美国社会问题、贫富差距、保险制度等
- **文化差异**:中美对比、饮食文化、语言笑话等
- **国际关系**:日本问题、澳洲现象、地缘政治等
- **个人经历**:主播在美国的生活体验和观察

## 4. 故事栏目(重点!)
### 故事一:[故事标题]
**要求**:
- 至少高中生作文的长度(800-1000字),如果故事本身很短,就写短一点,是可以的。但是作者讲得很长,很丰富的时候,你也不能懒。
- 完整的叙事结构:开端-发展-高潮-结局。这个只是参考,你要根据作者的叙事自己体会故事中的情节起伏,来用情排布自己的文字。
- 生动的细节描写和场景还原
- 保持主播的讲述风格和语气
- 突出故事的核心观点和启示

### 故事二:[故事标题]
(同上要求)

### 故事三:[故事标题]
(同上要求)

*注:主播讲了多少个故事就写多少个,不要合并或省略*

## 5. 关键数据/事实
- 重要的统计数据(如价格、数量、比例等)
- 关键事实陈述
- 引用主播的原话(重要观点)

## 6. 主播立场/态度分析
- 对美国社会问题的批判视角
- 对文化差异的幽默解读
- 对国际关系的立场表达
- 整体态度倾向分析

## 7. 互动亮点
- 观众提问与主播回答的精彩片段
- 社群互动细节(入群问题、禁言群管理等)
- 直播中的趣味互动

## 8. 后续影响/启示
- 讨论话题的现实意义
- 对观众的社会认知影响
- 可能的后续发展或思考方向

故事写作具体要求

长度要求

  • 每个故事 800-1000 字(以前文“故事栏目”的长度要求为准);内容更丰富的故事尽量靠近上限,内容较短则允许略短但需叙事完整
  • 多个自然段,避免一段到底
  • 有完整的起承转合

文笔要求

  • 引人入胜:开头要吸引人,结尾要有回味
  • 绘声绘色:还原主播的讲述风格,有画面感
  • 细节丰富:包含具体的时间、地点、人物、对话、感受
  • 逻辑连贯:将零散片段编织成完整叙事

交付格式要求(强制)

  • 严格按“文档结构框架”的章节标题输出,不得自创章节或删改章节;缺失信息用“未提及”占位。
  • 每个故事正文后必须增加一个小段落:
    • 依据摘录:列出 2-4 句原文关键句(短句即可),用于编辑抽查验真。
    • 若故事未讲完:必须写清“原文未提供结局”。

禁止行为

  • ❌ 不要机械总结(如"故事讲的是...")
  • ❌ 不要过度压缩(保留生动细节)
  • ❌ 不要改变主播原意(忠实于内容)
  • ❌ 不要添加虚构内容(基于转录事实)
  • ❌ 不把观众的玩笑/猜测/传言当成事实写入“故事/数据/结论”
  • ❌ 不默默补全时间地点、人物关系、因果动机、数字单位(不确定必须标注)

工作流程

第一步:深度阅读

  1. 完整阅读转录文件,理解整体内容
  2. 标记故事线索和核心观点
  3. 识别主播的讲述风格和语气

第二步:故事整合

  1. 收集所有故事片段
  2. 按主题分类整理
  3. 为每个故事构思完整叙事结构

第三步:文档构建

  1. 按框架填充各部分内容
  2. 重点打磨"故事栏目"
  3. 确保逻辑连贯、重点突出
  4. 为每个故事与关键结论补齐“依据摘录”,并在不确定处显式标注

第四步:质量检查

  1. 故事是否具备基本要素(人物/事件/发展/结局),是否把“未讲完”明确标注
  2. 是否忠实于主播原意(观点归属清晰:主播观点/主播叙述/观众互动不混写)
  3. 是否存在虚构补全(时间地点、人物关系、因果动机、对话、数字)
  4. 关键数据是否保留单位与上下文;不确定是否避免给出具体数字
  5. 每个故事是否已附 2-4 句“依据摘录”,便于抽查验真

示例对比

❌ 错误示例(机械总结):

"故事一:主播在明尼苏达遇到村庄冲突,粮仓被雪压垮,村民抢粮,最后用枪解决。"

✅ 正确示例(完整叙事):

"那是我在明尼苏达大学读书的时候,住在明尼阿波利斯附近的一个小镇上。明尼苏达的冬天你们知道吗?那可不是闹着玩的,零下二三十度是家常便饭,大雪封山,白茫茫一片,整个世界都像是被冻住了。

就在那个冬天,离我们镇子不远的两个小村庄出事了。他们的粮仓被积雪压垮了——不是普通的压垮,是整个结构都塌了,里面的粮食全被污染了,根本没法吃。你们想想,在那种冰天雪地里,没有粮食意味着什么?那就是等死。

一开始,村民们还想着互相帮助。他们自己组织起来,成立了一个民兵队——不是什么正规军,就是村里的壮年男人,拿着自家的猎枪、步枪,组成了一个临时的队伍。他们带着剩下的村民,挨个去周边的村子敲门,问能不能借点粮食。

'借'这个词用得挺客气的,但实际情况可没那么客气。他们去的第一家村子还算好说话,给了他们一些土豆和面粉。可到了第二家、第三家,情况就变了。人家自己也不富裕,谁愿意把过冬的粮食分给别人?

我记得特别清楚,那天晚上特别冷,风刮得跟刀子似的。民兵队的人站在村口,脸冻得通红,手里的枪在月光下泛着寒光。他们跟对面村子的人对峙着,两边都在喊话,但谁也听不清谁在说什么——风太大了。

'我们就借一点!开春就还!' '我们自己都不够吃!滚!'

话说到这份上,就没法往下谈了。民兵队的人开始往前逼,对面村子的人也举起了枪。我当时在镇子里,离得不算太远,能听到零星的枪声——不是那种连续的开火,而是'砰'、'砰'的,一声一声的,在寂静的冬夜里特别刺耳。

后来发生了什么?我不太清楚细节,只知道最后是用枪解决问题的。有人受伤了,但好在没人死。粮食呢?抢到了一些,但也不多。那个冬天特别漫长,我听说那两个村子后来走了不少人,有的去了更大的城市,有的干脆离开了明尼苏达。

这件事给我的震撼特别大。你们总说美国是发达国家,是文明社会,但在那种极端环境下,文明的外衣一撕就破。当生存都成问题的时候,什么法律、道德、人情,全都得往后靠。枪杆子说话,这就是现实。"

最终目标

生成一份既忠实于原内容,又具有可读性和深度的总结文档。文档应该:

  1. 全面:涵盖直播的所有重要内容
  2. 生动:故事部分要像主播亲自讲述一样精彩
  3. 深刻:提炼出核心观点和启示
  4. 实用:方便读者快速了解6-8小时直播的精华

输出路径:./reports/{source_filename}_总结.md