现象
现象
- 触发条件:
在使用 OpenLess 進行語音輸入並選擇「台灣繁體中文(正體中文)」輸出時觸發。
- 当前实现:
不論前端 ASR 模型(如 Groq Whisper-large-v3、OpenAI whisper-1)或後端 LLM 潤色模型(如 DeepSeek、OpenAI)輸出為何,系統在最終文本落地(剪貼簿或輸入框)的最後一關,會無差別將日常飲食動詞「吃」(例如:吃飯、吃肉)強制轉換為古體字——「喫」。即使在 System Prompt 或效果範例中加入強烈否定指令,依然無法攔截此轉換。
- 证据:
口語輸入:「我想吃你冰箱的肉」
最終輸出:「我想喫你冰箱的肉」
(由此判定問題出在專案最外層的全域簡繁轉換腳本或 OpenCC 字典映射中,錯誤地將“吃”強制關聯到了“喫”)。
影响
影响
- 嚴重影響台灣繁體中文用戶的日常使用體驗。在台灣正體中文的習慣中,「喫」字僅極少數用於特定專有名詞(如:喫茶趣),日常飲食交流皆使用「吃」。無差別轉換會導致所有日常轉寫文本顯得極不自然,用戶必須手動逐字修改。
建议接受标准
建议接受标准
TODO / 不确定项
- 目前不確定此 Bug 是被硬編碼(Hardcoded)在文字輸出的 Wrapper 中,還是因為調用了未包含在地化詞彙修正的簡繁轉換庫。
感谢开发者带来这么棒的开源语音输入专案,希望能早日看到这个繁体中文体验的优化!
现象
现象
在使用 OpenLess 進行語音輸入並選擇「台灣繁體中文(正體中文)」輸出時觸發。
不論前端 ASR 模型(如 Groq Whisper-large-v3、OpenAI whisper-1)或後端 LLM 潤色模型(如 DeepSeek、OpenAI)輸出為何,系統在最終文本落地(剪貼簿或輸入框)的最後一關,會無差別將日常飲食動詞「吃」(例如:吃飯、吃肉)強制轉換為古體字——「喫」。即使在 System Prompt 或效果範例中加入強烈否定指令,依然無法攔截此轉換。
口語輸入:「我想吃你冰箱的肉」
最終輸出:「我想喫你冰箱的肉」
(由此判定問題出在專案最外層的全域簡繁轉換腳本或 OpenCC 字典映射中,錯誤地將“吃”強制關聯到了“喫”)。
影响
影响
建议接受标准
建议接受标准
s2twp.json(帶有生活用語慣用字修正),或針對此錯誤映射進行過濾。TODO / 不确定项
感谢开发者带来这么棒的开源语音输入专案,希望能早日看到这个繁体中文体验的优化!