Skip to content

[ui] 繁體中文(台灣正體)輸出時,「吃」字被錯誤強制轉換為古體字「喫」 #756

Description

@insta3Dmodels

现象

现象

  • 触发条件:
    在使用 OpenLess 進行語音輸入並選擇「台灣繁體中文(正體中文)」輸出時觸發。
  • 当前实现:
    不論前端 ASR 模型(如 Groq Whisper-large-v3、OpenAI whisper-1)或後端 LLM 潤色模型(如 DeepSeek、OpenAI)輸出為何,系統在最終文本落地(剪貼簿或輸入框)的最後一關,會無差別將日常飲食動詞「吃」(例如:吃飯、吃肉)強制轉換為古體字——「喫」。即使在 System Prompt 或效果範例中加入強烈否定指令,依然無法攔截此轉換。
  • 证据:
    口語輸入:「我想吃你冰箱的肉」
    最終輸出:「我想喫你冰箱的肉」
    (由此判定問題出在專案最外層的全域簡繁轉換腳本或 OpenCC 字典映射中,錯誤地將“吃”強制關聯到了“喫”)。

影响

影响

  • 嚴重影響台灣繁體中文用戶的日常使用體驗。在台灣正體中文的習慣中,「喫」字僅極少數用於特定專有名詞(如:喫茶趣),日常飲食交流皆使用「吃」。無差別轉換會導致所有日常轉寫文本顯得極不自然,用戶必須手動逐字修改。

建议接受标准

建议接受标准

  • 語音輸入日常餐飲語境時,繁體中文應正確輸出為「吃」,而非「喫」。
  • 檢查並優化專案負責最後一步簡繁轉換的後處理模組(如 OpenCC),建議將台灣繁體的對應字典調整為更符合在地化習慣的 s2twp.json(帶有生活用語慣用字修正),或針對此錯誤映射進行過濾。

TODO / 不确定项

  • 目前不確定此 Bug 是被硬編碼(Hardcoded)在文字輸出的 Wrapper 中,還是因為調用了未包含在地化詞彙修正的簡繁轉換庫。

感谢开发者带来这么棒的开源语音输入专案,希望能早日看到这个繁体中文体验的优化!

Metadata

Metadata

Assignees

No one assigned

    Labels

    bugSomething isn't working

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions