ASR Error Correction using Large Language Models

建立:2026-05-16 · 最後編輯:2026-05-21

2409.09554v2_dual.pdf 

在未見過的數據中(少用的字、特殊領域的專有名詞),辨識準確率遇到了困難。

提出了 3 種方法:

  1. 透過 N-best 進行錯字的修復
  2. Fine Tune T5 模型,以監督式的方式進行錯字處理
  3. 使用 LLM(這裡是 ChatGPT)進行修正,提供 N-best 選項,讓 LLM 進行修正

 

4 種 decoding 的策略:

  1. Unconstrained decoding 由 Error Correction 自由生成,可以不需要符合 N-best 的任何選項,可能會造成亂改、亂產生的問題。
  2. N-best constrained decoding,從 N-best 內選擇評分最高的。
  3.