ASR Error Correction using Large Language Models

建立:2026-05-16 · 最後編輯:2026-05-20

2409.09554v2_dual.pdf 

在未見過的數據中(少用的字、特殊領域的專有名詞),辨識準確率遇到了困難。

提出了 3 種方法:

  1. 透過 N-best 進行錯字的修復
  2. Fine Tune T5 模型,以監督式的方式進行錯字處理
  3. 使用 LLM(這裡是 ChatGPT)進行修正,提供 N-best 選項,讓 LLM 進行修正
    1. 答案一定在選項中的
    2. 答案可以不在選項中