ASR Error Correction using Large Language Models
在未見過的數據中(少用的字、特殊領域的專有名詞),辨識準確率遇到了困難。
提出了 3 種方法:
- 透過 N-best 進行錯字的修復
- Fine Tune T5 模型,以監督式的方式進行錯字處理
- 使用 LLM(這裡是 ChatGPT)進行修正,提供 N-best 選項,讓 LLM 進行修正
4 種 decoding 的策略:
- Unconstrained decoding 由 Error Correction 自由生成,可以不需要符合 N-best 的任何選項,可能會造成亂改、亂產生的問題。
- N-best constrained decoding,從 N-best 內選擇評分最高的。