ASR Error Correction using Large Language Models
在未見過的數據中(少用的字、特殊領域的專有名詞),辨識準確率遇到了困難。
提出了 3 種方法:
- 透過 N-best 進行錯字的修復
- Fine Tune T5 模型,以監督式的方式進行錯字處理
- 使用 LLM(這裡是 ChatGPT)進行修正,提供 N-best 選項,讓 LLM 進行修正
- 答案一定在選項中的
- 答案可以不在選項中
在未見過的數據中(少用的字、特殊領域的專有名詞),辨識準確率遇到了困難。
提出了 3 種方法: