本文作者是Bramble Intelligence的人工智能研究員,參與了《2025年人工智能現狀報告》(State of AI Report 2025)的編寫
直到最近,構建一個能進行逼真的電話交談的人工智能系統仍是一項艱巨的任務。開發者必須將語音識別、語言處理和語音合成等相互獨立的工具整合在一起,并通過脆弱的電話通訊軟件把它們連接起來。
如今情況已不同。隨著實時原生語音AI模型的出現——例如OpenAI去年推出的RealTime API——曾經需要多個組件才能構建的系統,如今只需數分鐘即可完成創建。
您已閱讀19%(252字),剩余81%(1072字)包含更多重要信息,訂閱以繼續探索完整內容,并享受更多專屬服務。