TrustFinance是您可以信赖的值得信赖且准确的信息。如果您正在寻找金融商业信息,这里就是您的最佳选择。金融商业信息的一站式来源。我们的首要任务是可靠性。

TrustFinance Global Insights
Mei 07, 2026
3 min read
7

OpenAI 已向其开发者平台推出了三款新的音频模型,通过应用程序编程接口 (API) 提供。这项举措旨在赋予软件代理实时对话语音能力,超越传统的转录服务,使其能够在实时交互中进行听取、翻译和执行操作。
新模型包括 GPT-Realtime-2,它能处理复杂请求并在长时间对话中保持上下文,定价为每百万音频输入令牌 32 美元起。GPT-Realtime-Translate 支持 70 多种语言,每分钟费用为 0.034 美元。最后,GPT-Realtime-Whisper 提供实时语音转文本功能,每分钟费用为 0.017 美元。
此次发布标志着 OpenAI 进军交互式语音代理市场。包括房地产市场 Zillow、旅游机构 Priceline 和电信公司 Deutsche Telekom 在内的主要公司已在测试这项技术。这种早期采用预示着该技术可能颠覆客户服务、旅游以及其他需要即时语音交互的行业。
OpenAI 的新音频 API 代表着向更复杂的语音驱动 AI 应用迈出了重要一步。市场将关注开发者如何整合这些工具,以及它们对消费者和企业软件的性能影响。未来的发展可能侧重于扩展语言支持和降低延迟。
问: OpenAI 的新音频模型有哪些?
答: 新模型包括用于复杂对话的 GPT-Realtime-2、用于实时翻译的 GPT-Realtime-Translate,以及用于实时语音转文本的 GPT-Realtime-Whisper。
问: 哪些公司目前正在使用这些模型?
答: 早期测试者包括 Zillow、Priceline 和 Deutsche Telekom,这表明了广泛的行业兴趣。
来源: 路透社

TrustFinance Global Insights
AI-assisted editorial team by TrustFinance curating reliable financial and economic news from verified global sources.
相关文章

08 Mei 2026
特朗普缩减北京峰会CEO小组

08 Mei 2026
麦格理股价利润飙升创历史新高

08 Mei 2026
安索罗匹克在500亿美元融资中,估值剑指1万亿美元。

08 Mei 2026
索尼预计利润增长,尽管PS5销量下滑

08 Mei 2026
中国东方航空前董事长面临受贿起诉

08 Mei 2026
亚洲股市受新一轮美伊军事紧张影响下跌

08 Mei 2026
摩根士丹利布局大中华区科技龙头股

08 Mei 2026
联邦法院裁定特朗普的10%进口关税非法