阶跃星辰旗下开源语音模型Step-Audio-R1.1在全球权威评测中登顶

网站小编 2
Step-Audio-R1.1作为阶跃星辰旗下的开源语音模型,在全球权威评测中成功登顶,这款语音模型以其出色的性能和稳定性赢得了专家的高度评价,展示了其在自然语言处理方面的强大实力。,Step-Audio-R1.1采用了先进的机器学习算法和技术,能够准确地理解和生成人类的语音命令和对话,它的声音模仿度极高,几乎可以与真人语音相媲美,极大地提高了用户的使用体验。,Step-Audio-R1.1还支持多种应用场景,如智能家居、智能客服等,为用户提供更加便捷的服务,它的开放源代码特性也为开发者提供了广阔的创新空间,使其在未来的发展中具有巨大的潜力。,Step-Audio-R1.1凭借其出色的表现和广泛的应用场景,成为了当前全球最优秀的开源语音模型之一,它不仅提升了用户的生活质量,也为人工智能技术的发展做出了重要贡献。

IT之家 1 月 15 日消息,据阶跃星辰官方微信公众号消息,阶跃星辰开源模型 Step-Audio-R1.1,拿下全球第一。

阶跃星辰旗下开源语音模型Step-Audio-R1.1在全球权威评测中登顶

阶跃星辰称,全球知名权威大模型评测榜单 Artificial Analysis Speech Reasoning 更新,阶跃星辰原生语音推理模型 Step-Audio-R1.1 登顶榜首。该榜单是目前业界评估“原生语音模型”(Native Audio Models)最权威的第三方基准之一。核心考量模型直接处理音频并进行复杂逻辑推理的能力,主要考察维度包括准确率、首包延迟等。

阶跃星辰表示,和大语言模型同理,语音模型同样需要具备强大推理能力,才能提供更高阶智能、更自然交互。Step-Audio-R1.1 以 96.4% 准确率,超越 Grok、Gemini、GPT-Realtime 等主流一线模型,刷新历史最好成绩。在性能与速度的综合权衡上,Step-Audio-R1.1 全面碾压同类语音模型。

阶跃星辰旗下开源语音模型Step-Audio-R1.1在全球权威评测中登顶

据IT之家了解,Step-Audio-R1 是由阶跃星辰发布的全球首个开源原生语音推理模型。它可以在不增加额外时延的情况下,端到端理解语音内容,“像人类一样听到对话即可思考”。

核心能力包括:

  • 深度语音推理
  • 实时响应能力
  • 音频领域的可扩展 CoT
  • Step-Audio-R1.1 是最新升级版本,兼顾更强实时对话和复杂语音推理能力。完整的实时语音 API 将在 2 月上线,目前开放的 chat 模式已搭载 R1.1 核心,支持边想边说的流式推理。

标签: 开源 星辰 语音

抱歉,评论功能暂时关闭!