数码之家

标题: 阶跃星辰发布端到端语音大模型 Step-Audio 2 mini [打印本页]

作者: 数码芝华士    时间: 6 天前
标题: 阶跃星辰发布端到端语音大模型 Step-Audio 2 mini
阶跃星辰今日发布开源端到端语音大模型 Step-Audio 2 mini,该模型在多个国际基准测试集上取得 SOTA 成绩。Step-Audio 2 mini 现已上线阶跃星辰开放平台。
IT之家从官方介绍获悉,它将语音理解、音频推理与生成统一建模,并率先支持语音原生的 Tool Calling 能力,可实现联网搜索等操作。
Step-Audio 2 mini 在多个关键基准测试中取得 SOTA 成绩,在音频理解、语音识别、翻译和对话场景中表现突出,综合性能超越 Qwen-Omni 、Kimi-Audio 在内的所有开源端到端语音模型,并在大部分任务上超越 GPT-4o Audio。
过往的 AI 语音常被吐槽智商、情商双低。一是“没知识”,缺乏文本大模型一样的知识储备和推理能力;二是“冷冰冰”,听不懂潜台词,语气、情绪、笑声这些“弦外之音”。Step-Audio 2 mini 通过创新架构设计,有效解决了此前语音模型存在的问题。
▲ Step-Audio 2 mini 模型架构图
GitHub:https://github.com/stepfun-ai/Step-Audio2
Hugging Face:https://huggingface.co/stepfun-ai/Step-Audio-2-mini
ModelScope:https://www.modelscope.cn/models/stepfun-ai/Step-Audio-2-mini


作者: jtwbs    时间: 5 天前
这些AI公司名字取得都很有抖音那味




欢迎光临 数码之家 (https://www.mydigit.cn/) Powered by Discuz! X3.4