|
阿里研究院近期开源的自研ZeroSearch模型引发行业震动,这个不用外接搜索引擎却能自主进化的AI展现出惊人潜力。其核心机制相当于给大模型开设了"自学训练营"——通过分阶段生成干扰文档与有效信息,让AI在模拟实战中学会精准检索。
测试数据显示,在应对时事问答等七大场景时,70亿参数的ZeroSearch模型以33.06分的成绩小胜谷歌搜索(32.47分)。更惊艳的是研发成本:传统方案使用谷歌搜索接口处理6.4万次查询需花费586.7美元,而ZeroSearch仅需4张A100显卡和70.8美元成本就能达成同样效果。
研发团队独创的"闯关式训练法"是关键突破:初期让AI处理简单检索任务,随着能力提升逐步加入复杂干扰项,最终培养出堪比专业搜索引擎的推理能力。这套系统已成功适配Qwen-2.5、LLaMA-3.2等主流大模型,目前完整代码和训练数据集已在GitHub与Hugging Face平台开放下载。(开源地址:https://github.com/Alibaba-nlp/ZeroSearch)
项目负责人透露,这套技术让中小型企业也能用极低成本搭建专业级智能搜索系统。未来计划将该框架扩展至医疗文献检索、法律文书分析等垂直领域,彻底改变传统搜索依赖云服务的模式。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|