|
|
哎呦喂,各位对AI技术有点好奇的、特别是关心自己家乡话能不能被AI听懂的网友,还有那些捣鼓APP开发的程序员老哥们,都来瞅瞅这个新鲜出炉的大事儿!就在这两天,印度那边不是正开着AI影响力峰会嘛,热闹得很。结果,一家专门做企业AI生意的公司,叫Cohere(读作“科希尔”),在峰会边上冷不丁放了个大招:他们发布了一个全新的、开源的、会说超过70种语言的人工智能模型家族。
这玩意儿名字起得还挺萌,叫 “Tiny Aya”,翻译过来大概是“小巧的Aya”。你听这名字就能猜出个大概了:第一,它小;第二,它属于一个叫“Aya”的大项目(Aya本身就是一个多语言AI项目);第三,它开源。没错,这个模型家族是 “开放权重” 的,就是说它的底层代码是公开的,谁都可以拿去用,拿去改,拿去研究,跟那些捂得严严实实的商业模型不太一样。
那它到底有多“Tiny”(小巧)呢?最基础的那个版本,参数是 33.5亿 个。你可能对这个数字没概念,这么说吧,现在动不动就几千亿、上万亿参数的大模型,那都是需要超级计算机才能供得起的“巨兽”。而这个33.5亿参数的Tiny Aya,它的设计目标就是能在一台普通的笔记本电脑上跑起来,而且完全不需要联网!这对开发者来说可就太方便了,意味着你做的APP,哪怕用户在山沟里没信号,也能用上AI翻译、对话这些功能。
它支持的语种多得吓人,超过70种。特别值得一提的是,它对南亚的语言支持非常上心,比如孟加拉语、印地语、旁遮普语、乌尔都语、古吉拉特语、泰米尔语、泰卢固语、马拉地语……这些语言的使用者加起来那可是好几十亿人口。光这一点,就能看出Cohere的市场嗅觉了,专门盯着那些语言多样、但AI服务还没完全覆盖的新兴市场。
光有一个基础版还不够,Cohere这次是搞了个“全家桶”。除了那个最基础的Tiny Aya模型,他们还整了几个特化版本:
TinyAya-Global:这个是专门为了更好理解用户指令而微调过的版本,适合那些需要广泛语言支持的应用程序。
TinyAya-Earth:专门为非洲语言优化的。
TinyAya-Fire:专门为南亚语言优化的。
TinyAya-Water:为亚太、西亚和欧洲语言优化的。
公司自己解释说,这么搞是为了让每个模型都能在自己专注的语言区域里,学得更地道,更懂当地的文化和语言习惯,这样搞出来的系统,用起来才会让本地人觉得更自然、更可靠。但与此同时,所有这些Tiny Aya模型都保留了广泛的多语言能力,所以你要是想拿它们当个起点,去做进一步的定制或者研究,也非常灵活。
他们是怎么练出这么个“多语言小能手”的呢?说出来可能有点让人惊讶,据Cohere说,训练这些模型,只用了一组由64块英伟达H100 GPU组成的计算集群。在当今这个“算力焦虑”的时代,用相对“ modest ”(你可以理解为“不算特别夸张”)的计算资源,搞出能支持70多种语言的模型,这个效率确实有点东西。这也正说明了他们的目标:让AI模型变得更轻量、更易得,而不是一味地追求庞大。
正因为模型小,所以它能直接在你的设备上运行,这就是所谓的 “端侧部署” 。Cohere还特意提到,他们构建的底层软件就是专门为设备端使用设计的,比大多数同类模型需要的算力都少。你想想看,在印度这种地方,网络覆盖不一定哪儿都好,但人人都智能手机。如果有个APP,不联网就能把你的泰卢固语短信翻译成印地语,或者给不识字的老人用泰米尔语读出新闻,这个应用场景可就太广了。
那咱普通网友或者开发者上哪儿去搞来玩玩呢?Cohere把模型放到了Hugging Face(一个非常流行的AI模型分享和测试平台)和自家的Cohere Platform上。开发者可以直接去Hugging Face、Kaggle或者Ollama这些地方下载,部署到自己的本地环境里。而且,公司还把训练和评估用的数据集也放在了Hugging Face上,并且说会发布一份技术报告,详细讲他们是怎么训练这些模型的。这种做法,在开源社区里是很受尊敬的,等于把自己的“烹饪配方”也公开了。
说到Cohere这家公司,可能有些网友不太熟。它的联合创始人兼CEO叫艾丹·戈麦斯(Aidan Gomez),这位老兄可是深度学习领域Transformer架构论文的署名作者之一(就是发明了现在所有大模型基本工作原理的那篇神作)。公司在去年(2025年)底的时候势头很猛,根据CNBC的报道,他们2025年结束时年度经常性收入达到了2.4亿美元,而且全年每个季度都比上个季度增长50%。戈麦斯自己也说过,公司计划“很快”上市。所以,这次发布Tiny Aya家族,不仅是技术秀肌肉,也可能是在为上市的故事增加一个重要的章节:那就是他们不仅要服务大企业,也要通过开源、轻量的模型,去拥抱更广阔的长尾市场和开发者生态。
总之,Cohere这步棋,可以理解为在巨头们疯狂卷大模型参数和云端算力的同时,另辟蹊径,卷一卷“小而美”和“接地气”。当大家都在攀爬珠穆朗玛峰(追求最大最强的模型)时,有人开始认真地给世界各地的丘陵和小路绘制详细地图(让AI理解并服务每一种语言)。在AI越来越像水电煤一样的基础设施的时代,确保每个人,无论说什么语言,在哪儿,有没有网,都能用上它,可能才是真正意义上的“普及”。这场AI竞赛,不止有云端的绚烂烟花,也开始有了田间地头的星星之火。
(新闻来源:综合CNBC与Techcrunch于印度AI峰会期间的报道)
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|