数码之家

 找回密码
 立即注册
搜索
查看: 81|回复: 0

[科技] 谷歌 DeepMind 最强手语翻译模型:SignGemma 登场

[复制链接]
发表于 5 天前 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册

x
谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。
IT之家注:SignGemma 模型支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,开源属性意味着开发者可以自由使用并改进它。
DeepMind 希望通过这一技术,打破手语使用者在沟通上的障碍,让他们在工作、学习和社交中更顺畅地参与。
DeepMind 今年还推出 Gemma 3n 模型,支持从音频、图像、视频及文本输入生成智能文本,助力开发者打造实时互动应用。
此外,谷歌还与佐治亚理工学院及 Wild Dolphin Project 合作,推出 DolphinGemma 模型,分析并生成海豚声音,基于巴哈马大西洋斑点海豚的长期研究数据构建。
同时,MedGemma 模型作为 Gemma 3 家族新成员,聚焦医疗 AI,支持临床推理和医学影像分析,加速医疗与人工智能的融合创新。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-6-5 21:11 , Processed in 0.218401 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表