数码之家

 找回密码
 立即注册
搜索
查看: 259|回复: 0

[科技] 复旦大学团队研发“眸思”大模型及“听见世界”App

[复制链接]
发表于 2024-3-2 20:13:45 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册

x
IT之家 3 月 2 日消息,据复旦大学官方公众号,在复旦大学自然语言处理实验室 (FudanNLP) 师生的努力下,基于多模态大模型“复旦・眸思”(MouSi) 为视障者量身打造的“听见世界”App 上线。
这套系统仅需一枚摄像头、一对耳机,就能将画面转化为语言,且支持描绘场景、提示风险等功能。“听见世界”App 可为视障者日常生活需求设计三种模式。
  • 街道行走:该模式下,“眸思”能够细致扫描道路情况,提示潜在风险。
  • 自由问答:可帮助视障者走进博物馆、艺术馆、公园,捕捉四周景象每个细节,可用声音构建丰富的生活场景,官方演示图显示,该 App 还可实现转述电视画面内容等功能。
  • 寻物:该模式为视障者提供日常物件的寻觅功能,官方称其为“可靠管家”。
▲ 图源复旦大学,下同
据悉,预计今年 3 月,“听见世界”App 将完成第一轮测试,并在中国一、二线城市和地区同步开启试点,根据算力部署情况进行推广。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-15 22:16 , Processed in 0.218401 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表