|
TOP2 1 月 30 日消息:在人工智能飞速发展的当下,谷歌正为其 Gemini 人工智能助手赋予全新视角,将目光聚焦于智能手机屏幕呈现的内容。据 9to5Google 率先发现,谷歌为 Pixel 9 系列设备推出一项突破性功能,借助 Gemini Live,用户能就屏幕上的图像、文件以及 YouTube 视频展开实时对话。想象一下,当你正在研究一份烹饪教程,突然想了解其中某个步骤的更多细节,或是看到一个不太理解的网络梗图,此时,这项功能就能派上大用场。
此前,Gemini Live 的功能与普通的人工智能语音助手并无太大差异,主要依赖类似 ChatGPT 的对话模型。但如今,它已实现华丽转身,能够直接读取你屏幕上的特定内容,并将其融入对话讨论中。Pixel 9 用户只需启动浮动的 Gemini 覆盖层,就能轻松使用这一功能。当你打开 YouTube 应用,会出现 “关于此视频实时畅聊” 的提示;在谷歌文件应用中查看文件时,会有 “关于此 PDF 实时畅聊” 的选项;而面对屏幕上的图片,“关于此图实时畅聊” 的提示则会适时出现。这意味着,你无需向 Gemini 详细解释屏幕内容,它便能直接获取相关信息,这可比从相册手动上传图片便捷多了。
一旦激活该功能,Gemini Live 会立即展示你可能想要讨论的屏幕内容预览。比如,基于 YouTube 上的旅游视频,它能为你提供旅行目的地建议;对于一份合同 PDF 文件,它可以进行内容总结;要是你在手机上欣赏文艺复兴时期的艺术作品,它还能为你解读其中的寓意。不过,如果你觉得它的实时监测有些干扰,也可以选择关闭自动查看功能。没有 Pixel 9 手机的用户也不必失落,谷歌表示,很快就会为三星 Galaxy S24 和 S25 智能手机推出这一功能,随后其他安卓设备也将陆续支持。
这项功能与谷歌的 Gemini 战略高度契合。不难发现,谷歌一直致力于将 Gemini 融入人们生活的核心,尤其是在移动设备领域,这从它持续与安卓系统的深度整合中便可见一斑。而且,这绝非 Gemini Live 升级的终点。谷歌正在紧锣密鼓地推进 Project Astra 项目,这是一个仍在不断完善的工具包,未来用户有望在与 Gemini Live 对话时实现屏幕共享和实时视频流功能。
谷歌正全力投入实时、情境化的智能辅助服务。Gemini Live 不再局限于基于抽象问题生成回复,而是试图融入每一个当下,针对你屏幕上的内容给出实用见解。为了在与苹果的 Apple Intelligence 以及 OpenAI 和微软的竞争中抢占先机,谷歌期望 Gemini 能无处不在,成为人们生活中不可或缺的智能伙伴。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|