数码之家

 找回密码
 立即注册
搜索
查看: 146|回复: 0

[产品] 微软Edge免费上线Copilot Vision功能,实际体验究竟如何?

[复制链接]
发表于 2025-3-29 13:33:44 | 显示全部楼层 |阅读模式
本帖最后由 Meise 于 2025-3-29 13:37 编辑

微软最近为Windows 11的Edge浏览器用户带来了一项新功能——面向普通用户的Copilot Vision已在美国地区开放测试。这款被官方称为“网页对话助手”的AI工具,究竟能否实现“边看网页边聊天”的效果?我们从功能上线过程到实际测试,梳理了完整的使用体验。

功能上线时间线
2024年,微软首次公布Copilot Vision开发计划,当时仅限付费订阅的Copilot Pro会员使用。前段时间,科技媒体Windows Latest发现,美国地区的免费用户已可通过Edge浏览器侧边栏激活该功能。激活方式较为简单:在浏览器右侧工具栏打开Copilot面板,点击语音键旁的眼镜图标,当镜框显示高亮状态时,AI即可分析当前网页内容。

功能测试全记录
测试人员首先在微软官方网站进行基础验证。当要求描述网页内容时,对话过程频繁出现中断——语音反馈会突然停止,约15秒后重新生成新回答。在统计页面按钮数量时,AI仅识别出显眼的“Try it”按钮,完全忽略了同一页面的视频播放控件。当尝试要求点击按钮或关闭网页时,系统明确回复:“我无法操控页面元素”。

转至新闻网站WindowsLatest.com测试时,功能表现有所提升。AI能准确概述文章主要内容,页面滚动后还能识别作者信息。但在实际购物场景测试中,打开亚马逊英国站搜索固态硬盘时,AI仅能逐条朗读屏幕显示的商品信息。当询问某款未标注写入速度的硬盘参数时,系统既不会主动检索网络信息,也拒绝执行“通过Bing搜索”的指令。

在识别推广内容环节,首屏显示的SanDisk广告能被准确捕捉,但同页的三星广告需手动滚动至可视区域才能识别。更明显的问题是,当页面滚动显示新内容后,AI无法关联之前的识别记录——看到新推广商品时会完全“忘记”已识别过的内容。

现存问题与改进方向
根据测试结果,当前版本存在三个主要限制:

视觉范围局限:仅能识别当前屏幕显示内容,无法自动浏览完整页面

对话连贯性不足:多次出现回答中断或逻辑断层

功能权限缺失:纯信息反馈模式,缺乏交互操作能力

微软此次向免费用户开放测试,显示出收集用户反馈的意图。若未来能加入页面滚动控制、增强上下文关联等功能,该工具或将成为实用助手。现阶段建议用户将其视为辅助理解网页内容的语音解说功能。









本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-12 06:57 , Processed in 0.140400 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表