数码之家

 找回密码
 立即注册
搜索
查看: 1398|回复: 1

[业界] Deepseek V3 AI大语言模型免费上线,聊天机器人更智能更安全

[复制链接]
发表于 2024-12-28 14:57:59 | 显示全部楼层 |阅读模式
本帖最后由 土耳鸡烤鸡 于 2024-12-28 15:15 编辑

12月28日,有媒体报道称,来自中国的科技领先 AI 公司 Deepseek 近期推出了新版 Deepseek V3,这是在世界排名前十的 Deepseek V2大型语言模型(LLM)基础上进行的一次全面升级。通过优化训练过程,Deepseek V3不仅性能更为强大,而且成本显著低于大多数竞争对手的产品。

该公司最新推出的人工智能大型语言模型(LLM)——Deepseek V3及其配套的聊天机器人现已免费向公众开放使用。

当前市场上的聊天机器人大多基于大型语言模型(LLM),这些模型通常需要数百万份文档的训练,以便理解和关联词汇与主题。模型的参数越多,其在回应用户提示时的表现就越出色。然而,这些拥有数十亿参数的模型需要巨大的计算能力和能源支持。因此,精细调整训练过程成为降低开发成本和缩短训练时间的关键因素。

为了实现这些目标,Deepseek 引入了一种创新的负载均衡策略,结合了低精度 8 位浮点 (FP8) 计算、其独有的减少内存使用量的方法(多头潜在注意力或 MLA),以及在其技术论文中详细阐述的其他先进技术。

Deepseek V3 的训练过程经过了精心优化,确保总成本控制在 600 万美元以内,相比之下,OpenAI 的 GPT-4 训练成本高达 7800 万美元,而据估计,GPT-5 每次训练的成本将超过 5 亿美元。更低的训练成本和更快的迭代速度显著减轻了 Deepseek 商业用户的经济压力。此外,对于注重环保的用户而言,Deepseek V3 所需的能耗更低,碳排放量也更少,这也是一项值得庆贺的进步。

在此之前,Deepseek V2 已经跻身全球十大最强 AI 语言模型之列。公司进行的初步聊天机器人基准测试显示,在与 Anthropic 的Claude 3.5 Sonnet 和 OpenAI 的GPT-4等顶级模型进行的21项测试中,Deepseek V2 赢得了12项。

现在,用户可以免费体验Deepseek V3聊天机器人,它能够协助撰写论文、提供解答并简化工作流程。企业还可以借助V3平台的API,构建符合自身需求的应用程序。对于注重隐私和数据安全的用户而言,重要的是要知道,所有聊天数据均存储在中国境内的服务器上,相比当前美国的一些科技巨头,如Facebook曝出的数据共享问题,这种做法显然更为安全可靠。









本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
发表于 2024-12-28 16:02:45 | 显示全部楼层
ai应用还是太少。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-8 12:24 , Processed in 0.421201 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表