|
大家做AI应用,特别是像检索增强生成(RAG)这种需要快速从海量数据里找到相关内容的,都绕不开一个头疼事儿:机器内存(DRAM)不够塞那么多向量数据!这可太憋屈了。不过,搞存储的大佬 铠侠公司(Kioxia) 最近弄了个升级包,给他们家的开源软件 KIOXIA AiSAQ (全名是“全存储产品量化近似最近邻搜索”,简称AiSAQ就行)加了点新本事,瞄准的就是这个内存瓶颈。
事情是这么个道理:当你用固态硬盘(SSD)存一大堆向量(就是那种计算机理解的复杂数据点)来做搜索时,机器里的SSD容量要是固定了,它就面临一个两难选择。
想搜索飞快(每秒处理请求多)?那对不起,你得给每个向量预留出更多的SSD空间。结果呢?就是整个机器塞不了太多向量数据了。
想多塞点向量(处理海量信息)?那你就得抠抠索索,压缩每个向量占的地方。代价呢?搜索速度,它就得慢下来点儿。
这个“快点儿”还是“多点儿”的最优解,得看具体你在做啥任务。以前可能挺麻烦,得琢磨,甚至得换硬件?但现在 AiSAQ软件更新后提供了新开关 。这个开关让管系统的人能轻松地去调整这个平衡点,直接找到一个适合手里活儿干的那个“甜点位置” —— 该快的时候足够快,该装多的时候尽量装多,而且 完全不用动机器硬件 。这升级确实挺实用的,属于那种“开箱即用”的优化。
咱们倒回去点儿看,这 KIOXIA AiSAQ 软件是今年一月(2025年1月) 头回亮相的。它的杀手锏在于用了一种特别为SSD优化过的搜索算法(专业词儿叫“近似最近邻搜索 ANNS”)。核心好处是啥?它让搜索这事儿直接在SSD上就能干利索了,根本不需要把索引数据这坨东西挤在宝贵的内存(DRAM)里。这样就跳过了DRAM容量小的坎儿,向量数据库的容量蹭蹭往上加,想放多少基本都能安排上。
所以这次更新给AiSAQ加了新功能,不光让它继续是RAG系统搜索的好帮手,也让它能接别的向量海量搜索的需求,比如那种离线的、不联网的语义搜索活儿。这路子算是越来越宽了。
现在大伙儿都想要AI服务能轻松扩展、能力暴涨,SSD的读写又快又稳的优势确实摆在这儿。SSD完全可以当作一个更划算的替代方案,用来应对RAG系统要的大带宽和低响应时间这类需求。铠侠搞的这套AiSAQ软件,就是为了让大家能更高效地满足这些需求。说白了,它是在给“搞大规模生成式AI不想被内存卡脖子”这事儿搭桥铺路。
最后,还得提一嘴 AiSAQ是开源的 。铠侠公司把这个好东西开放出来,意思很明白:他们乐意在AI圈里出份力,使劲推动这种以SSD为核心的玩法,让大家构建那种能轻松扩展的人工智能时多个选择、走得更顺。这次升级,就是沿着这个方向实实在在地又迈进了一步。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|