爱科技、爱创意、爱折腾、爱极致,我们都是技术控
您需要 登录 才可以下载或查看,没有账号?立即注册
x
快科技
智谱联合华为开源新一代图像生成模型GLM-Image,基于昇腾Atlas 800T A2与昇思MindSpore完成国产芯片全流程训练,为首款国产SOTA多模态模型。其自回归+扩散解码器混合架构解决知识密集场景生成难题,在CVTG-2K与LongText-Bench夺开源第一,汉字生成表现突出;API调用0.1元/张,速度优化版将上线,已展示科普插画、电商图、漫画、封面、海报及写实摄影实测样例。
快科技1月14日消息,今日,智谱宣布,其联合华为开源新一代图像生成模型GLM-Image。
该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的SOTA多模态模型。
同时,验证了在国产全栈算力底座上训练高性能多模态生成模型的可行性。
据介绍,GLM-Image采用自主创新的自回归+扩散解码器混合架构,兼顾全局指令理解与局部细节刻画,克服了海报、PPT、科普图等知识密集型场景生成难题。
在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)榜单,GLM-Image获得开源第一,尤其擅长汉字生成任务。
官方表示,API调用模式下,生成一张图片仅需0.1元,速度优化版本即将更新。
以下为GLM-Image实测案例

GLM-Image 更擅长绘制包含复杂逻辑流程与文字说明的科普插画及原理示意图 
在生成电商图、漫画等多格图画时,GLM-Image能够保持风格和主体的一致性,并保障多处文字生成的准确率 
社交媒体图文封面 
商业海报 
写实摄影
|