阿里周畅:压缩微调开源“通义千问” 助力AI大模型加速落地

稿源:津滨网   编辑:李若怡   2023-12-08 10:19

津滨网讯(记者 单毅)12月7日,主题为“AI新生态 智启新元年”的首届AI PC产业创新论坛,在北京联想集团总部成功举办。阿里巴巴-通义实验室通义千问大模型负责人周畅在主题分享中表示,通义千问通过对模型的压缩、微调及开源等诸多措施,正在加速AI大模型的落地普及。在此过程中,阿里巴巴-通义实验室也将与联想集团携手合作,在AI PC生态领域共同探索,为个人和企业提供更加精准的AI服务。

7549a563120a4447a1829588cfa752bd_s

阿里巴巴-通义实验室通义千问大模型负责人周畅

据周畅介绍,自2022年以来,通义千问陆续开源了基础语言模型、图文多模态模型、音频多模态模型等系列大模型。近期,通义千问更是将Qwen-72B(720亿参数)全尺寸模型进行开源,以实际行动助力业界大模型生态发展。

周畅表示,经过压缩和微调的AI小模型适合在端侧进行部署。用户最关心的是主流7B或14B模型在端侧表现是否可以媲美云端大模型。周畅称,经过内部实测,通义千问的系列AI小模型在工具调用上的能力,与大模型差别不大。数据显示,只有1.8B的小模型大约只能达到大模型的85%左右,7B和14B小模型在本地端的表现与全尺寸72B大模型在云端表现区别很小。通义千问模型的实测表现,为AI大模型铺平了道路,将加速AI能力的普及。(图片由联想集团提供)

津滨网版权所有,未经书面授权禁止使用 服务邮箱:jinbinwang2015@163.com 举报电话:25204288
互联网新闻信息服务许可证:12120170004 备案序号:津ICP备2021001896号-1津公网安备 12010702000020号

天津互联网违法和不良信息举报中心 举报入口