首页/滨城/滨海速递

阿里周畅：压缩微调开源“通义千问” 助力AI大模型加速落地

稿源：津滨网编辑：李若怡 2023-12-08 10:19

津滨网讯（记者单毅）12月7日，主题为“AI新生态智启新元年”的首届AI PC产业创新论坛，在北京联想集团总部成功举办。阿里巴巴-通义实验室通义千问大模型负责人周畅在主题分享中表示，通义千问通过对模型的压缩、微调及开源等诸多措施，正在加速AI大模型的落地普及。在此过程中，阿里巴巴-通义实验室也将与联想集团携手合作，在AI PC生态领域共同探索，为个人和企业提供更加精准的AI服务。

阿里巴巴-通义实验室通义千问大模型负责人周畅

据周畅介绍，自2022年以来，通义千问陆续开源了基础语言模型、图文多模态模型、音频多模态模型等系列大模型。近期，通义千问更是将Qwen-72B（720亿参数）全尺寸模型进行开源，以实际行动助力业界大模型生态发展。

周畅表示，经过压缩和微调的AI小模型适合在端侧进行部署。用户最关心的是主流7B或14B模型在端侧表现是否可以媲美云端大模型。周畅称，经过内部实测，通义千问的系列AI小模型在工具调用上的能力，与大模型差别不大。数据显示，只有1.8B的小模型大约只能达到大模型的85%左右，7B和14B小模型在本地端的表现与全尺寸72B大模型在云端表现区别很小。通义千问模型的实测表现，为AI大模型铺平了道路，将加速AI能力的普及。（图片由联想集团提供）