国盛通信 | 通义千问主力模型降价，助力AI应用快速推开

吉时通信｜2024-05-23 10:59

大模型开启推理端降价潮

行业点评

事件：5月21日，阿里云宣布下调通义千问商业化模型和开源模型面向开发者的API调用价格，其中，通义千问GPT-4级主力模型Qwen-Long输入价格从0.02元/千tokens降至0.5元/百万tokens，直降97%。

此前，5月9日，阿里通义发布1100亿参数开源模型Qwen1.5-110B，根据阿里云，该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型；在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上，Qwen1.5-110B冲上榜首。

“降价+开源”，通义千问组合拳“拳拳到肉”。“降价+开源”已经逐渐成为全球大模型厂商的共识，这有助于解决AI应用开发者“大模型API价格太贵，开源模型质量不够高”两大痛点，驱动AI应用全面开花。

大模型开启推理端降价潮。通义千问并非首个对开发者降价的大模型，5月以来，多个大模型推出低价产品或降价：1）5月6日，幻方量化宣布旗下深度求索（DeepSeek）正式开源第二代MoE模型DeepSeek-V2，API定价为：输入1元/百万tokens、输出2元/百万tokens，价格为GPT-4-Turbo的近百分之一；2）5月11日，智谱宣布其个人版GLM-3Turbo模型产品调用价格从5元/百万tokens降低至1元/百万tokens；3） 5月13日，OpenAI推出GPT4o，它在英语文本和代码上的 GPT-4 Turbo 性能相当，向全部用户免费，API调用速度比GPT-4快两倍，但价格减半；4）5月15日，豆包主力模型的推理输入定价只有0.0008元/千Tokens；5）5月21日，百度智能云宣布其文心大模型的两大主力模型ERNIE Speed和ERNIE Lite全面免费；6）5月22日，科大讯飞宣布讯飞星火Lite API永久免费开放。我们认为，大模型API纷纷降价，可能源于大模型推理技术的进步、推理成本的下降，客观上给了开发者更多选择，有助于开发者增加对AI大模型的开发。

推出多尺寸与多模态模型，阿里通义助力多场景应用开发。5月9日，阿里通义推出参数规模横跨5亿到1100亿的八款大语言模型，小尺寸模型如0.5B、1.8B、4B、7B、14B，可在手机、PC等端侧设备部署；大尺寸模型如72B、110B能支持企业级和科研级的应用；中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外，通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。我们认为，大模型在端侧的应用也不容忽视。

建议关注：算力板块：1）光通信：中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技；2）算力调优/调度/租赁：恒为科技、中科曙光、中国移动、中国联通、中国电信；3）算力设备：中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪；4）液冷：英维克；5）边缘算力承载平台：美格智能、广和通、移远通信。

数据要素：1）运营商：中国电信、中国移动、中国联通；2）数据可视化：浩瀚深度、恒为科技、中新赛克。

风险提示

大模型商业化进度不及预期，大模型技术发展不及预期。

本文节选自国盛证券研究所已于2024年5月23日发布的行业点评《国盛通信｜通义千问主力模型降价，助力AI应用快速推开》，具体内容请详见相关报告。

宋嘉吉 S0680519010002 songjiaji@gszq.com

孙爽 S0680521050001 sunshuang@gszq.com

东港股份	嘉楠科技	公链2020H1	漫画区块链
比特币UTXO	比特币挖矿初探	比特币挖矿产业链	比特币与黄金相关性
DCEP专利分析	DCEP双离线支付	DCEP标的	Libra
区块链+电子发票	区块链+溯源	区块链+供应链金融	区块链标准委标的

佟世天	卞阳-富数科技	徐思彦-腾讯	许超逸
Navigator DCL中国区领航员	谷燕西	孔猛-VeryHash	白硕-上交所前总工
余文波-分布式资本	张元杰-Conflux	吕国宁-Nervos	郑义-Qtum
孟岩-CSDN	陈雷-比特蓝鲸	周沙-区块链早期参与者	俞阳-矿海会