行业点评
事件:5月21日,阿里云宣布下调通义千问商业化模型和开源模型面向开发者的API调用价格,其中,通义千问GPT-4级主力模型Qwen-Long输入价格从0.02元/千tokens降至0.5元/百万tokens,直降97%。
此前,5月9日,阿里通义发布1100亿参数开源模型Qwen1.5-110B,根据阿里云,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首。
“降价+开源”,通义千问组合拳“拳拳到肉”。“降价+开源”已经逐渐成为全球大模型厂商的共识,这有助于解决AI应用开发者“大模型API价格太贵,开源模型质量不够高”两大痛点,驱动AI应用全面开花。
大模型开启推理端降价潮。通义千问并非首个对开发者降价的大模型,5月以来,多个大模型推出低价产品或降价:1)5月6日,幻方量化宣布旗下深度求索(DeepSeek)正式开源第二代MoE模型DeepSeek-V2,API定价为:输入1元/百万tokens、输出2元/百万tokens,价格为GPT-4-Turbo的近百分之一;2)5月11日,智谱宣布其个人版GLM-3Turbo模型产品调用价格从5元/百万tokens降低至1元/百万tokens;3) 5月13日,OpenAI推出GPT4o,它在英语文本和代码上的 GPT-4 Turbo 性能相当,向全部用户免费,API调用速度比GPT-4快两倍,但价格减半;4)5月15日,豆包主力模型的推理输入定价只有0.0008元/千Tokens;5)5月21日,百度智能云宣布其文心大模型的两大主力模型ERNIE Speed和ERNIE Lite全面免费;6)5月22日,科大讯飞宣布讯飞星火Lite API永久免费开放。我们认为,大模型API纷纷降价,可能源于大模型推理技术的进步、推理成本的下降,客观上给了开发者更多选择,有助于开发者增加对AI大模型的开发。
推出多尺寸与多模态模型,阿里通义助力多场景应用开发。5月9日,阿里通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。我们认为,大模型在端侧的应用也不容忽视。
建议关注:算力板块:1)光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技;2)算力调优/调度/租赁:恒为科技、中科曙光、中国移动、中国联通、中国电信;3)算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪;4)液冷:英维克;5)边缘算力承载平台:美格智能、广和通、移远通信。
数据要素:1)运营商:中国电信、中国移动、中国联通;2)数据可视化:浩瀚深度、恒为科技、中新赛克。
风险提示
大模型商业化进度不及预期,大模型技术发展不及预期。
本文节选自国盛证券研究所已于2024年5月23日发布的行业点评《国盛通信|通义千问主力模型降价,助力AI应用快速推开》,具体内容请详见相关报告。
宋嘉吉 S0680519010002 songjiaji@gszq.com
孙爽 S0680521050001 sunshuang@gszq.com
东港股份 | 公链2020H1 | 漫画区块链 | |
比特币UTXO | 比特币挖矿初探 | 比特币挖矿产业链 | 比特币与黄金相关性 |
DCEP专利分析 | DCEP双离线支付 | DCEP标的 | Libra |
区块链+电子发票 | 区块链+溯源 | 区块链+供应链金融 | 区块链标准委标的 |
佟世天 | 卞阳-富数科技 | 徐思彦-腾讯 | 许超逸 |
Navigator DCL中国区领航员 | 谷燕西 | 孔猛-VeryHash | 白硕-上交所前总工 |
余文波-分布式资本 | 张元杰-Conflux | 吕国宁-Nervos | 郑义-Qtum |
孟岩-CSDN | 陈雷-比特蓝鲸 | 周沙-区块链早期参与者 | 俞阳-矿海会 |
(向下滑动,查看更多)