本文转载自公众号:智枭观察AI,原文:又一款多模态模型免费了,5小时1500次调用,商汤这次是认真的
100页财报47秒处理完,Token消耗还降了60%。更离谱的是——免费。
商汤这家公司,以前给人的印象是"做视觉的"。
人脸识别、自动驾驶、医疗影像——都是它的地盘。但在大模型这波浪潮里,存在感一直不如DeepSeek、通义这些选手。
直到最近半个月,商汤连续出了两招。
4月28日,开源日日新U1系列,NEO-unify原生统一架构。
5月8日,发布日日新6.7 Flash-Lite,轻量多模态智能体模型。
如果说U1是秀技术肌肉,那Flash-Lite就是冲着落地去的——而且招招都打在痛点上。
到底干了什么?
Flash-Lite最核心的变化是:取消了视觉转文本这个中间步骤。
传统多模态模型的工作方式是:看到一张图→转成文字描述→丢给语言模型处理。中间多了一道"翻译"工序,既慢又损失信息。
Flash-Lite直接用原生多模态架构,模型自己同时理解图像和文字,不需要中间翻译。
效果很直观:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
47秒 |
|
|
|
98.6% |
|
|
|
降低60% |
47秒 vs 23分钟,不是一个量级。

跑分:ClawEval和MathVision上压了GPT-5.4和Gemini
跑分不代表一切,但ClawEval和MathVision这两个评测不是闹着玩的。
ClawEval是Agent场景下的综合评测,MathVision是多模态推理。Flash-Lite在同级别模型中拿了多项SOTA,在这两个指标上均领先GPT-5.4和Gemini 3.1 Pro。
关键这还是轻量模型——参数量更小,效率更高。
商汤首席科学家说过一句话:"高性价比与卓越运行效率是商汤参与AI竞争的核心路径。"
这话翻译过来就是:我不跟你比谁最大,我跟你比谁最实用。
更狠的是:免费+开源
商汤这次在定价策略上非常直接。
免费额度: 每5小时1500次调用,首月无门槛。
领取入口:https://www.sensenova.cn/
开源动作: 将办公能力封装为SenseNova-Skills,在GitHub上全面开源——信息图生成、PPT创作、Excel数据分析、深度调研,全部覆盖。
开源地址:https://github.com/OpenSenseNova/SenseNova-Skills
还有一条不能忽略的新闻:U1开源当天,10家国产芯片公司完成了Day 0适配——昇腾借助910C NPU实现了2.52倍推理加速。
商汤不是一个人在战斗,背后是一个国产芯片生态圈。

两条腿走路
回头看商汤这半个月的操作,策略非常清晰——两条腿走路。
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
U1是技术底牌,告诉大家商汤在底层架构上有真东西。
Flash-Lite是冲锋号,用免费和高性能吸引开发者上车。
谁该关注?
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
最后一句
商汤这波操作,让我想起了一句话:
"打不过就加入"不对,应该是"找到了自己的路,就不跟你在同一个赛道卷。"
当大家都在拼万亿参数、拼Scaling Law的时候,商汤选择用更小的模型、更高效的架构、更低的成本来打。
Flash-Lite用数据证明了:轻量模型+原生多模态+免费开源,这条路径也能跑出SOTA。
我先把免费入口放这了,测不测在你。
https://www.sensenova.cn/

sensenova-6.7-flash-lite、、sensenova-u1-fast、deepseek-v4-flash三大模型可以免费公测!









暂无评论内容