记者 钱玉娟 2月14日,大模子云职业商硅基流动(SilliconFlow)秘书议论北京昇腾东谈主工智能计较中心,全面支合手基于昇腾算力的DeepSeek系列模子的独有化集群部署。
此前,硅基流动大模子云职业平台SiliconCloud首发上线了基于昇腾算力的满血版DeepSeek R1/V3模子,早先走通了在国产芯片部署DeepSeek模子的旅途。
时分倒回至春节假期的2月1日,华为云秘书议论硅基流动推出基于昇腾云职业的DeepSeek R1/V3推理职业。彼时,华为云、硅基流动的官方公众号相隔一分钟官宣,标题均特殊“首发”二字,内文用“连日攻坚”详尽了团队的发奋。
首发
硅基流动独创东谈主袁进辉曾总结,硅基流动的技艺中枢是提供一个推理引擎,主要向企业提供高性能LLM推理和教练处置决策,匡助企业高效地部署AI欺诈。DeepSeek V3是战抖人人科技圈的开源、推理大模子,硅基流动与之适配提供职业尤其对口。
张开剩余85%在DeepSeek V3大模子发布前,DeepSeek独创东谈主梁文锋就曾问袁进辉,硅基流动要不要部署?彼时,梁文锋致使给出了建议:最少20台H800(英伟达GPU芯片),80台最佳,10台也不错,即是有点慢。
袁进辉算了一笔账:一个月80台职业器的净破耗就得五六百万,“还不一定能用满,风险太大了”。他莫得下注。
看到DeepSeek创造一个又一个古迹,袁进辉惨酷且苦于莫得充沛的算力资源,直到一位共事突发奇想,“国产卡多,用国产卡吧”。
硅基流动向华为云主动提倡了互助想法。
华为选拔自研的达芬奇架构,开发了昇腾910和昇腾310两款AI处理器芯片,而华为云又上线了昇腾AI云职业,于今约一年半时分,面向企业提供一键接入得回AI算力的职业。
华为昇腾AI云职业有一个“百模千态”专区,其中除了华为自家的盘古大模子外,还能适配业界主流的上百个开源大模子,从而复旧企业和开发者更快速地创建我方的大模子欺诈。
开源的DeepSeek何其火爆,接入想法让硅基流动和华为云一拍即合。华为云肃肃调配算力资源,硅基流动肃肃让模子在GPU上不错开动并具备问答才气,同期确保模子开动自如、不亏损精度,且开动速率尽可能快。
2025年春节,硅基流动团队和华为云各业务团队确切无休,DeepSeek团队也在全程提供了许多造就。
2月1日凌晨1点多,距离官宣基于华为昇腾的DeepSeek R1/V3推理职业上线还有10个多小时,硅基流动的一位高管发了一条一又友圈:平台接入了DeepSeek系列模子,且API职业价钱与DeepSeek官网同价。
2月1日今日,“硅基流动”的微信指数从往时确实切为0环比飙升了8831.35%。那时,硅基流动是DeepSeek官方以外,第一个提供基于国产芯片的671B满血模子MaaS云职业的平台。
趁着热度,硅基流动也发布了一波招聘盘算,其中灵通的视觉生成推理引擎工程师、异构硬件适配工程师、托福研发工程师等全职岗亭有15个,还有与生成式AI有关的算法、平台前端、平台后端等地点的实习工程师职位8个。
API职业竞争暗涌
“要磋议并发,以及后续并发是否有规则。”一位与华为云互助接入DeepSeek-R1的AI欺诈厂商肃肃东谈主称,这是通盘要接入的平台企业简略欺诈家具齐会磋议的事情,背后的艰难主要由华为云方面在处置。
布局DeepSeek API职业,不仅仅腾讯、阿里、百度等巨头争抢的贸易,不少模子革命企业也参与其中。
提供模子云职业的供应商虽多,但上述硅基流动高管看到,仍是有模子测试有关东谈主士给用户提供了一些判断的依据,比如供应商提供的是否为原版的671B参数边界?供应商提供职业的凹凸文窗口(谈话模子在进行瞻望或生成文本时,所磋议的前一个词元即Token或文本片断的大小范围)大小是否为正常的64K+?终末还有AI缓助编程恳求的通过情况,供应商对AI模子技艺的欺诈是否受TPM(斥地料理,一般在10W台以上)的规则。
陈天楚在浙江大学ARClab肃肃大模子有关研究,他看到,接入DeepSeek的各个云厂商,面向的客户、官宣的资本禁止和订价盘算有别离。举例,有的厂商提供满血版,有的则是量化压缩版,还有提供蒸馏后的小模子。
陈天楚合计,除了提供圭臬化的模子API职业外,云厂商间的较量主要汇注在能否提供个性化职业。像硅基流动就在上线671B的DeepSeek V3/R1旗舰模子后,又上线了6款DeepSeek R1蒸馏版模子,其中的8B、7B、1.5B模子免费,企业或个东谈主用户、开发者使用模子或基于模子开发AI欺诈时,能平直调用硅基流动的SiliconCloud平台上的API,简便易用。
禁止2月13日,有来自模子测试东谈主士的收尾反馈,在提供DeepSeek API职业的主流供应商中,和华为云深度互助的硅基流动,其AI职业反应的推理、生成以及平均速率,不仅优于承载压力过大的DeepSeek官方,更与腾讯云、阿里云等厂商拉开了距离。
“+DeepSeek”后果待定
收获于春节假期的突击作战,年后上班第一天(2月5日),华为推出了基于原生鸿蒙操作系统的小艺助手App,既接入了DeepSeek模子推理才气,还在“智能体”选项中上架了DeepSeek-R1的Beta版。
短短5天后,华为智妙手机纯血鸿蒙版小艺App的DeepSeek-R1智能体升级为郑再版,新增“联网搜索”功能,学问库变得更丰富,时效性也更强。
2月13日,记者在广州一家华为手机线下销售门店体验。通盘更新为纯血鸿蒙系统的手机上,小艺从往时在系统内可被叫醒的贤达语音助手职业,变成一个寂寥的欺诈家具。进入小艺App,便不错与“她”问答对话,也能在第三方智能体中平直点击DeepSeek-R1,进入深度念念考对话,无谓下载第三方App。
华为领有自研的盘古AI大模子,小艺即是通过盘古大模子教练出来的。纯血鸿蒙中的小艺,在成为一个寂寥欺诈后,其使用界面中有特殊DeepSeek的方面。
记者看到,门店销售东谈主员手中的参考府上上,除了有“怎样说”“怎样作念”来体验小艺,还有盘古大模子别离宽绰数据模子的一些对比,会强调盘古大模子领有扎根中语的额外上风。对DeepSeek,材料并未说起。
上述AI欺诈厂商肃肃东谈主在摄取经济不雅察网记者采访时,给出了家具接入DeepSeek模子才气后要道想法的变化。
“大模子幻觉变少,任务凯旋率变高。”该肃肃东谈主露出,其团队在用DeepSeek的模子现实某项任务时,失败率基本为0。接入这一明星大模子后,模子幻觉有所减少,但他指出,大模子幻觉动作共性问题,仍有待处置。
其实,该肃肃东谈主所在的AI企业也有大齐参加革命自研的通用大模子以及针对行业欺诈的专属大模子。他告诉记者,现在业内集体涌向DeepSeek,普遍作念法并非是用DeepSeek系列模子与自己现存模子交融,而是用DeepSeek的模子来开拓新的欺诈场景。
这位肃肃东谈主与陈天楚有共鸣,DeepSeek是推理模子,实效性并非其的上风,但却不错通过模子云职业商等AI基础步调赋能。
一位平台高管跟许多主流大模子厂议论论过智能体在各个硬件终局上买通的问题,在她看来,这亦然DeepSeek将来技艺落地以及现时业内“+DeepSeek”风潮后的发展地点,“每个硬件齐可能成为智能体的进口,通过现实东谈主类的任务来教练专属个东谈主的智能体”。
为什么是硅基流动
硅基流动独创东谈主袁进辉是又名连结创业者,他在2017年建造的一流科技(OneFlow),在国内2023年涌起AI大模子风潮后,估值一度超数亿好意思元。
同庚,好意思团议论独创东谈主王慧文创业了大模子公司光年以外,他提倡通过并购OneFlow的神气,邀请袁进辉加入光年以外成为议论独创东谈主。光年以外后被好意思团收购,袁进辉在2023年8月秘书追思到AI基础步调边界赓续创业,创立了硅基流动。
硅基即芯片,而流动有软件之意,这一称号也与袁进辉此前创立的一流科技造成呼应,让芯片的算力在软件基础上跑起来。
加快AGI普惠东谈主类,是硅基流动官方公众号上的简介,袁进辉不啻一次在公开场所暗示,其想法是为雄壮的开发者提供基于AI模子进行欺诈革命的要道“铲子”,闪开发者完毕Token解放。
硅基流动旧年年中推出SiliconCloud后,不仅日均调用量超千亿Token,针对多个主流模子的职业还提倡了始终免费。
“面向C端用户的大模子App,以后圆善面免费了。”袁进辉2月14日暗示,国内模子厂商很难对C端用户收取订阅费,多是厂商我方背负算力资本。
在袁进辉看来,模子厂商惟一得回用户后才有见识去变现。
数据炫耀开云体育,DeepSeek的欺诈拜谒使用量正呈现指数级高潮,成为现在最快窒碍3000万日活跃用户量的欺诈法子。
发布于:北京市