就发布.png

2025-08-15 微信搜索 热度:920
改用华为晶片训练遇难题 DeepSeek-R2延后问世

中国人工聪明(AI)公司深度求索(DeepSeek)使用华为晶片练习发生困难,被迫延后发表新模型,可见中国推动自家技术来取代美国面临瓶颈。

英国金融时报(FT)引述知情人士报导,DeepSeek今年1月推出R1模型后,在主管机关鼓励下改用华为昇腾处理器(Ascend)取代辉达(NVIDIA)晶片。

但DeepSeek以昇腾晶片练习R2模型时持续遭遇技术题目,不得不改用NVIDIA辉达晶片来练习,另把华为晶片用于推论(inference)。报导指出,这正是DeepSeek新模型原定5月发表、却延后的主因。

报导引述中国产业人士指出,中国晶片在稳定性、24小时一元一分麻将群晶片间连线速度和软体水準方面都不如辉达的产品。

据报导,华为曾派出工程团队进驻DeepSeek办公室,协助该公司使用昇腾晶片开发R2模型。但知情人士说,即使华为驻点支援,DeepSeek仍未能在昇腾晶片上成功完成一次练习。

知情人士透露,DeepSeek创办人梁文峰曾在公司内部对R2进展表达不满,并力促团队投进更多时间打造更先进的模型,以维持该公司在AI领域的上风。

据报导,R2延后问世,也跟新版模型数据标记(data labeling)作业超过预期有关。媒体报导指出,R2模型可能最快在未来数周内发布。

上一篇:华夏基金宠粉有礼活动抽随机微信红包 亲测中0.39元秒推

下一篇:(跑得快)

赞 0
分享
最新动态

前高管控「做假帐几十亿」 360市值蒸发40亿 周鸿祎:诋毁

王毅:日本曾以「存亡危机事态」为幌子发动侵略 绝不能重演

中共中央财办:扩大内需是中国2026排首位重点任务

中国宣布对欧盟猪肉徵收反倾销税 期限达5年

中国民众「走线」美国无门 改走欧洲目标德国

台湾与宏都拉斯有望恢复邦交?北京呛:金元外交注定失败

李家超述职 习近平强调贯彻「一国两制」关注宏福苑大火

中美AI竞争加速 未来3年中国晶片技术或弯道超车

泰缴获柬武器 网友认出:中製反坦克导弹 1枚10万美元

全裸做SPA被安排男技师 长沙女拒绝…被酸「孤陋寡闻」

账号登录,或者注册个账号?