01版 - 锚定奋斗目标 汇聚智慧力量(社论)

· · 来源:tutorial资讯

HK$565 per month

正在改变与想要改变世界的人,都在 虎嗅APP

Show HN,推荐阅读WPS下载最新地址获取更多信息

Be the first to know!

В Израиле одним словом оценили ход операции против Ирана14:58

В Кремле п

还有一个问题:大模型开发,比拼的既是基础研发,也是工程执行。我们目前能看到的公开信息,主要是基础研发层面的,例如DeepSeek团队发布的学术论文;我们对于背后的工程课题、工程瓶颈,知之甚少。迄今为止,关于DeepSeek新版本训练过程的一切媒体报道,其实都是捕风捉影,没有得到官方的任何承认,也缺乏第三方信源参考。举个例子:谷歌在大模型基础研发方面一直保持领先,但是在Bard以及Gemini早期,工程执行方面犯下了很多错误,直到2024年下半年才赶上来。如果DeepSeek过去一段时间致力于解决一些工程环节的细节问题,我不会感到奇怪。