当前位置：周记财经 > 资讯 > 正文内容

ChatGPT造孽，中国高校因它算力荒

更新时间：2026-06-28 06:30:24 资讯3年前 (2023-04-15)43

不做大模型，就没有算力用。ChatGPT成为AI届白月光后，加剧了算力分配的贫富分化。这是ChatGPT点燃AI风口后，国内某top3高校AI实验室的残酷现状。去年11月ChatGPT发布后，与非大模型团队合作的企业骤减，近期找上门的，也是张口就问：。现在，大伙争先恐后扑向ChatGPT背后GPT-3.5般的各种大模型，算力流向亦然。去年11月ChatGPT发布后，与小哥所在团队洽谈校企合作事宜的公司数量急剧减少。所以现在的情况是，因为ChatGPT显示出大模型的推理能力，训练和研究大模型的算力需求增加；同时因为大模型热度爆棚，蜂拥至大模型的算力资源也增加。

ChatGPT造孽，中国高校因它算力荒

来源：量子位

不做大模型，就没有算力用。ChatGPT成为AI届白月光后，加剧了算力分配的贫富分化。

ChatGPT造孽，中国高校因它算力荒

不做大模型，就没有算力用。

这是ChatGPT点燃AI风口后，国内某top3高校AI实验室的残酷现状。

同一个实验室里，非大模型团队6人用4块3090卡，比起同实验室的大模型团队10个人用10块A800卡，本就已经不算富裕。

现在，校企合作也更偏爱大模型。去年11月ChatGPT发布后，与非大模型团队合作的企业骤减，近期找上门的，也是张口就问：

“你们做大模型不？”

做，有高校和企业的通力支持；不做？那就只能眼睁睁看着算力花落别家。

哪怕某量化私募基金的有10000张A100卡，还对高校研究团队开放申请，也不见得能落一张到你头上。

“要是我们组能分到一些就好了。”看到这条微博，非大模型团队带队的数据科学方向博士小哥羡慕不已，因为缺算力，他都愁得快仰天长啸了：我们也值得投资啊！！！

现在，大伙争先恐后扑向ChatGPT背后GPT-3.5般的各种大模型，算力流向亦然。

其他AI领域本就不足的算力更荒了，尤其是国内学界手里的算力分配下来，贫富差距肉眼可见。

一整个实验室就4块3090卡

巨大规模算力以月为单位的租用成本，对研究团队来说不是小数目。大模型正当其道，学界研究大模型的实验室或团队拥有算力资源的优先分配权。

就拿小哥在学校的亲身体验来说，在他们研究室，大模型小组10个人有10块A800卡可用，而另一个研究传统机器学习方向的实验室，整个实验室只有4块3090卡。

拥抱主流趋势是一重原因，另一重原因是实验室需要运转和维护的经费，获得拨款的一种形式是申请国家项目，但必要步骤是提供论文成果。

双重原因下，本就不多的算力资源，不得不优先分配给大模型这样热门且相对容易出成果的研究。哪怕对学界来说，训一个大模型其实练不太动——因为数据、算力和资金都有些捉襟见肘。

为了获得更多的资源，有的非大模型实验室甚至额外专门成立研究大模型的团队。

当然，想要获得资金和资源，校企合作也是不可或缺的一种方式。

这种推动产研融合的重要支撑形式持续已久，2020年，KDD中校企合作论文占比超过50%，这个比例在ICCV中达到45%。

举例来说，2021年，清华大学KEG、PACMAN（并行与分布式计算机系统）、NLP等实验室着手推进训练千亿参数的稠密模型，但团队用于训练模型的计算资源并不充足。最终，校外企业智谱AI租用了近百台A100的服务器，免费提供所需算力，这才有了双语预训练语言大模型GLM-130B的诞生。

但在众人争先恐后扑向GPT-3.5般大模型的当下，非大模型团队开始不太好谈这类合作了。

去年11月ChatGPT发布后，与小哥所在团队洽谈校企合作事宜的公司数量急剧减少。在其他高校，AI领域的非大模型团队也总是面临企业询问，“要不要/会不会做大模型”。

本就稀缺的算力，在学界有成为追逐热点的砝码的倾向，算力资源分配的马太效应由此逐渐扩大，带给学术研究很大困扰。

ChatGPT加剧算力分配贫富分化

算力是AI飞速发展必不可少的指标，2018年，OpenAI发布的报告中点出一个算力趋势：

自2012年以来，AI训练任务所运用的算力每3.43个月就会翻倍。到2018年，AI算力需求增长了30万倍。

产学研对算力需求暴增，我们能提供的算力有多少？

据中国算力集团统计，截至2022年6月底，我国数据中心机架使用总规模超过590万标准机架，服务器规模约2000万台，算力总规模排名全球第2。

这个排名还算不错，但摊开来看仍旧远远不够，毕竟放眼全球，没有哪个国家不是嗷嗷待哺，等着更多的算力资源“投喂”。

再退一步讲，买得起显卡，拥有的算力上去了，电费也是天文数字。

况且我国还有特殊情况——

开放原子开源基金会业务发展部部长朱其罡在本月举办的CCF YOCSEF上发言阐述现状称，超算领域的核心技术，一个是IBM LSF超算系统，一个是开源系统。目前，国内多数超算中心都基于开源系统做封装，但这个版本调度资源的效率和能力都有很大的提升空间。

以及，因为众所周知的原因，A100、H100这俩目前性能最强的GPU，还没找到可规模替代的方案。

综上，算力不够已是积弊，但ChatGPT时代，算力需求剧烈扩张，除了大量训练算力，大量推理算力也需要支撑。

所以现在的情况是，因为ChatGPT显示出大模型的推理能力，训练和研究大模型的算力需求增加；同时因为大模型热度爆棚，蜂拥至大模型的算力资源也增加。

分配给大模型领域的算力资源丰富起来，其他AI领域缺衣少食的情况逐渐加剧，研发能力受到掣肘。

可以说，ChatGPT成为如今的AI届白月光后，加剧了算力分配的贫富分化。

这般“富”甲一方的大模型，是不是AI研究路径上最好的？还没人能够回答。

但值得引起注意和重视的是，GPT系列为首的大模型不应该吸引全部目光，整个AI领域还有各种各样的研究方向，还有更加细分的垂直领域，以及带来更多生产力的模型和产品。

当ChatGPT的热度趋于平缓，学界的算力资源分配差距会缩小吗？

所有非大模型方向的实验室和团队，恐怕都在期待之中。

本文作者：衡宇，来源：量子位，原文标题：《ChatGPT造孽！中国高校因它算力荒》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

返回列表

上一篇：濮耐股份股票

下一篇：中星集团控股(00055)发盈警，预期年度亏损约300万港元至1200万港元

周记财经网

ChatGPT造孽，中国高校因它算力荒

相关文章

全国政协委员李民斌：拓展养老金融以应对人口老龄化

中联重科2月28日斥资约5342.21万元回购800万股

没有主线拉升赚钱效应带动场外资金，指数短期内很难有进一步上攻动力

中小银行股权交易分化！长城华西银行5500万股权变卖再“折戟” 业绩下行趋势难止

国脉文化（600640）盘中异动股价振幅达7.04% 跌6.61% 报12.86元（05-16）

华银电力（600744）：MACD指标DIF线上穿0轴-技术指标上后市看多（05-16）

周记网财经版权所有 xxxxxxxx

周记财经网

ChatGPT造孽，中国高校因它算力荒

相关文章

全国政协委员李民斌：拓展养老金融以应对人口老龄化

中联重科2月28日斥资约5342.21万元回购800万股

没有主线拉升赚钱效应带动场外资金，指数短期内很难有进一步上攻动力

中小银行股权交易分化！长城华西银行5500万股权变卖再“折戟” 业绩下行趋势难止

国脉文化（600640）盘中异动 股价振幅达7.04% 跌6.61% 报12.86元（05-16）

华银电力（600744）：MACD指标DIF线上穿0轴-技术指标上后市看多（05-16）

周记网财经 版权所有 xxxxxxxx .ad{position:relative} .ad .ad1{position:absolute;background:rgb(0 0 0 / 53%);right:10px;top:10px;color:#fff;border-radius:5px;font-size:13px;padding:2px 4px}

国脉文化（600640）盘中异动股价振幅达7.04% 跌6.61% 报12.86元（05-16）

周记网财经版权所有 xxxxxxxx