Thu Oct 24
竹间智能COO与专家通过ChatGPT看AI算力需求与未来
2023-03-09
上周,第十七届中国IDC产业年度大典在北京召开,竹间智能总裁兼COO孙彬先生受邀出席盛会,携手多位算力及人工智能产业的专家,针对“从ChatGPT看AI的算力需求与未来”的主题展开了一场高端圆桌对话。算力是AI的坚实承载,也是数据中心领域的重要切入点,目前人工智能浪潮汹涌,ChatGPT不仅是一款强大的工具,还将给算力基础设施、数据中心和计算设备的形态带来长远改变。这吸引了专家、学者及产业界人士的强烈关注。
本次圆桌对话中,孙彬先生作为主持,和其他嘉宾围绕多个AI算力焦点问题陈述专业意见,以多维观点交流碰撞,共商市场和需求的变化,探讨算力产业发展的路径。
ChatGPT的突破以及国内对标产品的进展
孙彬先生开场便指出,ChatGPT这个词已经成为一个现象级热词,不仅影响了人工智能圈的从业者,也波及到整个科技界的所有从业人员,甚至触达了很多文化工作者。其背后的大语言模型也同时站上风口浪尖。竹间智能长期深耕自然语言处理领域,用相关技术去构建知识对话的机器人以及知识对话的知识库,真正帮助企业完成大语言模型和知识应用的落地,希望能够找到更多伙伴,一起合作来对标ChatGPT,在国内完成人工智能的落地,在AIGC这个赛道上领跑。
如今ChatGPT已在大量场景中实现了突破,无论逻辑、对话、翻译、写代码还是通用知识方面都表现得足够惊艳。在大语言模型领域,其实国内企业都在奋勇争先,很多专业的模型公司已经发展了多年,有些专注于底层模型研发,有些像竹间智能更偏向于落地,大家都有尝试将大模型和自己的专业模型整合起来,这种趋势非常明确。从产业发展方向来看,预计未来会主要依靠这种混合模型的方式为企业和公众提供服务。
ChatGPT类产品对算力的需求特征及特性
众所周知,大模型对算力的依赖极为严重。孙彬先生详细介绍道:根据官方发布的数据,Meta训练一次650亿参数的模型,就需要2048张A100跑21天。这还只是百亿参数模型,如果要训练Google的4500亿参数模型,大概需要6000多张TPU运算将近50天。一旦模型无效,还得再跑一遍。可以想见这是多么巨大的投入和消耗。
另外,大语言模型的规模很大,且需要互联网上的庞大数据和知识来训练,再收敛成推理模型去使用,但在训练上和推理上的算力需求其实是不一样的。比如训练模型,需要大型服务器集群来完成,时间可能集中在几十天内,这一项任务就会占据上千甚至上万台GPU服务器,这是处于波峰期,在下次训练之前,则会处于波谷期。总的来说,大语言模型在算力使用上,会有高强度的大集群训练,然而平常也会有闲置,这就要求全新的模式和方法来支撑。
数据中心及服务器在AI带动下的发展趋势
国内聚焦大语言模型和自然语言技术落地的产业从业者都面临着严峻的现状,那就是ChatGPT在中国不可用,而且全国大部分企业用不起大模型,但孙彬先生认为,这同样能带来产业重新爆发的契机,就像过去的互联网或云计算一样,引发科技的创新和应用场景的创新,为企业和个人创造完全不一样的体验。
从PC时代,到互联网时代,再到云计算时代,算力已经像电力一样进行供给了,大家习惯了不再私有化部署,而是去调取资源,那么新一代大模型恰恰就是将人工智能从原来的模型私有化部署中解放出来,往前推动一步,直接调用大模型,这样既能降低成本,也可以享受最先进的技术。今天,AI的对话能力和内容生成能力都在增强,放眼望去,以后会出现更多的智能工具或助手来为我们处理各种各样的事情。
基于这样的情形,孙彬先生号召国内所有相关企业把自己的大旗竖起来,在上中下游各个环节,无论是专注芯片、模型、数据、算力还是落地,不管是基础层、技术层还是应用层厂商,大家此刻应该凝心聚力,担当中国打造对标ChatGPT产品的行业标兵,这样才能在AI赛道上跻身前列,最终让企业和个人,尤其是知识工作者,都从AIGC技术中获益。
免责声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,亦不负任何法律责任。 本站所有资源全部收集于互联网,分享目的仅供大家学习与参考,如有版权或知识产权侵犯等,请给我们留言。