当ai以一个特定的主题,在30秒内完成一篇文章的写作,并在高中甚至大学某个年级的课堂里获得第一名的最终评价时,我们知道,对于我们的下一代来说,这个世界已经永远改变了。不止是写作。当时当下,在全球各地各个产业领域内,一场以生成式ai为内核的人工智能革命,正在以不可逆的态势深入蔓延。chatgpt为代表的生成式ai,已成为全球科技竞争的制高点。随之而来的关键命题是:中国ai科技领域,谁将是这场全球性科技竞赛的中坚破局力量?这个问题的答案,离不了算力、算法以及数据三个维度构成的产业规律。那些在人工智能领域持续耕耘的中国科技公司们,凛冬之后,终于挨到了自己的黄金时代。本文将以科大讯飞为样本,透视中国生成式ai 产业的当下与未来。
中国ai进入无人区
“在做通用ai范式的时候可以想象站在一个沼泽地上,四面没有光,也没有手电,这时候咱都不说走多远,往哪边走都是个问题。这种情况下大家都选择了相对光明的道路,就是专用ai范式。不得不佩服美国人,他把这个事情(agi,通用人工智能)从0到1的道路硬生生地走出来了。”这是日前一场专家电话会中,一位产业人士对于chatgpt及其背后的openai团队的感慨。从专用ai到通用ai,即使openai已成功闯关,但对中国的ai公司来说挑战仍然巨大,说是走入无人区毫不为过。
chatgpt火爆之后,被触及商业模式核心利益的谷歌最为着急。单纯从理论上看,它做这个事情好像不难。毕竟就连chatgpt的底层架构transformer 模型,都是来自谷歌。但现实很残酷,谷歌的类chatgpt项目bard出师不利,员工通过内部论坛memegen批评管理层最近推出的bard:仓促、拙劣、毫无谷歌风范(un-googley)。chatgpt的通关之路难度可见一斑。但即使如此国内参与者也不得不跟。因为chatgpt会对众多产业带来颠覆性变革,包括且不限于:1)改变现有人机交互模式。2)改变现有信息分发获取模式。3)改变内容生产模式。4)加速“aiforscience”的发展。直观一点来说,互联网的核心价值是连接,chatgpt代表的生成式ai 的核心价值则是嵌入。如果嵌入至制造业,生成式ai的强大远景——存、算、编码生成一体化所带来的“随心所欲”效应,无疑意味着人类生产力能力文明级的跨越。
但生成式ai将在基础学科研究、新材料、新能源、新药物的研发过程中扮演关键角色。
科大讯飞的比较优势
目前诸多中国科技公司都在加紧布局类chatgpt 项目。所有谋局者之中,科大讯飞是比较优势较为突出的一个。主要体现在以下几个方面:
【1】数据卡位。前文我们提到,谷歌bard背靠海量数据出师不利,反观chatgpt当前最具产业价值的编程能力,很大功劳来自于github。openai在chatgpt中引入了它830g代码文本,那是1亿程序员的智慧涌现,编程能力不强才怪。
科大讯飞凭什么布局chatgpt?openai上述产业实践,以及在医疗领域的突破,也许能得出一些启示,那就是数据质量的重要性。目前国内参与者在算法、算力上跟chatgpt是有差距,但优质数据在一定程度上弥补了这个差距。比如chatgpt最近通过美国执业医师资格考试,它在考试三个部分得分在52.4%-75%之间。而与医疗机构紧密合作的科大讯飞,其“智医助理”系统2017年就通过国家执业医师资格考试综合笔试测试,答对76%的题目(满分600分,考了456分)。目前“智医助理”作为全科医生助手已可以诊断1200多种常见病,累计提供5.5亿次ai辅诊建议。放眼整个行业,长期布局ai技术的同时,又掌握医疗、教育等专业数据端口的公司是稀缺的,这是科大讯飞布局类chatgpt项目的底气之一。
【2】算法与成本曲线。大模型的训练是一件烧钱的事。chatgpt的诞生与用户广泛应用,离不开它对成本曲线改造:过去两年半时间,gpt-3模型的训练成本下降了80%以上,目前仅需要140万美元(首次训练约1200亿美元)。而成本曲线的降低离不开算法进步。道理很简单:同样是训练一次大模型,算法能力提升意味着成本曲线的降低。openai 的成功在于算法迭代,gpt-3比之gpt-2在算法层面有本质提升(于是它不开源了)。所以创立8年烧钱不断的它还能获得资金支持,并终于等到chatgpt横空出世。回头看国内玩家,虽然公司间横向的算法直接对比没法做,这是商业秘密,但从侧面还是能看到一些端倪:科大讯飞在github上开源模型比较受追捧。具体而言,其开源了6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万,在github平台获得星标数位列同类中文预训练语言模型第一。与此同时,科大讯飞承建了认知智能国家重点实验室。ai技术可简单分为识别(图像识别、语音合成与识别等)和认知(语义理解、常识推理、知识图谱、阅读理解等)两大类,承建认知智能国家重点实验室是官方对科大讯飞算法技术实力的背书。
【3】算力战争。最新的投资者关系交流会议显示,科大讯飞2009年至今,已建成4城7中心深度学习计算平台,自建业界一流的ai数据中心奠定大模型训练的硬件基石。在技术层面实现百亿参数大模型推理效率近千倍加速,为认知智能大模型经济实惠的规模化提供可能性。目前来看,基本满足类chatgpt项目的布局。但从长期看,科大讯飞乃至整个中国布局类chatgpt项目的玩家,还是要大力加强算力的提升。从产业的发展趋势看,算力是企业乃至当前世界最关键的竞争资源。残酷的事实是,超级算力中心建设资金门槛在chatgpt出现后,已经推向百亿之上(在微软的支持下),而运营与维护成本更是天文数字。基于优质数据卡位,算法能力和商业化策略(下文详述),科大讯飞在算力维度至少有一点可以抓紧做:推动企业间的分布式计算协作。强如openai亦绑定微软这个算力巨头,2月8日微软更是宣布将chatgpt整合进其搜索引擎,未来随着类chatgpt玩家的布局行至中场,合作的机会少不了。
ai界的一股清流
在真实的商业世界,技术的硬实力永远不是全部,它无法具现一个组织看不到的软实力。事实上,对比绝大多数的ai公司,科大讯飞的软实力更为突出。过去很长时间,科大讯飞一直是a股市场上的ai独苗。围绕其业绩的质疑声音一直没断过。直到背负巨额亏损的ai新势力们上市,外界看到了其自力更生的难能可贵。
与后进的ai新锐们不同,科大讯飞以语音识别起家,这条路线对于早期ai公司可能比较友好。众所周知,2006年hinton利用预训练方法得出神经网络局部最优解,将隐含层推到了7层,神经网络真正意义上有了“深度”,由此揭开深度学习热潮。所谓“深度”并没有固定数值,在语音识别中4层网络就能被认为是较深的(例如谷歌产品voicesearch)。在效果一定的同时,层数越小,难度越低,计算量越少,它有利于打通技术与商业化的双轮驱动,这对于ai从实验室走向产业的起步阶段非常重要。ai 的科技含量再高,也是一门生意,先把商业的账算清楚。任何商业的基本规律就是创造现金流、创造真金白银的产业附加值才能持续发展。组织能自负盈亏,才能稳健地进入其他技术分支——科大讯飞先是拥有我国唯一的“语音及语言国家工程实验室”,后来国家唯一的“认知智能国家重点实验室”也设在科大讯飞——一步步扩大公司的护城河。
之所以说科大讯飞更契合商业基本规律,因为这是一目了然的事情:所有布局类chatgpt的玩家,只有它比较明确地开始讲应用讲商业,“1 n”架构的行业应用已经规划好了。“1”是通用认知智能大模型算法研发及高效训练底座平台,“n”是应用于教育、医疗、人机交互、办公、翻译、工业、汽车等多个行业领域的专用大模型版本。例如,通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式ai系统,打造“每个医生的ai诊疗助理,每个人的ai健康助手”。
在中国既能服务企业又能服务用户的科技公司屈指可数。科大讯飞服务c端,不仅指智能硬件销售,还有教育领域学生以年费形式订阅个性化学习手册和英语听说业务等。目前“个册”覆盖1400多所学校,口语业务2022年新增12个地市的中考和2个地市的高考。科大讯飞有可能在医疗等板块打造c端应用的标杆,恰如chatgpt的编程。当然,这是比较乐观的预期。以上,成立于1999年的科大讯飞,风雨兼程之后,终于进入了自己的黄金时代,正成为布局chatgpt玩家里的中坚力量。
chatgpt作为第四次工业革命开始的标志,世界商业秩序正面临剧变,没有人可以置身事外——如果改变世界的那个人/组织不是你,至少要和科大讯飞们站在一起。
文/革鼎(本文仅为作者个人观点,不构成任何投资建议)
编辑/陆佳
本文刊载于《中外凯发官网入口的文化》2023年3期
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn