“风起于青萍之末,浪成于微澜之间,AI立于模型之上。”
大模型的出现,正在开启着国内新一轮AI热潮。
某种程度上,当下真正决定AI企业成败的,是能否尽早实现“技术+场景”的双轮驱动。
以最近大火的大模型为例,在很多人看来,OpenAI成功的关键因素之一,正是他们在GPT-3.5模型的基础上,找到了对话机器人这个交互形式简单,且能快速积累用户真实数据的超级场景,跑通了数据飞轮。
在国内,为尽早实现“双轮驱动”,企业们也是“八仙过海,各显神通”。既有百度、阿里巴巴等大厂借助自身成熟的场景生态跑通模型数据飞轮,也有王慧文、王小川等互联网大佬从零做起,一边炼大模型,一边找落地场景。
但与一众大模型浪潮的追逐者不同, 华院计算 一直在致力于算法技术和应用创新。
华院计算成立于2002年,是中国算法技术和应用的探索者。在很长一段时间内,华院计算都在这个领域进行着“苦行僧”一般的修炼,推动数学应用与计算技术发展,聚焦认知智能技术、创新自研底层算法。
近两年来,华院计算在夯实底层技术的同时,为智能制造、数字治理、数字文旅、零售金融 等行业提供AI+行业解决方案、实现技术赋能。
在华院计算背后默默支撑并推动着一切的,正是 华院计算董事长、创始人宣晓华 。宣博士是美国加州大学伯克利分校的数学博士,师从 Smale教授,他还有一系列的“ 平行身份”——他是中国工业应用数学学会副理事长、人工智能专委会委员;复旦大学大数据学院外聘教授、学术委员会委员;斯梅尔数据和计算研究院执行院长。
如今, 大语言模型带来了对人工智能尤其是认知智能的更多关注,宣晓华和华院计算迎来了最好的时代 。
01
当一位数学家决定去创业
1990年的一天,即将博士毕业的宣晓华站在加州大学伯克利分校的萨瑟塔( Tower)上思考着人生下一阶段的去向。
确定的是,他的未来一定与数学有关;不确定的是,走向学术,还是走向产业。
从成长背景看,他似乎应该顺理成章走进学校或实验室,成为一名数学家。毕竟,他的母校美国加州大学伯克利分校曾走出了国际数学大师、微分几何之父、沃尔夫数学奖(数学界的诺贝尔奖)得主陈省身等华人数学家。
但博士期间,宣晓华跟着导师Steven Smale研究计算数学(Computational Mathematics)外,也和美国工业界有了更多接触,这也深刻影响着宣晓华的人生走向。
计算数学主要研究算法和理论,也是工业界迫切需要的一门学科,在电路仿真、航空航天、机械设计等行业都有很大的用武之地。
1997年,宣晓华回国后发现,国内计算数学在产业领域中落地仍然很少。在上海的企业里做了几年技术负责人后,宣晓华有了自己领头发展事业的想法。在选择方向时,他给自己设定了两条边界: 和数学有关;且有商业化市场 。
2002年,怀揣着对中国数学应用的信心,宣晓华于上海创办华院计算。而这种信心来自于宣晓华内心对“万物皆数”理念的信仰。
“万物皆数”是由公元500年前毕达格拉斯学派提出的概念,即世上万物的规律总是由某种数量关系决定的。
当年的宣晓华认为:“在企业里面,数据量越来越多。而这个时候,如果有一家公司能够帮助企业把数据变成价值、增加收入,还能帮助决策,这样的业务应该是可以做的。”
但现实却是,当时没有太多人具备数据意识。公司前十年很难开拓市场,但通过向中国移动提供数据挖掘服务, 能够维系生存。尽管如此,他始终保持对算法研究和算法应用的兴趣和信心,不断探索数据智能的可行路径。
后来, 大数据和人工智能在中国迅速被受到关注和重视, 华院计算进入了快速发展期。
如今,AI大模型的出现让人工智能尤其是认知智能更受关注,华院计算也迎来了更好的舞台。
02
未来十年的人工智能产业落地:
大模型和小模型并存时代
ChatGPT让基于大数据、大算力的大模型爆火。
在宣晓华看来,GPT这类大模型之所以能有如此排山倒海之势,正是因为它具备了一定的认知能力,接触到了认知智能。
认知智能是以研究认知原理为目标的技术科学,让机器具备面向真实世界进行感知,理解、推理、规划、决策、情感等能力。
但大模型并不是实现认知智能的唯一路径。
大模型智能涌现有一个基础大前提,就是用海量数据“喂养”模型。但在产业落地过程中,很多场景并没有足够的数据可用。“尤其在工业领域,涉及到制造工艺、专利科技相关的环节,数据量十分有限。”宣晓华表示。
这就需要 以行业为驱动的小数据算法模型 。
对此,宣晓华强调,华院计算当然是一家基于大数据技术的企业,华院也训练大型语言模型,但华院一直在探索真正实现认知智能的方式。
人类自身具备的两种学习方式启发着宣晓华—— 人既能够通过大量经验、数据来学习,也能够以少量数据为基础,用推理的方式学习 。 前者是“数据驱动”,后者是“知识驱动”。
在大模型的浪潮下,人工智能早期推崇的符号计算看似正在被历史抛弃,但宣晓华却认为,其实不然。毕竟, 大模型不是万能的,在产业落地中存在很大制约 。
通用大模型,如闭源的ChatGPT、开源的LLaMA等,利用超大规模的数据进行训练。但真实业务场景中,例如在工业领域的表面质量缺陷检测场景中,由于有缺陷的图像数据很稀缺, 仅凭目前大模型的训练方法远不能解决实际问题。
因此,宣晓华认为, 未来AI企业的商业模式,是将大数据驱动的通用大模型和以知识驱动的面向垂直行业的小数据模型相融合,实现双轮驱动 。
具体来看,就是将领域中的知识,专家经验,机理模型等与数据进行整合,建立系统化的模型,用于支持各种决策和问题解决, 以构建一个更完整、准确、可靠的决策和运行系统,从而帮助企业提高决策能力和效能。
这个判断在业内已经有一定的共识度。智源研究院副院长、总工程师林咏华曾在一次分享中提到,从产业落地角度来看, “大模型+提示学习”无法代替一切 。
林咏华进一步表示, 对精度要求高、对泛化能力要求低的窄域场景更合适“小模型+迁移学习”的范式 。 比如工业检测、工业质检、医疗影像分析等等。
过去二十年,宣晓华带领华院计算做了大量算法领域的基础研究,十分注重小数据学习, 以及知识和数据融合的学习过程和算法,并试图让每一套算法的运行逻辑有更强的可解释性和鲁棒性。
时至今日,华院计算已经在二十年的技术与产业探索中,摸索到了一条有效的企业运作模式。
03
“1+X”模式打通学术与产业边界
目前,华院计算已经形成了“1+X”模式,实现技术与产业落地的双轮驱动。
拆分来看,“1”为算法实验室,包括斯梅尔数学和计算研究院和认知智能研究中心。在人工智能领域, 华院计算当前技术路径更加侧重 知识与数据融合 等新一代人工智能前沿技术研究和方法创新。
“X”则代表通用平台结合行业专家知识实现的落地应用。在多年的积淀下,算法实验室已经自研认知智能引擎通用平台,并形成五大通用技术能力,覆盖从底层算法模型到AI平台工具再到行业应用场景。
目前,华院计算重点关注“两个半”产业场景——首先是以钢铁冶金行业为主的智能制造领域 。 宣晓华认为,钢铁、有⾊,稀土等工业⾏业是大数据模型和小数据模型相结合的很好落地场景。华院计算认知智能引擎有很大发挥空间。
过去两年,华院计算基于对工业生产场景的深入理解,秉承算法和应用场景相结合的技术路线,依托自身在智能算法领域的核心技术和创新优势,围绕整个特色产业链对配料、质量管控、能源管理、安全管理及智慧工厂等场景进行布局,帮助打造工业大脑和实现智能制造。
其次 数字治理领域 。 华院计算聚焦用数字化和人工智能帮助基层政府高效管理、发展经济,实现乡村振兴。同时利用法律大数据和认知模型,赋能基层干部更好快速解决老百姓的问题。
剩下的“半个”场景,则是当下火热的 AIGC及数字文化应用 。
与前两个场景不同的是, 智能制造和数字治理更多是业务场景驱动的技术落地;而AIGC则是在技术成熟后,衍生出的新兴场景 。 目前,华院计算自研的生成式AI模型已具备人像驱动、情绪表达、文本生成以及基于领域型知识图谱的多轮对话等能力,实现了文本、语音到视频的自动输出,可提供虚拟分身定制、智能视频生成、知识分享,虚拟直播等一站式解决方案并开始落地。
未来,华院计算也将继续拓宽业务边界,探索 AI+新药发现领域 。 DeepMind开发的Alphafold已经在蛋白质预测领域有了里程碑式的成绩,但开发人类健康所需的药物浩如烟海,依然需要更多维度的人工智能技术来辅助开发者缩短新药研发周期。
如果跳出企业运作范畴来看,“1+X”模式背后,实则是一个深埋于宣晓华心底数年的朴素愿望—— 把算法和应用结合起来,帮助各行各业解决实际问题 。 这也是华院计算的DNA。
一方面,在宣晓华的影响下,整个华院计算都对算法有着长期的热爱,在商业化之余,算法实验室也在多年来始终保留着学术研究;另一方面,华院计算一直有强烈的意愿,利用算法帮助行业解决实际问题。
某种程度上,宣晓华和华院计算对当下的中国乃至世界而言,是一个不可或缺的角色。
回望人工智能发展历史,在很长一段时间内,数学家都缺席人工智能的前沿领域,更多是计算机科学家主导研发方向。
在宣晓华看来,计算机科学家更注重结果导向,创新算法并进行工程优化,ChatGPT正是计算机科学家的一次完美实践。而数学家追求对算法原理的本质理解和分析, 将会使算法更具可解释性,优化得更简单可靠。
如今,中国各个产业都进入了数字化、智能化转型升级的深水区,传统产业的细枝末节越发渴求先进技术的滋养。从这一点上说,华院计算正在和时代进行一场双向奔赴。而宣晓华,正是站在时代交替处的一位引路人。