已经实现百亿参数规模的模型内测。
(资料图片仅供参考)
作者 | 衡宇来源 | 量子位(ID:QbitAI)
谁是中国最具竞争力的大模型创业梦之队?
零一万物。
没错,至少从今天开始,这个名字将开启被关注、被讨论、被追踪的新阶段。
原因无他——这就是李开复博士“撸起袖子”亲自带队,塔尖孵化的AI2.0公司。今年3月下旬,创新工场董事长兼CEO李开复正式宣布以Project AI2.0之名入局大模型……而零一万物,正是这家创业公司的正式公司名,官网01.AI也在今日一并上线。
量子位获悉,在近3个月的筹办后,零一万物也有了一系列进展,包括:
公司:总部注册于北京,但面向全球招募顶尖人才。
路线:自研大模型。自建平台,构建数千卡GPU集群进行训练、调优和推理,提高数据有效参数量,以及使用的高质量数据的密度,以构建连续、可控、科学化的训练能力。
进展:三个月内已经实现百亿参数规模的模型内测,正往300到700亿参数规模扩大。
据悉,短短3个月内,零一万物已经聚集起了数十名核心成员的团队,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。其中已加入的联创团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁,算法和产品团队背景均来自国内外大厂。
从25年前回国创办微软亚洲研究院开始,开复老师就成为中国计算机产业里最知名的导师和伯乐,客观上助推了中国互联网和AI的发展历程。
现如今,站在大模型汹涌关口、AI2.0潮头,曾经的学生、旧部和仰慕者再次追随集结。
零一万物是李开复创办的创新工场AI工程院塔尖孵化的第七家公司。这种特殊打法将用基金投资和塔尖孵化两个途径结合,加速打造AI 2.0的全新创业生态。
01
零一万物,自研通用大模型
公开工商资料显示,北京零一万物科技有限公司 (以下简称零一万物)于5月16日成立,彼时距离李开复朋友圈官宣亲自入局大模型创业,恰是2个月时间。
“零一万物”作何解释?
零一不难理解,计算机的底层规则二进制,01就是工程师的母语。但量子位进一步听闻,在开复看来,零一——01还代表的是整个数字世界,从零到一,乃至宇宙万物,所谓道生一……生万物,寓意 “零一智能,万物赋能” 的雄心。
工商信息还显示,零一万物的经营范围涵盖人工智能双创服务平台、人工智能基础资源与技术平台、工程和技术研究和试验发展、数据处理服务等。
这个范围也与开复关于AI2.0的思考判断一以贯之,在ChatGPT带动大模型热潮之后,李开复就公开表示过,以基座大模型为突破的AI 2.0时代,将掀起技术、平台到应用多个层面的革命。如同Windows带动了PC普及,Android催生了移动互联网的生态,AI2.0将诞生比移动互联网大十倍的平台机会,将把既有的软件、使用界面和应用重写一次,也将诞生新一批AI-first的应用,并催生由AI主导的商业模式。
更多零一万物的业务细节也对外披露:
理念就是AI-first,驱动力是技术愿景,背靠卓越的中国工程底蕴,突破点是基座大模型,覆盖范围包含技术、平台到应用多个层面。
更具体的,零一万物选择的大模型创业路线,是自研大模型。
并且已经拉开序幕——这家公司已经开始搭建实验平台,构建了个数千卡GPU集群,进行训练、调优和推理。在数据方面,主打一个提高有效参数量和使用的高质量数据密度。
从喊话到露面,这3个月里,零一万物已经实现了百亿参数规模的模型内测,正往300-700亿参数规模扩大,未来还计划推出开源的模型版本。
据悉,通用大模型后,零一万物的下一步是推出结合图片、视频、3D的多模态模型。
入口级的Super App也是计划中的一部分,平台中间件和开发者工具也将逐步对外发布。
同时曝出的,还有零一万物在AI 2.0时代的“七大模块技术路线”。
简而言之,零一万物认为要做出大模型平台,需要招募七大方向的顶级科学家和工程师,分别是:
定义模型能力天花板的预训练框架(Pre-train)技术
精进模型实现能力的 Post-train技术
支撑模型高效训练的 AI Infra技术
更多元化多介质的多模态模型技术
实践训练规模化技术
平台中间件及工具链技术
推理和服务部署技术
基于这7个技术模块,零一万物针对性招募了技术团队。
量子位获悉,该团队目前已经有数十名核心成员就位,算法和产品团队背景均来自国内外大厂,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。
有精兵也有强将,从已确认加入的联创团队阵容来看,颇有“AI 2.0梦之队”的味道:
前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁……
可以说,核心团队深度参与过世界最大几家软件平台的构建。
02
中国大模型演进分3阶段
塔尖视野才能人尽其用
自开启零一万物的塔尖孵化后,开复老师也开启了紧锣密鼓的筹备模式,十足忙碌,也十足低调。
但量子位也获知了其对于大模型演进的最新思考判断。在李开复看来,中国大语言模型的演进不会一步到位,而是会经历L1到L3三个阶段。
现阶段,中国大多数公司处于L1阶段,下一步需要跨越“涌现”门槛,成为L2级主流大语言模型,最后追赶L3全球一线公司,成为强大的AI 2.0“技术基础设施”,实现高质量、高性能的目标。
而零一万物之所以选择自研大模型之路,核心原因还在于开源模型和小模型的技术实现,绝对无法达到与海外大厂自研模型的性能。
从现阶段实际体验看,许多声称效果类似ChatGPT 的开源模型,都只局限于简单对话,在长文本生成和推理等任务上受到模型本身结构和大小的限制,无法适应稍微泛化或复杂的任务。
此外在零一万物内部,还认定从中长期发展看,过度依赖模型意味着只能知道结果,不掌握过程,“知其然不知其所以然”。自身能力天花板和边界被他人定义,很快会碰到实现多种多样任务的能力天花板。海内外国情、文化、用户习惯、法律法规也不尽相同,海外开源技术随时有关停、切换高额收费或限制地区访问等风险。
只有充分结合中文语言数据,才能实现AI2.0发展自主可控。
不过,零一万物方面也透露,未来也计划推出开源的模型版本,吸引优秀人才共同提升模型,推动全球AI 2.0的开发者生态。因此,大模型创业公司应该拥抱开源,但不能过度依赖于开源模型。只有尽快建立自己的技术优势,构建起强大的生态护城河,才能真正抓住AI2.0的历史机遇。
李开复认为,大模型公司的多元化,会催生一波从AI 2.0模型、AI 2.0基础设施、到AI 2.0全新应用的创新生态,“我们预测一旦中国有了真正原生、高质量的大模型推出,高质量和有创意的应用会百花齐放——就宛如移动互联网和AI 1.0时代一样。”
全球市场上将出现少数几家具有丰沛资源支撑算力需求的大模型公司,带动各种下游应用的繁荣发展,逐步完善中国AI 2.0的全新生态,探索崭新的商业模式,进而创造巨大的经济价值及社会价值。“如果市场风平浪静或只有少数玩家,那我们才真的需要担心落于人后。”
李开复还认为,AI2.0市场规模巨大,容纳得下巨头、中小企业、初创公司在三个层级的公司赛马。
但“大模型的技术门槛很高,非常需要整合一个兼具科研能力和开发实力的高效团队,制定贯彻公司的技术和产品战略,从上到下一致执行。”
客观来看,中国现在研发突破也许落后几年,但擅长技术迭代且具极其优异的工程能力和执行速度,未来可期。和大厂相比,技术顶尖、能专注掌握大模型打法的创业公司有着集中资源、策略灵活、能打硬仗、落地执行力强等优点,反而更有机会领跑行业,正如ChatGPT背后的OpenAI公司一样。
而这或许也是李开复选择亲自入局、塔尖孵化零一万物的最核心原因——自研大模型底座的创业,不仅需要技术、人才,更需要塔尖资源整合和塔尖认知视野。
也只有李开复本人躬身入局,零一万物才显得如此不同。在众多的创新梯队中,零一万物具有显著优势和竞争特色。李开复拥有逾40年国际AI经验,亲自牵头筹组,全球范围的顶级AI专家陆续加入,目前组成的核心团队深度参与过世界最大几家软件平台的构建,深度理解平台成功的方法论。
“AI是对人类学习历程的阐释,对人类思维过程的量化,对人类行为的澄清,以及对人类智能的理解… AI是人类认识并理解自己的最后一里路,我希望加入到这个全新绽放、充满前景的未来科学领域”。
这是1983年李开复攻读卡内基梅隆大学博士学位的申请信。作为人工智能领域的先驱者之一,40年来,他始终活跃在人工智能科研和产业一线。
1998年,李开复创立微软中国研究院(微软亚研MSRA前身),已成为中国培养人工智能人才最多、输出人才质量最高的“AI学府”。当时的青年才俊们,如今仍在人工智能大潮中熠熠生辉。
也正是这种经历时间检验的成绩,让李开复博士逐渐成为了口口相传的AI先导,也正是这种经历时间检验的成绩,让更多对AI 2.0和AGI充满信仰的年轻工程师响应号召,在技术时代浪潮中抓住机遇,改变世界。
*免责声明:本文章为作者独立观点,不代表i黑马立场。
扫码加入黑马创业者交流群
↓↓↓
扫描下方二维码
加入黑马AIGC产业营
读懂AIGC底层逻辑,一步接入产业未来
↓↓↓
分享、赞和在看,完成三连击,把好的内容传递给更多需要的人。
更多精彩内容,尽在i黑马视频号
↓↓↓
关注黑马传播矩阵,get更多精彩内容
↓↓↓