刚刚,李开复最快独角兽诞生:零一万物估值超70亿
发布时间:2024-05-18 | 发布者: 东东工作室 | 浏览次数: 次(原标题:刚刚,李开复最快独角兽诞生:零一万物估值超70亿)
最新大模型独角兽诞生了。
今天(11月6日),由李开复创办的AI公司零一万物,正式发布了首款开源中英双语大模型“Yi”。投资界获悉,零一万物新一轮融资由阿里云领投,估值已超10亿美元,跻身AI 2.0 独角兽行列。
创投圈对李开复并不陌生。计算机科学家出身,他的职业生涯起步于硅谷,先后任职于微软、谷歌等,后来创立了创新工场,以投资AI为人熟知。今年初,李开复宣布筹组零一万物,历经5个月时间,零一万物团队在今天现场亮相,大牛云集。
至此,AI公司融资一浪接一浪。仅仅过去一个月,智谱AI宣布今年累计获得超25亿人民币融资;王小川的百川智能也宣布完成3亿美元融资.....投资人用脚投票,几乎所有局中人都笃信:这是一张通往未来的船票。
李开复带队,又一AI独角兽
揭开神秘面纱
今天交流会上,李开复率队发布了Yi系列模型。
据悉,Yi系列模型包含34B和6B两个版本。两者的区别在于,Yi-6B适合个人及研究用途,而Yi-34B已经具备大模型涌现能力,适合发挥于多元场景,满足开源社区的刚性需求。两者目前都已开放免费商用申请。
其中,Yi-34B数据参数量达到340亿,可支持200K超长上下文窗口,可以处理约40万汉字超长文本输入,是目前全球最长版本。
相比之下,OpenAI的GPT-4上下文窗口只有32K,文字处理量约2.5万字。稍早前,由王小川创办的百川智能发布Baichuan2-192K大模型,其上下文窗口长度达192K,一度成为全球最长的上下文窗口。仅仅过去一周,这一记录再次被刷新。
为何在这一领域的竞争如此激烈?实际上,上下文窗口长度是大模型的核心技术之一。通俗来讲,上下文窗口越大,窗口所能容纳的信息就越多,从而可以结合更多上下文内容获取更丰富的语义信息,不仅生成的信息准确度更高,而且应用范围更为广泛。
所以,如何把上下文窗口做得更大,成为各家公司比拼的战场。而Yi-34B的突破,相当于能一次处理两本《三体》小说、理解超过1000页的PDF文档等场景,将成为首家将超长上下文窗口在开源社区开放的大模型公司。
另一个突破则在于训练成本大幅降低。零一万物给出一组数据:Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达50%。
截止目前,Yi系列模型已在 Hugging Face、ModelScope、GitHub 三大全球开源社区平台正式上线,同时开放商用申请。这也是创立至今不到8个月时间里,零一万物交出的第一份答卷。
那么,背后是一支怎样的团队?
早在今年3月,李开复宣布创业时,便亲自下场抢人:“在全球范围号召世界级人才”。今天的发布会上,零一万物团队首度亮相
团队成员中,技术副总裁及AI Alignment负责人是 Google Bard/Assistant 早期核心成员,主导或参与了从 Bert、LaMDA 到大模型在多轮对话、个人助理、AI Agent 等多个方向的研究和工程落地;首席架构师曾在Google Brain与Jeff Dean、Samy Bengio等合作,为TensorFlow的核心创始成员之一。
而算法和模型团队成员中,有论文曾被GPT-4引用的算法大拿,有获得过微软内部研究大奖的优秀研究员,曾获得过阿里CEO特别奖的超级工程师。总计在ICLR、NeurIPS、CVPR、ICCV等知名学术会议上发表过大模型相关学术论文100余篇。
作为主力战将之一,零一万物技术副总裁及 Pretrain 负责人黄文灏、技术副总裁及AI Infra负责人戴宗宏今天也正式亮相,并对最新产品进行介绍。此前,黄文灏曾先后任职于微软亚洲研究院和智源研究院;戴宗宏则是前华为云 AI CTO 及技术创新部长、前阿里达摩院 AI Infra 总监。
团队集结,融资也正在到位。投资界获悉,零一万物已完成新一轮融资,由阿里云领投,估值已超10亿美元。李开复透露,在完成 Yi-34B 预训练的同时,目前零一万物已经启动下一个千亿参数模型的训练。
AI公司
最近排队宣布融资
放眼一级市场,AI大模型赛道没有最火只有更火。
就在刚刚过去的10月,智谱AI宣布今年累计获得超25亿人民币融资,投资方阵容豪华,囊括了社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构及包括君联资本在内的部分老股东跟投。
这是一家从清华实验室走出来的大模型公司,身后集结了一群清华大牛CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与了孵化。
无独有偶,百川智能也宣布完成3亿美元A1轮融资,阿里、腾讯再度联手,小米也参投了本轮融资,公司跻身科技独角兽行列,创下国内大模型初创企业最快晋升独角兽的记录。此外,深创投、基石资本、红点中国、卓源资本、顺为资本等知名机构也纷纷参与。
百川智能的创始人,王小川。1996年,王小川被点招入清华大学计算机系,研究生毕业后便加入搜狐。从搜狐到搜狗,王小川在互联网时代留下了不少记忆。直到今年4月,他官宣自己的大模型创业之旅,旨在打造中国版OpenAI。
还有大模型初创公司月之暗面由清华大学交叉信息学院、智源青年科学家杨植麟教授领衔,两位联合创始人周昕宇和吴育昕也均出身清华。投资界获悉,公司已获得红杉、今日资本、砺思资本、真格基金等知名机构近20亿元投资。
几乎同一时间,九章云极DataCanvas也宣布完成总融资额3亿元D1轮融资。中国电子集团旗下中电智慧基金、华民投、中国太平旗下太平创新、浙江东方旗下东方嘉富等央国企旗下投资机构,以及卓源资本等专注人工智能赛道的知名财务投资机构参与本轮融资。
稍早前的6月份,消息传出,聚焦通用大模型的中国AI创企MiniMax接近完成规模超2.5亿美元的一轮融资,估值有望达到近12亿美元。MiniMax的最新一轮融资吸引到新的投资方,出现腾讯的身影。此前,MiniMax的融资中吸引到米哈游、云启资本、明势资本等。这也是大模型浪潮以来,腾讯被曝光的首次投资出手。
从目前来看,今年AI领域清华系几乎一骑绝尘,出身清华的创始人排队宣布融资;与此同时,自上海交大、中国科大的AI创业者同样十分活跃,大家共同缔造了AI江湖热闹一幕。
创投圈最火爆的一幕
今年一级市场格外冷清,但AI融资轰轰烈烈。为何大家似乎都奋不顾身?
稍早前,君联资本总裁李家庆分享:“人工智能产业处于快速发展阶段,商业化场景正从实验室走向产业化生产,人工智能技术将实现从感知智能到认知智能的新突破,在科技情报、虚拟数字人等领域,基于认知智能搭建的行业通用平台市场空间巨大。”
他判断,“大模型+大算力”是迈向通用人工智能的可行路径,未来基于大模型形成的变革性AI产业基础设施将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术。
而顺为合伙人程天也表示:“随着数字化和智能化时代的到来,生成式 AI 通用模型逐渐成为新一轮科技创新的焦点。模型之于现代科技产品,犹如核心技术的‘心脏’,承载着信息处理和智能决策的重要功能。”
“AI 2.0是有史以来最大的科技革命。”正如李开复坚信,它带来的改变世界的最大机会一定是平台和技术,正如PC时代的微软Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是ToC应用。
与此同时,AI的战火已在城市中蔓延开来北京、上海、深圳等超一线城市全面发力,争抢之势跃然纸上。可以看到,由ChatGPT掀起的AI浪潮正席卷全球,没有人愿意错过这场科技盛宴。
回想半年前,王兴曾在朋友圈留下一句,“AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。”言外之意,那是一个未知且崭新的世界。
路漫漫其修远兮,吾将上下而求索。用投资人的话来说,中国需要诞生自己的OpenAI,也终将诞生属于自己的OpenAI。而在这条未知路上,一批批来自不同背景的国产AI军团,从四面八方赶来,共同投身到这场历史洪流之中。
转载请标注:东东工作室——刚刚,李开复最快独角兽诞生:零一万物估值超70亿