2023年7月,Meta发布了类似于ChatGPT的开源人工智能模型Llama 2,供任何人下载和使用,从而颠覆了构建更强大人工智能的竞赛。11月,就有01.AI这家来自北京的初创公司,发布了自己的开源模型。据称该模型的性能优于Llama 2,在许多用来比较人工智能模型力量的排行榜上得分接近榜首。2024年1月22日,之前鲜为人知的人工智能初创公司01.AI又推出了一款名为Yi-VL-34B的“多模式”人工智能模型,可以处理图像并讨论其内容(下图 pandaily/Hugging Face)。
01.AI创立于2023年6月,已从大陆电商巨头阿里巴巴和其他公司筹集了2亿美元的投资,估值超过10亿美元。“这是我整个职业生涯的愿景,”李开复在北京一间公寓里通过Zoom对采访记者说道。“我们学习计算机语言已经太久了——我们真的需要能够理解我们语言的系统,即语音和文本。”在中文中,01.AI被称为“零一万物”, 与汉语中的“灵异万物”谐音,后者源于中国道教《道德经》。李开复表示,他的公司旨在通过构建一些基于语言模型功能的首批“杀手级应用程序”来引领这场革命的下一阶段,这些应用程序可以赚取“零一万物”(01.AI)的健康收入。
李开复希望“零一万物”(01.AI)能激发一批忠实的开发者,帮助其孵化出一些杀手级的人工智能应用程序。由于地缘政治因素,以及资金限制,包括“零一万物”在内的大陆AI公司无法用到算力最强的英伟达GPU芯片。但“零一万物”正探索如何用最少的芯片、最低的成本训练出最好的模型(下图 零一万物)。李认为与“零一万物”相关度更高的是“AI普惠点”,他希望团队成为一个“点燃者”,帮助开发者通过API和Yi系列模型,在电商、社交、娱乐等领域打造出AI时代的淘宝、微信、抖音等。本人就是人工智能专家的李开复以华为为例,说明了这种专注的实践效果。作为中国领先的电信设备制造商,华为利用土耳其IT研究员埃达尔·阿里坎一项不起眼的技术进展,几乎集全公司之力,把他的极化码技术突破商业化。这让华为最终超越了爱立信(Ericsson)等西方较大的竞争对手,并抢占了大部分的5G移动网络市场。
李指出,我们不追求用一百亿美金、一千亿美金去预测AGI的燃点,而要非常努力地节省GPU成本,专注于高效执行。“赢得移动时代胜利的应用程序是那些首先移动的应用程序,比如优步、微信、Instagram、TikTok。“零一万物”(01.AI)的工程师们正在试验不同的“人工智能优先”应用程序,以提高办公效率、创造力和社交媒体。李表示,该计划旨在让他们在全球范围内取得成功,就像中国支持的社交网络TikTok和在线零售商Temu是美国消费者心目中的顶级应用一样。
2024年5月13日,在“零一万物”(01.AI)成立一周年之际,公司 CEO 李开复博士发布全球SOTA千亿参数闭源大模型Yi-Large(下图 澎湃),并同步开放API,允许开发者调用,在此基础上还发布了一站式AI工作平台万知。李开复透露,经测试,Yi-Large评测结果已经至少达到对齐GPT-4,部分指标甚至超越GPT-4。此外,“零一万物”正在训练的基于MoE架构的更大模型Yi-XLarge MoE,目前初步训练结果显示,Yi-XLarge MoE的各个指标都已经超过Yi-Large,将冲击GPT-5的性能与创新性。在通用能力、代码生成、数学推理、指令遵循等多方面,模型指标超越了ChatGPT-4、Google Gemini 1.5等同级模型。
至此“零一万物”(01.AI)与OpenAI等美国公司之间的差距,从去年创立时的八年缩短到现在不到十二个月。
李开复背景
李开复在人工智能领域有着杰出的职业生涯。李开复祖籍四川成都但出生在台湾新北市。自美国田纳西州橡树岭高中毕业后,他先后在哥伦比亚大学和卡耐基梅隆大学学习计算机科学,并获得了博士学位。李开复在卡耐基梅隆大学的博士论文涉及当时处于领先地位的语音识别系统开发,被《商业周刊》授予当年“最重要科学创新奖”。
李开复于1990年加入苹果公司,担任研究科学家,多媒体实验室主任,互动多媒体部全球副总裁。1996年李开复转到SiliconGraphics,担任互联网部门副总裁兼总经理、Cosmo软件公司总裁。1998年李开复到中国大陆,帮助建立了微软亚洲研究院。李曾任微软公司自然交互式软件及服务部门副总裁,和微软全球副总裁。2005年,李开复转为谷歌工作,担任谷歌全球副总裁兼中国搜索业务总裁,2009年离职,在大陆北京创办了自己的投资公司“创新工场”(Sinovation Ventures)。李开复在2018年出版的《人工智能超级大国》一书中就预言,由于中国大陆拥有丰富的人才、数据和用户,大陆的人工智能实验室和公司很快就会与美国的实验室和公司竞争(下图 Medium/YouTube)。当然,他更主张美中合作。
美中人工智能现状
尽管“零一万物”(01.AI)于2024年5月13日发布的SOTA千亿参数闭源大模型Yi-Large对齐GPT-4,部分指标超越GPT-4,且在LMSYS Org发布的Chatbot Arena取得排名第7的成绩,甚至排在谷歌的Bard(Gemini Pro)和Meta的Llama-3-70b之前(下图 LMSYS Chatbot Arena),但它目前在生成人工智能方面还是在追随美国的步伐。乔治华盛顿大学研究中国人工智能场景的助理教授丁杰夫(Jeffrey Ding)表示,尽管中国研究人员已经发布了数十个大型语言模型,但整个行业仍落后于美国。他说:“西方公司在大型语言模型开发方面获得了显著优势,因为他们可以利用公开发布来测试问题,获得用户反馈,并围绕新模型建立兴趣。”而且只有西方,其实就是美国公司,才能拿到算力最强的GPU芯片。据说华为合作中芯已攻克3纳米芯片技术。但只有真正量产出可与媲美英伟达GB200的GPU芯片后,包括“零一万物”(01.AI)在内的大陆AI模型才有机会比肩乃至超越美国公司的AI模型。此外,与美国同行相比,中国人工智能公司还面临着更大的监管和经济阻力。
目前01.AI的零一万物一站式AI工作站万知有微信小程序(wanzhi.com/)和PC网页版。用户通过使用万知既可以阅读海量数据、分析图表和文字,又可以在1-2分钟内生成PPT。01.AI开源地址:Hugginf Face https://huggingface.co/01-ai(下图 01.AI)。
参考资料
Hetzner, C. (2024). Leading China VC Kai-Fu Lee warns an investor reckoning is coming for unprofitable AI companies. FORTUNE. 链接 https://fortune.com/asia/2024/03/27/china-ai-kai-fu-lee-warns-investor-reckoning-unprofitable-ai-companies/
Knight, W. (2024). This Chinese startup is winning the open source AI race. WIRED. 链接 https://www.wired.com/story/chinese-startup-01-ai-is-winning-the-open-source-ai-race/
孟建国, Liu, J. & Metz, C. (2024). 中国“AI大混战”背后:想超越美国,又离不开美国. 纽约时报中文版. 链接 https://cn.nytimes.com/technology/20240222/china-united-states-artificial-intelligence/