“我在一年多前找了三拨人,想通过他们找梁文锋(DeepSeek创始人)见面,但都被拒绝了。拒绝见面的理由大概就是,认为我们没有创新精神,道不同不相为谋。”
在“亚洲青年科学家基金项目-上海前沿科学交流会”上,当谈到下一代颠覆创新时,五源资本创始合伙人刘芹,说起了自己的一些投资憾事。
“那我的待遇比你‘好点’,因为芯片算力的缘故,我跟DeepSeek的人有过交流和后续沟通。”作为专注于半导体行业和人工智能领域的投资者,璞华资本管理合伙人陈大同紧接着打趣说道。
在这场聚焦未来产业和青年科学家的活动上,AI大模型技术和DeepSeek,不可避免地成为众人讨论的核心。
1. 投资人的反思
作为中国头部VC的掌舵者,当刘芹说出自己的投资憾事时,投资圈集体“错过”DeepSeek的遗憾情绪,又一次在会场这个狭小场域中弥散开来。
近年来鲜少在公众视野露面的元禾璞华合伙人陈大同,也出席了这场大会并参与对谈。
哪怕跟DeepSeek有过深度沟通,但陈大同依旧认为,作为元禾璞华这类性质的基金,也很难投进DeepSeek,原因是基金和项目模式相差太远,对于目前的风险投资来说,没有产业落地和商业模式的DeepSeek很难成为投资标的。
在陈大同看来,AI将对全球产业产生巨大影响,但当前的资本结构可能无法有效支撑这种颠覆性创新范式,因此他呼吁建立新的资本结构以支持前沿科技的发展。
北极光创投创始管理合伙人邓锋则相对乐观,“我们确实错失了,但也不觉得这个后悔或者难受”。
在邓锋看来,DeepSeek给当下的投资界带来了新的投资判断和评估项目的模式,他认为,科技成果转化应更注重产学研结合,以实现科学、工程与行业的快速迭代,形成闭环。此外将社会资本和政府资本结合起来,探索类似OpenAI的非盈利研究模式,以更容错的方式支持前沿创新,或许能找到更好的创新项目。如果不解决这个问题,可能还会错失下一个DeepSeek。
邓锋看好具有商业思维的青年科学家、早期投资人与企业经验的结合,并指出AI的应用落地、数据获取及与其他垂直领域的结合是未来投资的重点。
2. DeepSeek给AI带来了什么?
有关AI技术本身的讨论,是这场前沿科学交流会的核心议题,其中之一便是推理能力。当人们看着Deepseek是如何拆解问题的,都会相信它是在“深度思考”。
“强化学习让大模型学会思考是自然而然的事,因为技术已经到了临界点。”美国普林斯顿大学人工智能创新中心主任王梦迪说。
在DeepSeek-R1模型问世前,她的团队用4张GPU训练出具备深度思考能力的32B大模型,全球范围内也有许多团队在推动这一进程。在她看来,DeepSeek的出现是一种必然。但在一年前,当王梦迪和朋友探讨此事时,几乎无人相信这一时刻会来得如此之快。
王梦迪认为,AI以一种“世界语”的姿态打破了各学科的“方言”,将原本各学科一点点向前推进的发现整合了起来。当前,AI仍处于学习不同学科“语言”的阶段,AI4S(由AI驱动的科学)将是下一个爆发点。
大模型的进化一直遵循“Scaling laws”定律,即训练数据规模越大,模型性能就会越来越好。随着OpenAI、谷歌在AI模型开发方面陷入瓶颈,越来越人意识到“数据墙”的问题。
“AI未来可能会面临数据瓶颈,尤其是数据收集和清洗的挑战,以及大公司对数据的垄断问题,开源社区需要共同努力解决这些难题。”王梦迪说。
当AI科学家苦于数据不够用,也许能从物理学获得灵感。北京大学博雅特聘教授、2023亚洲青年科学家项目物质科学研究员朱华星表示,物理学其实是一门大数据科学。
他举例说,大型强子对撞机每秒产生4000万次粒子碰撞,受制于存储空间,绝大部分数据被舍弃了。这些原本被舍弃的数据能否成为“喂大”AI的养料呢?公众科学家也许是一种可借鉴的模式,即开源数据,让有兴趣的人一起来研究。
朱华星认为,想要大模型变得和人一样智能,必须赋予其认识世界的能力。这一观点与当下火热的具身智能不谋而合。相较于语料数据,动作数据其实更多,但已采集的却相当有限。全球所有词汇表加起来才1万多个,但动作几乎是无穷的,这也是当下人形机器人发展如此之快的原因。
【本文由投资界合作伙伴财联社授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。
网友评论