旗下微信矩阵:

通义实验室陈颖达:开源,大模型发展的「主旋律」

大家都说2025年是Agent的元年,我们对此的理解是,其核心在于如何基于模型的能力,实现与真实世界更深度的交互。
2025-08-04 09:46 · 投资界     
   

作为中国数字经济的领跑者,杭州汇聚了一批具有全球影响力的开源领军企业,加速打造具有全球影响力的创新策源地、全国科技成果转移转化首选地、发展新质生产力的重要阵地。

2025年7月31日,由杭州市金融投资集团有限公司、杭州市国有资本投资运营有限公司、杭州银行股份有限公司联合主办的“第三届杭州产投融生态大会”在杭州举办。大会以“厚植开源生态·共赴数智新程”为主题,汇聚数字领域优秀企业与投资机构代表交流协作,共同推动构建更具活力、开放共赢的开源产业生态体系。

会上,通义实验室陈颖达发表了《开源赋能,从技术共享到产业创新跃迁》主题演讲。

from clipboard

以下为演讲实录,

经投资界(ID:pedaily2012)编辑:

尊敬的各位领导、各位嘉宾:

很高兴今天来到这里跟大家分享通义实验室正在做的事情,对于模型开源共享以及协助产业创新的一些思考。

我分享的内容可能更偏向技术,由于我们团队本身专注于模型研发及开源社区的建设,技术属性更为突出。今天到场聆听了多位专家的分享,发现大家的共识高度一致:当前,大模型的发展已切实渗透到千行百业,无论是金融、电力,还是医疗等不同领域。

从技术角度来看,过去三年间,模型的发展可谓突飞猛进、日新月异。随着算力与数据的爆发式增长,加之过往模型技术方面的创新,更多产业知识得以被更有效地整合到模型当中,而模型通过对这些知识的处理与反馈,进一步推动了各行业新型应用范式的落地。

过去三年里,以 Transformer 为代表的新型模型架构不断发展,让我们切实看到了通用人工智能实现的可能性。大约两年多以前,以 ChatGPT 的出现为标志,文本大语言模型的出现使得模型结构能够非常有效的通过上万亿token的训练,高效地从文本中提取并精炼知识到大模型里,使得大模型具备了强大的任务泛化能力。在此基础上,我们见证了包括千问、LLama等一系列模型的问世,文本模型也成为了本轮大模型发展的起点与引领者。

在此基础上,过去一年多时间里,以DeepSeek R1为代表的思维链模型在文本模型的基础上实现了进一步突破。而这类模型通过思维链推理的方式,能够更高效地完成复杂任务的推理过程,并在认知层面具备了更强的记忆能力。不过,这类模型大多仍局限于文本模态的研究范畴。客观来讲,我们所处的世界本质上是多模态的——人类对世界的认知与理解,离不开对图像、视觉及语音等多维度信息的理解。因此,当文本大模型的发展范式相对成熟后,多模态大模型应运而生。因此,当下以GPT-4o为代表的多模态模型相继问世,大幅提升了我们对多模态信息的理解能力与生成能力。

那么,我们应如何使模型与世界建立联结,并让它更有效地运用工具来增强对世界的理解与交互能力?

大家都说2025年是Agent的元年,我们对此的理解是,其核心在于如何基于模型的能力,实现与真实世界更深度的交互。这也正是我们推动 Agent 能力发展的目标 —— 让模型能够更广泛地触达各行各业。

与此同时,我们也观察到下一代模型技术正持续演进,包括自我学习机制的完善以及模型的自我迭代能力优化。需要强调的是,这些技术的发展并非呈现完全的序列性特征,它们更像是一波波相继涌现的浪潮,而非“前浪就把后浪拍在沙滩上”的逻辑。事实上,当前所有技术的发展浪潮均在持续推进:尽管我们目前已开始探索模型的自我持续学习与Agent技术,但文本模型作为本轮大模型发展的“始作俑者“,它的影响力依然强劲,持续推动着整个技术浪潮的演进。这也正是当下我们认为实现通用人工智能的可行路径。在这条路径上,目前在很多领域的应用层面已具备落地的可能性。

在这一发展路径中,大模型的演进离不开开源模型所做出的贡献。无论是千问、DeepSeek,还是国外的Llama等模型,其开源模式均为广大开发者与产业应用者提供了便捷获取模型的渠道,这对于推动模型技术的发展及产业落地而言,是至关重要的一环。

具体而言,我们始终认为开源开放是技术发展的“主旋律”。从传统软件、大数据平台到人工智能领域的发展历程,历史一次次证明,开源开放的生态体系能够有效促进技术的迭代与进步。在我们看来,开源开放之所以能帮助大模型发展,关键在于以下几点:

首先,开源模式能让全球范围内更多优秀人才参与模型开发,进而推动模型技术的突破。当前,大模型领域无论是模型技术还是配套工程技术,呈现出极高的人才密度,这在很大程度上得益于开源降低了参与门槛,使得更多人能够投身其中,共同推动生态的强大。

其次,开源有效降低企业使用模型的门槛。基于开放、透明的特性,开源模型能够让企业以更安全、可控的方式进行应用。这促使具备产业背景的开发者与应用人员能够快速将模型落地到具体产业场景中,使开源模型在产业链中真正实现价值,而非仅停留在技术层面或学术研究的“象牙塔”内。唯有开发者生态与产业生态结合,开源模型的价值才能够充分释放。

基于此,通义实验室一直都采用开源开放的生态态度。通义大模型从2023年8月起启动开源,相关资源通过ModelScope、Hugging Face及GitHub等多个平台实现全面开放。2023年至今,实验室持续推进全系列模型的开源进程。其中,通义实验室研发的通义千问主要聚焦于文本及多模态模型领域;通义万相则专注于AIGC生成类的视频与图像生成模型。在过去两三年间,这些模型的开源工作均在持续推进。此外,通义的语音等系列模型也已逐步向开源社区开放。

经过两年多的发展,以通义千问模型为例,其开源模型已成长为全球规模最大的开源模型家族。在Hugging Face及各开发者论坛中,始终在各类技术榜单与讨论区保持高热度,全球下载量已突破4亿次。随之而来,这些被下载的模型经各行业开发者应用于实际业务场景,并结合具体业务需求完成定制化开发。据统计,基于千问衍生的开源模型已超14万个(该数据仅包含基于千问开发且已开源的模型)。我们有理由相信,还有更多基于千问家族训练的模型已被直接应用于实际业务场景中。

两个月前,我们完成通义Qwen3系列的开源工作。在过去一周内,团队几乎以日更的高强度节奏推出新的开源模型版本。Qwen3模型是目前通义全系列中覆盖范围最广的模型,不仅包含不同参数尺度与技术方案,还支持Dance模型及混合专家模型等架构。同时,该模型兼容全球100余种语言,在全球范围内备受好评。针对当前Agent技术、工具能力及MCP生态的对接需求,千问团队对模型的Agent能力进行了专项定制与优化,使得Qwen3模型在Agent开发、编程工具适配等场景中均能实现良好的兼容性。

在视觉生成领域,我们同样开源了万相模型。该模型于2025年开源,当时版本为万相2.1;本周,我们已将其更新至最新的万相2.2版本。万相模型基于Transformer架构研发,能够更精准地理解时空关系与视觉信息,具备图像生成、视频生成及视频编辑等一系列功能。万相模型已成为备受开发者青睐模型。

此外,在开源模型的实践中,我们认识到:模型的价值并非仅通过开源即可完全释放,更非简单发布模型 checkpoint 就能确保开发者顺利应用。事实上,开源模型要实现高效的开发者赋能,是一项系统性工程,这落地离不开生态体系与社区力量。

基于此,我们在两年多前推出了魔搭社区(ModelScope)。截至目前,该社区已快速成长为中国最具影响力的开源社区之一,托管了超过8万个高质量开源模型。这些模型不仅包括通义系列,还涵盖了DeepSeek、千问、混元、Kimi等众多主流模型,许多模型都在魔搭社区实现了首发或同步发布。今天的魔搭,已服务了超过1800万来自全球各地的AI开发者。

魔搭社区的核心价值不仅在于为开发者提供便捷的模型获取渠道,更在于构建了一套覆盖模型全生命周期的工具链——从模型获取、训练、推理到评估的全流程均配备相应支持工具。我们希望通过魔搭社区及生态的完善,推动开发者真正将模型应用于实践,而非仅停留在获取checkpoint的阶段;更希望借助这些工具链与生态资源,助力模型深度落地到千行百业的实际产业场景中。目前,我们已观察到大量基于开源基础大模型的衍生模型在魔搭社区持续涌现,在并魔搭上不断产生了衍生。

除魔搭社区外,我们还提供了云上大模型服务平台,支持开发者基于模型进行应用开发,并将解决方案托管于云端。无论开源模型或是闭源模型,要实现向业务场景的渗透,云服务都是不可或缺的支撑环节。

当前,大模型的应用已渗透至千行百业。不止能“帮助人、愉悦人、赋能人”,模型正切实改变着千行百业形态。而对于部分行业,我们作为技术从业者或许未能完全洞悉其深层逻辑,但令人欣慰的是,模型开源后,从业者可依托自身的行业知识,构建出全新的应用场景,甚至是我们未曾设想过的创新应用——这正是模型开源所蕴含的巨大价值。

在模型研发与应用的实践中,我们深刻认识到云与AI的融合具有不可分割的内在联系。当前模型的落地应用离不开算力的支撑,更依赖云服务的弹性扩展能力。在布局模型生态时,我们始终将云与AI视为有机整体。阿里云跟通义作为全球非常稀有的,同时具备整个非常成熟的云的底座以及开源模型技术的公司。我们认为在传统的IaaS与PaaS层中,模型已成为一种全新的生产要素,能够以标准化、可扩展的方式被千行百业所运用。MaaS生态,将成为助力大模型在千行百业实现深度落地的重要范式。而任何范式构建都非空中楼阁,必须依赖坚实的底层基础设施作为支撑。这也正是我们坚信“云+AI”模式能够有效助力模型应用落地的核心逻辑。

我今天的分享就到这里,谢谢大家!

本文来源投资界,原文:https://news.pedaily.cn/202508/553114.shtml

【本文为投资界原创,网页转载须在文首注明来源投资界(微信公众号ID:PEdaily2012)及作者名字。微信转载,须在微信原文评论区联系授权。违规转载必究责。】