作者|杨逍
编辑|苏建勋
智能体是近期以来最受关注的概念之一。
它可以成为个人助手,直接帮用户制定旅行计划,定外卖等;也可以成为企业助手,完成软件开发、制定招聘、拟定合同等工作,而不同的场景需要不同的智能体。
DeepWisdom成立于2019年,专注于AI Infra的开发及商业落地。智能体会带来全新的用户体验,带来重塑所有流量的机会。这意味着提供一个智能体社会的完整Stack(架构),并且提供智能体服务有巨大的市场空间。DeepWisdom希望通过搭建AgentStack(智能体底层架构),让智能体成为普遍意义的高级物种,组成智能体社会,形成新的人机协同的新范式,解放社会更多工作力。
构建智能体社区思路
DeepWisdom此前主要研究AI Infra。AI Infra将构成智能体运行的内核。它可以提供调度、编排、计算、存储、网络等Infra能力、也可以提供对前端、后台、数据、ML、LLM的aPaaS能力、甚至可以提供一个标准库,让智能体能够调用现实世界的大部分API。当智能体有了这些能力,它就在理论上实现全能。
但理论上的全能并不意味着它实际全能,这是因为代码的撰写是困难的,面对庞大的API,智能体很难正确调用。
MetaGPT便是为了解决这个问题。
MetaGPT是一个多智能体开源框架,主要用于解决大模型落地应用问题,它可以通过模拟软件公司多角色,输出产品设计、架构图、代码repo等内容。它将会完成编程的自动化,完整利用AgentOS能力,完成Agent的大规模生产
在DeepWisdom创始人兼CEO吴承霖看来,智能体(AI AGENGT)将会是下一个时代的入口。而过往的经历为推动AI Agent的开发奠定了基础。
智能体由LLM+观察+思考+行动+记忆等构成。多智能体则需要由Agent +环境+SOP+评审+路由+订阅+经济等不同的维度构成和协同,才能构建出一个可以互动的虚拟社区。智能体可以执行长程任务,可以提高效率,为人类减负。
智能体的关键在于SOP。MetaGPT的原理并不复杂。人类世界有两类代码,一类是针对机器的“代码”,一类是针对人类的SOP,并且有公式 Code = SOP(Team)。以往一个科技公司可以基于SOP,驱动人类团队生产代码,但如果将公式中Team的组成从人类换成智能体,就会发现大部分的工作都可以交给智能体做。
不同场景需要不同的角色,需要不同的技能,也就需要不同的智能体。这些智能体之间,也会存在大量的互动。200多年前就有了分工的概念,而分工带来职业,职业带来专业化和不同的sop技能。Sop是不同工种技能的关键,能让每一个智能体扮演一个特定角色。
智能体Stack
DeepWisdom创始人兼CEO吴承霖表示,目前共有1200多种职业,技能有19900种,而80%的职业会暴露在大语言模型面前,如根据语言类和大语言模型的评分,编程工作的暴露度在63.4,而调研员、交易员、数据分析师等工作的暴露度在100%。
这意味着,这些工种有足够多的数据来生成Agent,现实世界所有的职业都可以被建模成智能体,并且智能体能成为一个标准化的集群。
吴承霖认为,MetaGPT中最难的工作是智能体和大语言模型相关设计,和如何做好抽象和框架,DeepWisdom设计的代码精巧性较高,且框架设计简洁。
与AI应用层框架不同,DeepWisdom注重智能体本身的标准化,将标准化操作程序(Sops)编码作为提示,可以很好地解决幻觉问题,来推动多个智能体的发展。
吴承霖认为,最核心的智能体只需要十几个,在有了底层的基础后,可以结合不同角度的知识,生成更多的智能体。
而在SOP上,智能体可以扮演一定的角色,SOP能赋予职业技能,编程可以构成不同的SOP。公司需要的是完善不同的SOP,构建出不同的智能体。
吴承霖表示,在过去几个月,我们的开源社区活跃量一直领先,是开源社区中增长最快的社区,社区中有来自全球各地的顶级工程师,一起贡献和生成不同的智能体社区。
如就在10月,MetaGPT在GitHub上已经收获了3万颗星星,星星数是受关注度的指标。在开源项目star history的官网中可以看到,近期,MetaGPT的关注度呈陡然上升的情况,其关注度远高于同类的智能体框架。
多个智能体的星星数曲线
近期,MetaGPT在开源社区举办的Mini Hackathon中,有3个团队分别仅用了3周时间,基于MetaGPT框架实现了Minecraft、狼人杀、斯坦福虚拟小镇等游戏智能体的复刻。这里面就有UC Berkeley、Northwestern University、墨尔本大学、香港大学、北京大学等多个学校学生,和腾讯、阿里、智谱等多家公司工程师的贡献。
这些顶级人才将帮助更高效、快速地推动智能体的丰富和完善,甚至许多智能体的SOP也由这些工程师构建。
在吴承霖看来,要想达到这样一个多智能体的虚拟社区,开源框架需要完成200多件事,而DeepWisdom已经完成了其中的80件,且完成了最重要的“实现智能体的思考策略”。
在他们的构想里,未来,不同的智能体可以在虚拟空间中组成社区,且如软件工程师智能体还可以自行生成智能体。不同的智能体之间可以互相打分,让智能体不断自行优化。
目前,DeepWisdom共有60多位员工。DeepWisdom创始人兼CEO吴承霖曾主导设计和实现了十亿级用户的大模型推荐系统、搜索引擎、自然语言理解等多个顶级项目,获得NeurIPS 2个世界冠军。