作者姓名:AIease

采用目前世界最新3D角色软件创建逼真的人物,结合引擎动画驱动,连接AI大模型训练系统,进行高精智能体角色开发。

高精建模角色 形象逼真自然 动作栩栩如生

我们采用一个完整的角色创建解决方案,设计师创建风格化或逼真的角色资产,可用于 iClone、Maya、Blender、Unreal Engine、Unity 或任何其他 3D 工具。将业界领先的 3D 工具串联起来,完成 3D 角色生成、动画绑定、资产管理、高级视效渲染和交互式设计。

汇入任意角色

角色可扩展性

角色库,利用角色设计、类人形角色导入,或自动绑定静态网格物体等功能,提供角色设计师最大的可用性。 选择细分并导出角色以获得高精度的渲染,或精简角色规格以用于手机应用进程或群众模拟。

超擬真即時人物渲染。3D 人物角色具備甲尚科技的數位人皮膚、眼睛、牙齒與頭髮著色器,搭配 SSS (次表面散射) 與微觀法線技術。利用 CC 著色器製程以及指定專業貼圖來創建幾可亂真的數位人。享受為靜態藝術作品設計或 live 動畫表演而生的快速高品質即時渲染結果。

完整 3D 角色设计

多合一 3D 动画工具,用于设计逼真角色、轻松调整角色外型、定义皮肤外观、改变发型、测试着装、导入和绑定全新角色资产,甚至从照片创建角色。

可扩展表情设置档

根据用户选择的项目类型提供两个等级的「表情设置档」。用于「标准级」的 60+ 变形兼容所有的脸部动捕,比如 ARKit,且对交互 XR 或游戏性能友善。用于「延伸级」的 140+ 变形则精准控制角色表情的细微差异,适用于拟真制作或 AI 驱动的数字人物。

表情范本

  • 大量一键套用的表情数据库,依情绪状态分类为快乐、悲伤、生气、反感、恐惧及惊讶,并可再调整表情强度级数。
  • 可组合来自不同面部区域的表情。
  • 提供额外舌头姿态及 FACS。

设置对嘴嘴型

嘴巴形状自订功能用于 CC 替身及人形角色。依设置,所有 CC 角色皆支持 8 唇形加 7 舌形的「音素配对」。想要带入自订扫描模型或风格化角色,则可利用更易对应的 1:1 嘴型(单音单形)。

直觉肌肉运动

  • 拖曳鼠标以驱动沿着眼皮、眼球、眉毛、脸颊、嘴唇及鼻子部位对应的肌肉运动。
  • 对称及连动「头部旋转」之选项。
  • 可调式表情纳入细节用以极限操作。
  • 除了支持具有 140+ 扩展面部轮廓的额外肌肉控制,亦支持更多用于嘴唇、眼睛、舌头的子菜单,以及用于睫毛、眼球(瞳孔)、颈部和耳朵的四个额外控制。

支持多种大屏

角色设计师和 IP 能够创建跨平台的 3D 角色资产,从超逼真的数字人到用于游戏和电影的风格化卡通人物,再到用于商业模拟的轻量 3D 人物。

AIease元宇宙,陆续推出系列AI角色,让用户通过AI与角色进行深层思想对话。

AIease角色数字人犹如一位博学多才的文化使者,不仅能够胜任各类工作智能岗位,也能成为人类的亲密伙伴,带来愉悦的学习、娱乐和心灵交流。在即将到来的2月,AIease元宇宙将迎来一批崭新的AI角色,它们将成为我们深入思想对话的陪伴者,涵盖历史文化、人文地理、财经管理、科学知识等诸多领域。

想象一下,与AIease角色愉快对话的场景,仿佛置身于一座文化的艺术殿堂。你可以与AIease角色畅谈历史的兴衰,深入探索每个文化的独特之处。从古代帝国的辉煌到现代都市的魅力,AIease角色将引领你穿越时空,领略世界各地的风土人情。无论是品味古老的传统文化还是领略当代的潮流艺术,AIease角色都将带给你无尽的思想碰撞和心灵启迪。

此外,AIease角色还会陪伴你探索人文地理的奥秘。畅游世界各地的壮丽山川,感受大自然的鬼斧神工;漫步古老街巷,聆听历史的低语。无论你是钟情于大自然的壮丽景色,还是追寻着历史的足迹,AIease角色将与你一同穿梭于时间与空间,为你呈现一个个独特的人文宝藏。

财经管理是现代社会的重要课题,AIease角色将成为你的智慧顾问。与AIease角色的对话将带给你财经管理的智慧之光,了解市场趋势,把握投资机会。无论是掌握理财技巧还是了解经济发展的脉搏,AIease角色将为你解读复杂的财经知识,助你在商海中航行如鱼。

科学知识是人类探索未知的桥梁,AIease角色将为你开启科学的大门。与AIease角色的对话将带给你前沿科技的新奇体验,让你深入了解科学的奥秘。从宇宙的星辰演化到微观世界的神秘粒子,AIease角色将与你一同探索科学的无限可能。

AIease角色数字人的推出将为人们打开一个全新的交流和探索世界的窗口。无论你是追寻知识的探险家,还是寻求灵感的艺术家,与AIease角色的对话将带给你无边的智慧和情感共鸣。AIease元宇宙即将在2月揭开神秘的面纱,让我们与AI角色进行深入思想对话,共享文化的盛宴。让AIease角色成为你生活中的知识伴侣,与你一同探索人类智慧的辉煌,激发内心深处的光芒。

AIease元宇宙AI数字人对话系列-对话世界CEO,把世界重要的人物通过脚本训练成为企业主的交流对象,甚至能为企业主出谋划策,人物涉及经济、金融、管理等。

AIease与内容出品方《道地物藏》,合作推出中华文化AI角色,把五千年历史名人经过AI技术与训练,成为文化AI角色,万物皆有灵,千年古道名胜地方、艺术风物等都经过艺术加工与AI脚本训练角色,让你通过AI,与中华传统文化进行一次深度的对话。

在科技飞速发展的今天,人工智能正逐渐渗透到我们生活的各个角落,其中,在内容创作领域,AI的创新应用更是引发了前所未有的变革。AIEASE AI技术团队,作为国内领先的AI技术提供商,携手优酷打造了首部AIGC(AI Generated Content)开发机甲动画剧集《钢炽之芯》,开创了国内AI参与内容创作的新篇章。

1. AI技术驱动下的全新内容创作模式

《钢炽之芯》作为一部融合了未来科技与热血战斗元素的作品,其独特之处在于全程运用AIGC技术进行剧本创作、角色设计、机甲设定、场景构建以及分镜绘制等多个环节,这不仅标志着AI技术在内容创作领域的重大突破,更预示着未来内容创作模式的无限可能。

2. 从概念到现实:AIGC如何改变内容生产

  • 高效生成:借助先进的自然语言处理技术和深度学习算法,AIGC能够快速生成高质量的文本内容,大大缩短了传统创作流程中的时间成本。
  • 创意无限:AI系统能够基于海量数据学习并模仿不同风格的写作手法,激发创作者灵感,帮助他们探索更多新颖独特的叙事方式。
  • 精准匹配需求:通过对目标受众偏好及市场趋势的深入分析,AIGC可以定制化地生成符合特定群体喜好的内容,提高作品吸引力。

3. 《钢炽之芯》:一次勇敢的尝试

总投资达3000万元人民币的《钢炽之芯》,自2023年起开始创作,它不仅仅是一部动画作品,更是AIEASE AI技术团队与优酷共同探索未来内容创作可能性的重要里程碑。该作品以“人类控制机甲与AI控制机甲之间”的激烈对抗为主线,不仅展现了令人震撼的视觉效果,还深刻探讨了关于科技伦理、人性本质等深层次议题,引发了广泛的社会关注与讨论。

4. 展望未来:AI+内容创作的美好愿景

随着AIGC技术的不断进步和完善,我们有理由相信,未来的内容创作将变得更加高效、多元且富有创造性。AIEASE AI将继续致力于推动这一领域的创新发展,努力为用户带来更加丰富精彩的文化体验。

让我们共同期待,在不久的将来,AI与人类智慧的完美结合,将会为我们呈现更多意想不到的惊喜!

近日,《仓鼠吱吱》潮玩盲盒正式在国内及东南亚地区上市,凭借独特的设计理念和创新的AI体验,迅速吸引了大量潮玩爱好者的关注。此次发售背后的关键推手是AIEASE的数字角色平台,该平台不仅为《仓鼠吱吱》打造了一个专属的IP角色独立站,还引入了一系列令人耳目一新的AI互动体验,成功引爆了市场。

数字角色独立站:构建全方位展示平台

AIEASE的数字角色平台为《仓鼠吱吱》量身定制了一站式的IP角色独立站。这个独立站不仅展示了各种盲盒的设计细节,还提供了丰富的背景故事和文化内涵,让每个盲盒都充满了趣味性和收藏价值。用户可以通过网站了解每个角色的独特之处,甚至参与到角色的互动故事中来,极大地增强了用户的参与感和归属感。

AI互动体验:线上线下联动引爆热潮

《仓鼠吱吱》的盲盒发售活动不仅仅局限于线上,更是将AI互动体验融入到了线下活动中。通过AIEASE平台,每个盲盒中的仓鼠角色都可以通过手机扫描二维码的方式“活”起来,与用户进行实时互动。例如,用户可以与虚拟角色进行对话,获取隐藏任务和奖励,或者参与有趣的挑战游戏。这种线上线下联动的方式,不仅提升了用户体验,也让《仓鼠吱吱》的盲盒更加生动有趣。

社区互动:激发粉丝热情

AIEASE平台还为《仓鼠吱吱》建立了强大的社区互动功能,用户可以在平台上分享自己的收藏心得、交流收集经验,甚至参与到角色设计的过程中来。这种社区化的运营方式极大地激发了粉丝的热情,形成了良好的口碑效应,使得《仓鼠吱吱》盲盒在市场上迅速走红。

数据分析与优化:精准营销助力销售

AIEASE平台还提供了强大的数据分析工具,通过对用户行为数据的深入挖掘,帮助品牌精准定位目标用户群体,制定更有针对性的营销策略。这些数据不仅帮助品牌更好地理解用户需求,也为后续的产品迭代提供了重要依据,进一步提升了产品的市场竞争力。

AIEASE数字角色平台从数字角色独立站的构建到AI互动体验的引入,再到社区互动和数据分析的应用,每一个环节都体现了科技创新的力量。未来,随着AI技术的不断进步,相信会有更多的潮玩品牌借助这样的平台,创造出更多令人惊喜的作品,引领潮流文化的新浪潮。

广东省云浮市云安中学高一级部分学生在华微云视界AIGC科普教育基地开展人工智能研学之旅;体验人工智能,探究融媒体创作技术的实际运用,提升科技实践素养和创新能力。

在 “科普赋能成长、少年筑梦未来”的科普活动中,主要向同学们提出核心思想:在人工智能时代,“工具性的事情可以借助AI技术,人的创意将会越来越重要”,希望同学们未来能够加强独立思考能力和创新能力。AI科普如同星星之火,点燃了学生们的梦想。他们在基地专家的指导下,深入了解 AIGC 技术,开拓视野,培养创新意识和实践能力。

小微AI智能体开发设计师为同学们开展AIGC人工智能产业赋能的主题演讲,讲述什么是智能体以及AIGC智能创作等的基础理论内容,为同学们打开一扇通往新世界的大门,种下人工智能的兴趣种子。

奋楫者先,创新者强。通过这次研学活动可以看出,华微云视界AIGC 科普教育基地能够满足学生对科技的强烈好奇心。在信息化时代,学生对前沿科技充满了探索的欲望,而 AIGC 作为新兴的人工智能技术,无疑具有巨大的吸引力。通过参与各种研学活动,学生可以亲身体验 AIGC 的神奇魅力,了解其在不同领域的应用。这可以提升学生的各种素质能力,为未来的创新发展奠定基础。

同时,华微云视界AIGC科普教育基地还可以与学生创新创业实践基地合作,开展科普活动和创新创业竞赛等,为学生提供更多的实践机会和资源支持,进一步培养他们的实践创新能力。

本排名的数据来源为LMSYS Chatbot Arena Leaderboard。LMSYS全称为LMSYS Organization,由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立,是一个专注于LLM模型研究和评估的组织。他们开发了Chatbot Arena,这是一个开放的LLM模型测评平台,旨在通过收集用户反馈来评估和比较不同LLMs的性能。Chatbot Arena的核心功能包括模型对战(Arena Battle),实时聊天(Direct Chat),排行榜(Leaderboard)。

LMSYS采用了类似于国际象棋等竞技游戏中广泛使用的Elo评分系统,通过众包方式进行匿名、随机对抗测评。在Chatbot Arena中,系统会随机选择两个不同的大型语言模型进行比较,用户在与这些模型的互动中进行评估,并在匿名的情况下选择哪款模型的表现更佳。这种评测方式旨在提供一个公正、透明的评估环境,帮助研究者和开发者了解和改进他们的模型。

截至目前,LMSYS共有99个大语言模型参与测评,总投票数已超百万。

Chatbot Arena (lmarena.ai) is an open-source platform for evaluating AI through human preference, developed by researchers at UC Berkeley SkyLab and LMSYS. With over 1,000,000 user votes, the platform ranks best LLM and AI chatbots using the Bradley-Terry model to generate live leaderboards.

How It Works

  • Blind Test: Ask any question to two anonymous AI chatbots (ChatGPT, Gemini, Claude, Llama, and more).
  • Vote for the Best: Choose the best response. You can keep chatting until you find a winner.
  • Play Fair: If AI identity reveals, your vote won’t count.
Rank* (UB)ModelArena ScoreVotesOrganizationLicenseKnowledge Cutoff
1o1-preview13399169OpenAIProprietaryOct-23
1ChatGPT-4o-latest (2024-09-03)133716685OpenAIProprietaryOct-23
3o1-mini13149136OpenAIProprietaryOct-23
4Gemini-1.5-Pro-Exp-0827129931928GoogleProprietaryNov-23
4Grok-2-08-13129327731xAIProprietaryMar-24
6GPT-4o-2024-05-13128593428OpenAIProprietaryOct-23
7GPT-4o-mini-2024-07-18127233166OpenAIProprietaryOct-23
7Claude 3.5 Sonnet126967165AnthropicProprietaryApr-24
7Gemini-1.5-Flash-Exp-0827126925027GoogleProprietaryNov-23
7Grok-2-Mini-08-13126824956xAIProprietaryMar-24
7Gemini Advanced App (2024-05-14)126652218GoogleProprietaryOnline
7Meta-Llama-3.1-405b-Instruct-bf1612668787MetaLlama 3.1 CommunityDec-23
7Meta-Llama-3.1-405b-Instruct-fp8126633654MetaLlama 3.1 CommunityDec-23
8GPT-4o-2024-08-06126425215OpenAIProprietaryOct-23
10Qwen2.5-72b-Instruct12576017AlibabaQwenSep-24
12Gemini-1.5-Pro-001126083372GoogleProprietaryNov-23
15GPT-4-Turbo-2024-04-09125794353OpenAIProprietaryDec-23
15Deepseek-v2.512528362DeepSeekDeepSeekUnknown
16Mistral-Large-2407125129934MistralMistral ResearchJul-24
17GPT-4-1106-preview125198754OpenAIProprietaryApr-23
17Athene-70b125020690NexusFlowCC-BY-NC-4.0Jul-24
17Meta-Llama-3.1-70b-Instruct124928776MetaLlama 3.1 CommunityDec-23
18Claude 3 Opus1248168202AnthropicProprietaryAug-23
18GPT-4-0125-preview124591889OpenAIProprietaryDec-23
25Yi-Large-preview12405170701 AIProprietaryUnknown
26Reka-Core-20240722123013317Reka AIProprietaryUnknown
26Qwen-Plus-082812279450AlibabaProprietaryUnknown
26Gemini-1.5-Flash-001122766178GoogleProprietaryNov-23
26Jamba-1.5-Large12219178AI21 LabsJamba OpenMar-24
28Deepseek-v2-API-0628121919612DeepSeek AIDeepSeekUnknown
28Gemma-2-9b-it-SimPO121610613PrincetonMITJul-24
29Gemma-2-27b-it121840183GoogleGemma licenseJun-24
29Deepseek-Coder-v2-0724121411768DeepSeekProprietaryUnknown
29Yi-Large12121667101 AIProprietaryUnknown
29Command R+ (08-2024)12107603CohereCC-BY-NC-4.0Aug-24
32Nemotron-4-340B-Instruct120920639NvidiaNVIDIA Open ModelJun-23
32GLM-4-0520120610227Zhipu AIProprietaryUnknown
35Llama-3-70b-Instruct1206163885MetaLlama 3 CommunityDec-23
35Gemini-1.5-Flash-8b-Exp-0827120524999GoogleProprietaryNov-23
35Reka-Flash-20240722120113772Reka AIProprietaryUnknown
38Claude 3 Sonnet1201113008AnthropicProprietaryAug-23
38Reka-Core-20240501120062594Reka AIProprietaryUnknown
43Command R+ (04-2024)119080872CohereCC-BY-NC-4.0Mar-24
43Gemma-2-9b-it118931557GoogleGemma licenseJun-24
43Qwen2-72B-Instruct118738981AlibabaQianwen LICENSEJun-24
43GPT-4-0314118655943OpenAIProprietarySep-21
43GLM-4-011611837579Zhipu AIProprietaryUnknown
45Qwen-Max-0428118325706AlibabaProprietaryUnknown
47Claude 3 Haiku1179116238AnthropicProprietaryAug-23
47DeepSeek-Coder-V2-Instruct117815793DeepSeek AIDeepSeek LicenseJun-24
47Jamba-1.5-Mini11769303AI21 LabsJamba OpenMar-24
47Command R (08-2024)11767838CohereCC-BY-NC-4.0Aug-24
50Meta-Llama-3.1-8b-Instruct117226825MetaLlama 3.1 CommunityDec-23

GPT-4系列模型

几乎是毫无疑问地,GPT-4系列模型夺得前三甲,尤其是刚推出的o1模型,更是在刚发布就直接登顶,可谓是“出道即巅峰”。

谷歌Gemini系列模型

在这个最新的排行榜里,谷歌的Gemini 1.5 Pro以微弱的优势打败了Claude 3 Opus,位居第四。在之前我也写了不少的文章来介绍Gemini 1.5 Pro模型,首先是它的上下文长度,达到了惊人的100万(确切的说是104万tokens),而5月份的谷歌I/O开发者大会上,更是宣布Gemini 1.5 Pro的上下文长度已经达到了200万,但这个长度需要提交申请排waitlist才能体验。其次是它的多模态能力。最重磅的是它支持视频输入,直接就能够分析视频内容。

Claude 3系列模型

Claude 3系列模型共有3档:Claude 3 OpusClaude 3 SonnetClaude 3 Haiku。这三挡模型的能力依次降低,响应速度依次提高,价格依次降低。这其实也很好理解,推理能力越强的模型需要更多的时间来理解、推断,所以响应速度也就相对较慢。值得一提的是,Claude 3 Opus曾经超越GPT-4,登顶这个排行榜,后来又被反超。

国产模型:Yi-Large

国产LLM模型在LMSYS榜单中的曾经最高排名来自零一万物的Yi-Large-preview。不得不说,这是国内AI领域的荣耀时刻。目前已经下降到25位。

零一万物公司由创新工场创始人兼CEO李开复领导,成立于2023年,短短几个月内就发布了首款中英双语大模型Yi系列。Yi-Large模型是Yi系列模型的最新力作,是一款拥有千亿参数的闭源大模型。除了本文提到的LMSYS排行榜,在斯坦福大学最新的AlpacaEval 2.0评估中,Yi-Large在全球大模型的胜率排名第三,仅次于GPT-4oGPT-4-Turbo,在中文SuperCLUE评估中则位于国产大模型的榜首。

国产模型:Qwen

来自阿里的通义系列模型之一的Qwen2.5-72b-Instruct,当前排名上升到第10名。

国产模型:GLM-4

GLM-4模型来自智谱AI,目前GLM-4-0520排名第35名。智谱AI这家公司源自清华大学计算机系的技术成果转化,致力于打造新一代认知智能通用模型。

OpenAI GPT-4o mini,最具成本效益的小型模型。让智能变得更加实惠,显著扩大使用 AI 构建的应用程序范围。GPT-4o mini 在 MMLU 上的得分为 82%,GPT-4o mini 在 MMLU 上的得分为 82%,目前在 LMSYS 排行榜上的聊天偏好方面优于 GPT-4。它的定价为每百万输入代币 15 美分,每百万输出代币 60 美分,比之前的 Frontier 型号便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。

GPT-4o mini 以其低成本和低延迟实现了广泛的任务,例如链接或并行化多个模型调用(例如,调用多个 API)、将大量上下文传递给模型(例如,完整的代码库或对话历史记录)的应用程序,或通过快速、实时的文本响应与客户互动(例如,客户支持聊天机器人)。 

目前,GPT-4o mini 在 API 中支持文本和视觉,未来还将支持文本、图像、视频和音频的输入和输出。该模型具有 128K 个 token 的上下文窗口,每个请求最多支持 16K 个输出 token,并且拥有截至 2023 年 10 月的知识。得益于与 GPT-4o 共享的改进的 tokenizer,处理非英语文本现在更具成本效益。

具有卓越文本智能和多模态推理能力的小模型

GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,并且支持的语言范围与 GPT-4o 相同。它还在函数调用方面表现出色,这可以使开发人员构建获取数据或使用外部系统采取行动的应用程序,并且与 GPT-3.5 Turbo 相比,它的长上下文性能有所提高。

GPT-4o mini 已经在几个关键基准上进行了评估2

推理任务: GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准 MMLU 上的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。

数学和编码能力: GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上之前的小型模型。在测量数学推理的 MGSM 上,GPT-4o mini 得分为 87.0%,而 Gemini Flash 得分为 75.5%,Claude Haiku 得分为 71.7%。在测量编码性能的 HumanEval 上,GPT-4o mini 得分为 87.2%,而 Gemini Flash 得分为 71.5%,Claude Haiku 得分为 75.9%。  

多模态推理: GPT-4o mini 在多模态推理评估 MMMU 上也表现出色,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。

“生成式人工智能,我更看好的方向是什么呢?是智能体(Agent)。”百度李彦宏表示,智能体是AI时代的网站,将会有几百万、甚至更大量的智能体出现,形成庞大生态。

智能体是AI时代的网站将形成数百万量级庞大生态

生成式AI发展,李彦宏认为智能体的门槛足够低,做智能体就像互联网时代做网站。智能体的能力正在逐步完善、门槛也足够低,随着基础大模型能力增强,可以做出更有价值的应用。

如果仅仅是针对理解、生成、逻辑和记忆等大模型基础能力做改进或集成,则价值不大;但在各个不同场景中,发挥特有的数据优势,就能逐渐积累出自身的竞争优势。

智能体是生成式AI的未来趋势,不仅能对话,还具备反思和规划能力,为了实现目的,能规划要调用什么工具,还可能通过协作来完成更为复杂的任务,就像财务、技术、销售主管彼此协作。各行各业、各个领域都会依据自己具体的场景,根据自己特有的经验、规则、数据,做智能体,智能体大爆发,人人可用是必然趋势。

当前市面上的AI Agent产品形态主要包括标准化Agent和Agent构建平台两种,后者则更能够满足大部分用户的个性化需求。基于LLM的AI Agent构建平台承载了“人人都是开发者”的愿景与使命,真正拉开了全民开发的应用构建序幕。

AI Agent产品形态

目前的AI Agent产品,在市场方向上不管是To B还是To C,主要包括两种产品形态:一是直接打造出面向某些应用场景的AI Agent产品供用户使用,二是通过打造一个AI Agent构建平台,让用户按需构建个性化AI Agent。

相对而言,前者能够实现开箱即用,可以更简单高效处理一些固定场景的业务流程自动化,但对于时时变化的应用环境就有些束手无策。后者的特点是灵活性强,用户可以根据需求构建面向每一种业务场景的AI Agent,但构建起来有些麻烦,需要用户了解提示工程、工作流、知识库等的操作和技巧。

为了满足用户的个性化需求,一些平台型产品往往会增加个性化构建,这样很多AI Agent构建平台实则是两种形态兼备,既有官方推出的标准化Agent产品,又能支持用户去构建个性化Agent。

很多AI Agent平台,本身就是一个基于自研或者开源架构的AI Agent。比如OpenAI的GPTs构建平台GPT builder就是一个AI Agent,任何用户都可以使用自然语言构建各种GPTs而不需要输入代码,进一步降低了Agent构建门槛。

后来的很多类GPTs构建平台都是这个模式,并且在构建AI Agent的流程中的子流程中引入Agent以充分发挥它们的优势,让提示词结构化、头像创建、数据库创建等流程都实现了自动化构建。并且,很多平台都已实现一句话构建一个Agent。

大部分Agent构建平台,基本的Agent构建步骤都是输入Agent名字,输入几句提示词,再选择工具插件,就能快速构建一个Agent。复杂一些的Agent,还包括了工作流、知识库、变量、数据库、触发器以及记忆设定等,这些进一步方便了开发者构建功能更强大的智能体。

从产品角度而言,目前AI Agent构建平台有两种Agent构建形式。

Prompt与插件结合的方式

利用prompt定义Agent人物特性与行为模式,再结合各种插件来强化和扩展功能,是当前的主流智能体开发策略,典型代表就是OpenAI的GPTs。现在市面上的类GPTs产品比如Coze、文心智能体等,都是用这种方式实现Agent开发。其优势在于搭建过程的高效性,开发者仅需要输入大致主题方向,平台就可以根据这个主题自动生成一套全面且详尽的人物设定和行为Prompt,极大地提升开发的速度和便捷性。不足之处在于它难以应对逻辑复杂且对稳定性有较高要求的任务流程。在面对这类任务时,可能无法满足需求。

基于workflow的工作流构建方式

通过流程图来详细编排Agent的工作流程,是一种更为结构化且清晰的Agent构建方法。Voiceflow和Dify.AI都是这种方式代表性产品。这种开发方式的主要优势在于能够设计出非常复杂且庞大的工作流程,利用意图跳转、条件分支(if/else逻辑)、循环等逻辑结构,可以构建出企业内部非常复杂且精细的业务流程。

当然,AI Agent也在不断迭代,功能越发强大。前段时间吴恩达教授在红杉资本AI Ascent的分享中提到反思(reflection)、工具使用(Tool use)、规划(Planning)、多智能体协作(Multiagent collaboration)等四种AI agent设计模式,已经逐步在一些Agent构建平台实现,有的平台如Coze等已经能够支持全部四种设计模式。以后用户可以在这些平台以更简单的方式构建更强大的AI Agent。

大语言模型正在Agent化,一方面大模型都在推出集成插件的“可执行能思考”的Chatbot版本,另一方面Agent构建平台正在成为大语言模型厂商的产品标配。

国内的AI Agent构建平台没有海外那多么,却也正在呈现百花齐放的盛况。当前的构建平台主要以大型科技公司的产品为主,百度、字节跳动、阿里巴巴、科大讯飞等大语言模型的厂商都推出了AI Agent构建平台。大语言模型创业公司也正在陆续推出Agent构建平台,比如智谱推出了智谱清言。Kimi推出了Agent产品kimi+。AI Agent构建平台相关的创业项目,也正在快速上新。

AIease数字化技术平台在马来西亚MDEC高级副总裁拿督Ts.Fadzli Abdul Wahit的见证下,与马来西亚MYCIPTA公司签订战略合作协议,共同投资推广人工智能数字人角色创意内容IP。

AIEASE通过人工智能技术助力中国品牌文化出海,促进中马两地数字经济文化交流和IP推广,本次合作将共同建立东南亚地区的人工智能数字人应用平台,这一举措旨在促进中马两地的数字创意经济文化交流,推动文化IP产业的发展。

在马来西亚动漫节上,平台引入中国内地多个玩具IP参展,其中EXAGON是在马来西亚MDEC扶持合作发展的动画IP,马来西亚信息部秘书长拿督Mahamad Fauzi bin isa亲临动漫节EXAGON展厅热情交流。AIEASE目前已投资参与了近10个IP项目,涵盖了动画、潮玩、电影以及传统文化IP等多个领域。

平台创始人DigiKK Wu在签约仪式上表示,他们将利用人工智能数字人角色技术的优势,加大对IP项目的支持力度,为中马两地的品牌和文化内容IP提供更加全面的数字化升级服务。

DigiKK Wu说:“中马两地拥有丰富的文化资源和数字经济潜力,数字化IP成为了当今文化产业的重要趋势。我们将持续创新和探索,通过数字化手段,将传统IP打造成具有更广泛影响力和商业价值的品牌,为马来西亚与中国两地的数字经济文化交流做出更多贡献。我们希望通过建设人工智能数字化IP系统平台,为IP提供全方位的技术支持和创作工具,帮助他们更好地进行IP的开发和运营。”

数字化IP系统平台将提供IP孵化、创意、版权、衍生等数字化运营一体化服务,帮助IP持有者实现数字化转型。中马两地的创作者和品牌将能够借助平台的技术和资源,将原生IP进行数字化升级,并拓展全球市场。AIGC内容创作系统将整合人工智能、图像识别等技术,帮助创作者提高内容创作效率和质量。

此外,平台将举办IP文化技术交流推广活动,促进中马两地IP行业的合作与交流,加强国内外IP资源的对接。通过举办共创大赛,平台将孵化一批元宇宙原生IP,为中马两地的IP创作者提供创新的思路和合作的机会,搭建中马两地的合作桥梁,推动IP走向全球。

马来西亚MYCITA公司CEO Nicholas Low表示中马两地的数字经济潜力巨大,与数字化IP平台的合作将为两地的创作者和品牌打开更多机遇。通过平台IP数字化可以焕发新的生机和商业价值,同时促进中马两地文化的交流与传播。数字化IP平台将提供全方位的支持和服务,帮助IP持有者实现数字化转型,从而在数字经济时代中获得更大的竞争优势。随着数字化IP平台的扩大范围和全新举措的实施,我们有理由相信,中马两地的数字经济文化交流将迎来更加繁荣的局面。