【乘云而上 数智AI并行】技术出海沙龙圆满落幕,大咖齐聚探索AIGC新势能
2023 年 4 月 13 日,白鲸技术栈携手亚马逊云科技 & 伊克罗德 &Intel,在北京举办了《乘“云”而上 数智 AI 并行》技术出海沙龙,来自伊克罗德信息科技、亚马逊云科技、英特尔(中国)有限公司、Databricks、荔枝集团、启元世界的多位嘉宾莅临现场,探索如何用数据+人工智能+云技术,构建企业出海新路径。
本次会议,旨在洞察 AIGC 技术带来的行业变革,通过对 AIGC 的场景应用及创新探索,挖掘人工智能与云计算技术相结合的应用和发展趋势,推动人工智能技术在实践中的应用和创新,促进各行业之间的交流与合作,为企业出海之路,助力前行。
亚马逊云服务助力企业创新成长
亚马逊云科技 创新成长及新兴市场事业部主管 Harry Jin / 金景镇
2022 年,Gartner 把 AIGC 判定为目前最有商业前景的人工智能技术,不少从业者把这一技术视为第四次工业革命的推手。然而实际上早在 2010 年,诸如千人千面和用户画像分析等应用场景早已经凸显出 AIGC 的技术能力。到了 2015 年前后,决策式AI更是已经开始在一些商业场景里面得到一些应用。
那么有哪些场景会与 AIGC 或生成式 AI 比较适配的呢?我们可以通过技术实现的成熟度以及行业适用性两个维度来观察。例如 AI 音视频、图文的生成,在近几年就逐渐开始出现一些优质的 App,这几大类型也是目前市场上非常活跃的应用场景,以及我们看到在游戏、社交、电商、WEB3 工具甚至更多领域都已经有商业化的场景。
而亚马逊云科技在 AIGC 领域能做什么?我们知道,这一领域的关键因素之一就是算力,不管是 CPU 资源还是 GPU 资源,不管针对训练还是推理,在算力之上抽离了平台层,它在 AI 工程化上能帮助极快地提高效率。
此外在应用层面上,亚马逊云科技既有端到端应用,帮助大家解决客户端具象问题,同时也有专业的技术模型和通用模型,可以很好地满足企业的需求。不仅于此,亚马逊云科技的全托管机器学习平台 Amazon SageMaker,拥有非常丰富的合作资源,可以在工程化上帮助大家节省时间,提高效率,也可以在服务层上提供很多开箱即用的 SaaS 产品。
数据驱动 AIGC 助力企业创新暨行业场景应用分享
伊克罗德 解决方案架构师 Jack Jin / 晋鑫宇
根据 Gartner 披露的“人工智能技术成熟度曲线”,生成式 AI 仍处于萌芽期,但其广阔的应用场景和巨大需求空间吸引着大量资本和技术投入,预计将在 2-5 年 内实现规模化应用,包括影视、娱乐、传媒、电商和其他的教育、工业、医疗、金融等等,都有可能获得 AIGC 的技术红利。
从应用方向来看,AI 生成文字、AI 生成图片、AI 生成音频和 AI 生成视频或将成为先行者。文字生成如写邮件、写广告、剧本和小说,类似广告、营销的文案生成等等都可以完成;图片生成有虚拟形象、人脸、背景替换、图片上色等等;音频方面则聚焦在作曲、编曲,或者电影配乐、游戏配乐方面。
说了这么多,那么 AIGC 技术有哪些优势或劣势是值得注意的呢?先说说不足之处,一是内容质量,尚且无法完全交由 AI 来把控;二是在法律和伦理方面,难以保证生成的内容不会侵权或违法;三是安全风险方面,容易被犯罪分子利用进行诈骗。
再说到优势,AIGC 非常高效,可以在短短几分钟之内帮你生成作品。另外,可以根据用户需实现定制化的内容生成。另外,AIGC 拥有更强的创新性和拓展性,你可以基于 AI 技术在更大的方向去进行创新,也可以根据初步想法来通过AI技术去输出具体的作品。
最后分享一个案例,某 AI 研发公司在伊克罗德的帮助下设计了一套基于 S3 数字湖仓的架构,在短时间内 DAU 增长了百倍左右,而且从数据接收到数据处理,再到自由入库,时间缩短到了小于 1 分钟的时间,他们批处理时间运行时间也是缩短 80% 左右,在他们不改变开发技术前提下,成本也降低了 50%。
AIGC 在游戏行业的应用
启元世界 战略总监 王思捷
AIGC 如何应用在游戏领域?我们可以从 AI 策划,AI 陪玩,还有陪聊 NPC 三个部分来展开。首先是 AI 策划,其实是利用深度学习技术,面向数值维度组合爆炸的复杂场景辅助游戏策划进行高效精准的数值平衡性验证、阵容挖掘、强度评估等工作,从而使得设计周期从月级别缩减到天级别。
如《三国志战略版》和《万国觉醒》等策略类标杆游戏,都采用了启元世界的 AI 数值设计解决方案。另外我们也可以通过 AI 来对三消类游戏关卡进行评估,通过一套闭环评分来辅助创作关卡。
第二类是 AI 陪玩,开发者可以利用先进的模仿学习和强化学习技术,模拟真实人类玩家的操作、策略与团队配合,用于在线陪玩、生态填充、新手教学、智能托管、平衡性验证、自动化测试等场景。其智能性和拟人性远超传统行为树 AI,可大幅提升游戏体验与用户留存。
第三类的 AI 陪聊 NPC 则是通过 AI 技术,并基于人物设定、内在需求、社交关系、性格特点等驱动 NPC 自主与用户完成交流互动并构建出一个开放、自由、沉浸的虚拟世界,从而帮助客户提升研发效率,创新用户体验。
除了以上三种较为常见且成熟的应用场景外,数字人 AI 同样拥有巨大的市场潜力,启元世界自研 AI 多模态交互引擎,能够实现数字人的长期记忆、口型表情、语音合成、开放对话和情绪识别等功能,全面提升虚拟角色、虚拟主播、虚拟偶像、虚拟陪伴等数字人内容和交互体验。
Databricks Lakehouse 助力企业成为数据和 AI 的行业先驱者
Databricks Solutions Architect 卢凌云
如何通过数据分析和AI来提升企业竞争力?在过去很长一段时间,企业想要调取之前的数据,必须通过数据仓库和数据服务,这里会出现一些限制,比如数据必须保存为专有化格式,比如随着数据不断增大,成本会不断增加等等。
尤其是当前大量信息化发展和电子设备产品普及,产生大量的照片、视频、文档等非结构化数据,人们也想通过大数据技术找到这些数据的关系,所以设计了一个比数据仓库还要大的系统,数据湖的概念也由此而来。
而在传统数据仓库在与数据湖系统结合的过程中我们发现,新系统的引入不仅过于复杂,成本不降反涨,而互不兼容的治理和安全模型以及互相脱节并重复的数据孤岛更是难以充分发挥数据、分析和人工智能的所有潜力。
由此,Databricks Lakehouse 提出湖仓一体概念,这是结合了数据湖和数据仓库优势的新范式,在用于数据湖的低成本存储上,实现与数据仓库中类似的数据结构和数据管理功能。采用了云技术的数据湖,意味着数据的存算分离,这样意味着当数据量处理越来越大的时候,成本不断往上叠升,但是计算能力和存储分开的时候可以大大节省成本。
为了实现存算分离,我们提出另外一个概念就是 Delta Lake,它就是开源的表存储层,通过它可以很好地去利用数据湖和数仓优势部分,对于部分的传统数仓,整个性价比可以达到 12 倍提升,也是为什么很多客户会选择 Databricks 的原因。
总的来说,Databricks湖仓一体平台具备了 3 个特性,第一个是 Simple 简易,您的 data warehousing 和 AI 相关业务场景在同一平台实现;第二是 Multicloud 多云,跨云的一致性数据平台,用户可以拥有更大的自主性去选择匹配自己需求的云平台;第三是 Open 开放,建立在开源和开放标准之上,通过 Databricks 的平台大家可以根据自己的业务需求选择最佳的方案,这是我们想要创建的生态概念。
AIGC 和大语言模型技术在音频互动产品中的创新探索
荔枝集团 大数据部总监 刘冶
AIGC 和大语言模型的技术突破,为音频互动产品提供了更多创新的可能性,FM 起家的荔枝对于内容分析和推荐、搜索等核心功能用着更深入的研究。例如通过 UGC 平台搜集到大量用户提交的音频数据信息,实现用户和音频之间的匹配,并对音频数据分发,这也是整个 App 内容的最关键环节。
那么 AI 技术落地到音频领域,有哪些应用场景呢?一个是风险控制,另外是关于用户关系的知识图谱构建。荔枝集团基于传统的风险标签、规则引擎灯架构,增加了 AI 算法和风控模型,在注册登录、用户支付、营销活动等场景进行业务风控。
在另一方面,荔枝集团将图仓技术跟用户画像挖掘两方面做了深度结合,将业务数据和采集数据他们通过一些分层模型构建一些标签之后,在上层跟用户画像和图的结构去做结合。
再说到 AIGC,荔枝集团在音频识别、音频合成以及大模型三个方面深耕,其中,自然语言处理(NLP)大模型(LLM)是声音聊天 AI 技术框架中最核心的部分。基于音频社交场景的自然语言处理大模型 AI 框架,能够实现生成式预训练大模型(LLM)微调、收集数据并训练奖励模型(RM),并通过强化学习(RL)增强模型能力。
英特尔基于第四代至强可扩展平台上的大数据最新解决方案
英特尔(中国)有限公司 大数据解决方案架构师 任晓蕾
根据 IDC 预测分析,中国大数据市场 2021 年整体规模超过 110 亿美元,且有望在 2025 年超过 250 亿美元,呈现出强劲的增长态势。怎么在大规模的海量数据基础上挖掘出数据价值?无论是企业客户,还是软件开发商客户,都在思索这个问题。
就目前的趋势来看,大数据、数据分析技术架构趋势将朝向云化、无服务器化以及湖仓一体化演进。那么英特尔是如何通过技术赋能数据分析和大数据架构的呢?首先是存算分离的架构部署模式,英特尔基于高速存储介质开发的 DAOS,提供了对象存储接口,可供上层计算集群各个计算引擎调用,也可以采用续机部署,通过 KBS 统一管理。
英特尔针对最新的 Spark on k8s 部署,与业内厂商做了相应 K8s 的优化,在 K8s 整体调度和网络,和对磁盘 IO 优化上有着更大的优势。英特尔可以帮助用户在 K8s 部署上做一些相应优化选型,帮助客户达到一个最佳的实践,一个最优配置的 K8s 部署的计算引擎。
在硬件方面,就不得不提到英特尔硬件平台在今年 1 月份发布的英特尔第四代至强扩展处理器,跟第三代处理器相比,首先是通用广泛平台创新上来说,内存带宽提升了,原来由 DDR4-DDR5,是 1.5 倍的内存带宽速度提升,还提供了高带宽内存 HBM,它可以提升比 DDR5 还要高 2 倍的带宽,这是对于有一些需要高带宽,数据又是非常敏感的类型,像 HPC 的这类软件是非常有用的组件,整体跟上一代产品有 60% 的性能提升。
另外,第四代平台的一个特性——针对不同类型工作负载提供了相应不同加速器提升它的性能,有内置 AI 加速,我们称为英特尔的 AMX 的指令,通过指令对推理性能和训练性能都有相应提升,同时还有类似于英特尔 QAT 技术,能够帮助数据加解压和加解密的性能提升。
对于比较来看,第四代至强如果不采用软件提升,单独从硬件上来说,对于负载可以跟第三代有 48% 的性能提升。如果在这个基础之上,再采用 QAT 去做压缩解压的方式,还可以达到 20% 的性能提升。
白鲸技术栈——白鲸出海旗下子品牌,是一个以内容为驱动、以社区为中心的技术媒体平台,致力于技术相关领域知识的传播,提供架构,云计算,AI,前端,大数据等与技术开发相关的最新技术资讯、解读及技术会议。
如果您也对技术相关内容感兴趣,欢迎关注我们!我们将持续为您带来更多精彩的活动分享。
【本篇文章属于白鲸出海原创,如需转载:需联系授权方可,未经授权严转载!】
友情提醒:白鲸出海目前仅有微信群与QQ群,并无在Telegram等其他社交软件创建群,请白鲸的广大用户、合作伙伴警惕他人冒充我们,向您索要费用、骗取钱财!