白鲸出海—让中国互联网服务世界
{{user_info.user_name}}
您当前是白鲸会员
开通VIP,享受更多服务
会员到期时间:{{user_info.expire_date*1000 | formatDatebyDay}}
合作查看次数: {{users_vip_equities.view_cooperation || 0}}次
合作发布次数: {{users_vip_equities.release_cooperation || 0}}次
公司查看次数: {{users_vip_equities.view_company || 0}}次
榜单下载次数: {{users_vip_equities.download_rank || 0}}次
报告下载次数: {{users_vip_equities.download_book || 0}}次
鲸币数量:{{user_info.jingbi}}
发布
当前位置:白鲸出海 > 资讯 > 正文

解锁AI应用落地的全新范式,一文带你了解大模型时代下的新玩法

ice  • 

2023 年 8 月 25 日,白鲸技术栈携手百道数据共同举办【大模型时代,企业如何重构 AI 应用落地范式】线下活动,百道数据 Looker 专家 Google Cloud 认证架构师徐秀峰、白海科技创始人&CEO 卢亿雷、宜创(北京)科技有限公司创始人 CEO 宜博参会并上台分享。

驾驭巨变:企业高效落地大模型的策略与实践

白海科技创始人兼 CEO 卢亿雷

图片1.png

截至今年 7 月,国内已经有超过 120 家发布过大模型的企业,就目前的生态来看,大部分的大语言模型,都是基于 Transformer 架构来做的,因此如果大家想自研大模型,也建议在 Transformer 生态上完成。

作为行业企业,如果想完成大模型的研发,我们需要考虑几个问题:首先是安全,包括数据的安全以及模型本身的安全可控;其次是准确,处理问答的准确性还需要保证领域实际应用的有效性;第三是低门槛,包括微调技术和操作的低门槛化以及启动和模型迭代的低成本化。

图片2.png

一般来说,我们会把大模型应用分为商业化通用大语言模型和领域专属的大语言模型,可以简单地理解为通用版本和私人定制版本。前者适用性广,类似于行业通用的基础百科全书。后者更符合垂类场景需求,质量比通用大模型更高,属于领域内的专精专家。

那么企业基于基础模型构建专属私有可控大模型,会遇到哪些问题?我们可以大致分为数据、流程、性能、启动和迭代 5 个层面上的挑战。而白海科技基于 IDP LM 的大模型的微调和专属大模型构建能力,可以有效帮助企业解决境地大模型的研发和应用门槛。

简单来说,白海科技通过海量的数据源以及开源预训练基础大模型为基础,形成了白海预训练基础模型,再加上白海科技 IDP LM 平台中的数据标注、预处理、预训练以及内置的 RLHF 训练流程,为企业客户打造专属可控大模型。

数据预处理方面,IDP LM 沉淀了便捷的清洗、增强、反馈数据审核等工具。在模型构建初步完成后,IDP LM 可提供机器评估和人工评估的完善评估体系,同时可以根据不同行业需求提供领域专属能力评估,如医疗领域对问诊交互、智能诊断、检查、检验推荐、智能开⽅等专业能力的评估。

图片3.png

在本次会议上,嘉宾首次公布了白海科技营销传播预训练大模型——IMC-GPT,为营销行业多模态提供模块化积木式一体化解决方案。如果你想了解更多详细功能,欢迎联系我们。

GPT 时代的底层逻辑和创业机会

宜创科技创始人 宜博

图片4.png

未来人与AI的合作模式大概可以分为 3 种模式,第一种模式是 AI Embedded 模式,人把流程全部做完,只有一个阶段用 AI 的能力,挂一个知识库或向量查询。第二种模式叫 AI Copilot,在一个对话框里不停聊天,叫副驾驶员。第三种是 AI Agent,翻译是智能体,它有两种模式,由人类给出指令,AI 自己分解。

图片5.png

而大模型 LLM 时代的开发范式,我们同样可以分为四个层面。首先是最基础的算力层,提供算力支持。第二是模型层,这里主要指基础模型层。然后是中间层,中间层分为两部分,跟模型层结合的微调的中间层,还有跟应用层结合的中间层。最后是应用层。

ChatGPT4 发布以后,成为全世界增长最快的应用,其根本原因在于这项应用的出现印证了泛人工智能的价值。在此之前,大众对 AI 的理解停留在一个 AI 只能做一个事。而在 2017 年 Transformer 论文发布以后,我们发现原来 Transformer 是可以做多任务的。

2019 年,ChatGPT2 面世,到了 ChatGPT3,把模型从 1.5B 扩展到 170B,AI 领域也实现了从量变到质变的转化,即 AI 的涌现能力。

大模型时代开发底层逻辑中最常用的涌现能力有哪些?

第一,翻译。ChatGPT3 可以翻译 100 多种语言,ChatGPT4 可以翻译世界上所有语言;

第二,数学。外挂了数学计算机或专家模型的 ChatGPT4 模型,拥有着强大的数学能力;

第三,上下文学习。比如一道乘法题,你告诉它 12 乘 12,第一步,12 乘 10,第二步,12 乘 2,再相加。给它一个例子,然后再问它,13 乘 13 是多少,它就会算了,这就叫上下文学习能力;

第四,思维链;

第五,知识融合。从两个不相关的知识图谱中总结出答案;

第六,情绪感知。通过对数据模型的总结模仿人类的情绪。

从大模型的应用场景来看,嘉宾认为,要做没有大模型人类以前做不到的场景,要做有了大模型比现有方案提高 10 倍价值的场景,这才是技术价值的最大化。那么我们有哪些创新或者说创业机会呢?

例如泛化的文本对话:以前用小度音箱,都是定义好的,你问啥答啥,然达 90% 的话。它接不住。你现在可以让它做决策扮演、可以写代码。

向量处理:以前建知识库,问题是什么,答案是什么,要写得很准确,现在不需要了,现在可以直接问问题了。也就是如何通过更好的搜索,获得以前搜不到的价值。所以做客服机器人,做知识库机器人,都可以用大数据模型。

AI Agent:全自动化的代理机器人。

在 Google Cloud 上玩转 AIGC

百道数据 Looker 专家 Google Cloud 认证架构师徐秀峰

图片6.png

作为业内领先的云管理服务商,百道数据已经取得谷歌云的最高级别代理——谷歌云 Premier 级别,公司所有的研发人员,都具备 Google 的资质认证,公司也具备 GCP、PSO 相关认证。

据介绍,目前百道数据服务于 200 多家客户,其中不乏国内知名企业品牌。针对不同行业的客户形成了 SaaS 化的产品平台。同时针对不同云平台的用户,百道数据也推出了多云运营管理平台以及云管理服务能力 MSP 服务。

图片7.png

自 1997 年 Google 发布了 Google Search 以来,目前平台 10 种云产品都已拥有超 10 亿的用户,而针对这些标杆产品的不同场景,Google 也早已开始尝试将不同的 AI 能力融入。事实上,早在 2017 年 Google 就推出了 Transformer,这也是所有大语言模型的鼻祖,直到 2022 年,Google 又推出了 PaLM,2023 年推出了 PaLM 第二代——PaLM2,并针对企业级用户和普通用户的不同需求,推出了两款产品:Bard、Generative AI。

Bard 相当于 ChatGPT,根据问题生成回答。Vertex AI 相当于 AIGC 平台,从数据收集到训练、模型选择,一直到端到端的快速发布,都可以在上面实现。二者最大的区别在于数据的归属权,Vertex AI 的数据完全属于自己,能够保证企业数据处于强可控范围内。

目前 Google 的 AIGC 平台提供了六种基础模型。分别是生成文本、绘画、代码、Image、对话、音频和视频。其中,Stable Diffusion 作为一款AI图像生成产品,不仅已经具备了生产及使用能力,并且 Stable Diffusion 生成的数据属于自己,也就是没有版权,生成的内容可以用于自己的商业。

图片8.png

值得一提的是,Stable Diffusion 的主要功能——文生图,即根据提示词自动生成图片。此外还有图片的二次加工、局部重绘等功能。为了便于用户使用,它使用了前端框架,生成一个前 UI 界面,这样让不懂得 API 调用的普通用户很方便地使用 SD 进行出图。

为了保证生成图片的可控性,Stable Diffusion 搭载了 ControINet 插件,可以从的图片整体的轮廓、样貌、表情、细节等元素进行调整,保证生成图片的效果。而另一个功能——多种骨架姿态,则可以同时生成同一个人物不同角度的图片。

Stable Diffusion 的另外一个重要功能就是模型训练功能。它里面有 Lora 和 Dreambooth,通过 Lora 训练,把大模型没有的素材,比如把企业的素材通过训练生成自有的模型集。

很多企业会关注成本问题,首先百道数据采取的部署形式是基于 GKE 产品,即 Google Cloud 托管的 K8S 容器化产品。在成本方面,GKE 采用了分时 GPU 技术。将物理的 GPU 拆分成多个逻辑的  GPU,有多个不同的 POD 去分时竞争 GPU,从而提高 GPU 的利用率。并且可以基于 GPU 的使用率进行弹性伸缩。

同时百道数据在架构里使用 Spot 节点,有很多机器空闲时,GCP 会把这一部分机器以比较低的折扣出售,客户通过抢占的方式获得机器,从而实现节省成本的目标。

受篇幅所限,难以完全展示每位嘉宾的观点分享,如果你想了解更多关于 AI 大模型的内容,欢迎继续关注我们。


【本篇文章属于白鲸出海原创,如需转载:1、网站端请注明出处,并在文章中附带白鲸出海原文链接。2、微信公号及其他自媒体平台需联系授权方可,未经授权严禁转载!】

友情提醒:白鲸出海目前仅有微信群与QQ群,并无在Telegram等其他社交软件创建群,请白鲸的广大用户、合作伙伴警惕他人冒充我们,向您索要费用、骗取钱财!


分享文章

扫一扫 在手机阅读、分享本文

36683
{{votes}}
分享文章

扫一扫 在手机阅读、分享本文

36683
{{votes}}

要回复文章请先登录注册

与CEO聊合作

(备注姓名、公司及职位)