从 ChatGPT 发布至今,已经有半年之久,国内各大厂商都在如火如荼地训练着各自的大模型。在大模型的开源世界里,也纷纷涌现出各种各样的大模型,效果却不尽相同。据中信所等机构的报告,截至2023年5月,国内已发布79个大模型。

GPT大模型正逐渐成为新一代的智能化基础设施,许多人将其类比 Windows、iOS,但其真正带来的,是一个全新的智能应用生态。这一点,我们从 OpenAI 将发布“App Store”便可见端倪。OpenAI 产品和合作副总裁 Peter Welinder 这样表示:“大部分(AI 生态)的价值会在不同应用领域的应用层中产生,这也是 OpenAI 的策略。”

未来,不仅是个人开发者,更多的企业、个人都将能够利用大模型进行智能应用的构建。具备技术能力的开发者或企业可以自己训练或微调模型,而还将有更多的个人及企业使用 MaaS(模型即服务)所提供的 API 及一站式服务来完成。


(相关资料图)

如何使用大模型构建智能应用?

举个例子,我是一个 SaaS 服务的开发者,对客户提供着我的 SaaS 服务,关于 SaaS 服务有很多介绍文档以及使用文档。为了让客户能够更友好、更快速地了解 SaaS 服务的内容,此时我想使用大模型来构建一个智能助理,客户通过聊天的方式,就能快速地进行深入了解。

在构建这个智能助理时,我可以将现有的文档全部都给到大模型,客户提出问题,大模型经过推理返回答案。在这个流程中,存在一些问题,当前大模型都有 Token 数量限制,如 GPT-4-32K 模型最大支持 32768 个 Token,如文档内容过多,便无法处理,并且随着使用到的 Token 数量逐渐接近最大限制时,其推理速度及准确性也会出现不同程度的下降。

当前,我们可以看到绝大部分开发者构建智能应用都是通过情境学习(In-context Learning)的模式去实现的。具体步骤如下:

1. 数据预处理,此步骤会处理的是自有知识库数据(如上例中提到的各种文档),将这些知识库中的数据分解成大小相近的数据块,然后通过 embedding 的模型将数据进行转化,并将转换后的数据存储在向量数据库中去。

2. 构建 Prompt,当用户进行提问时,此时会通过查询的 API 将向量数据库中相似的内容查询出来,某些场景下,可能还需要根据一些模板去构建 Prompt,也可能通过一些 API 去网络上搜索最新的信息。将这些信息进行拼接,构建出一个更好的 Prompt。

3. 模型推理,从第二步中拿到的 Prompt , 将之提交给 MaaS 服务或者是自己的 LLM 模型进行推理,最终拿到相应的结果。当然,这些结果可以直接返回给用户,也可能需要再进行二次处理,变成一个指令或动作。

在这个基础的智能应用构建模式中,还存在诸多问题,如模型的选择、数据安全、AGI 基建等问题。全球各大云厂商都纷纷入局大模型的军备竞赛,为应用开发企业提供各种各样的服务。在这浪潮之下,火山引擎发布了火山方舟平台,致力于解决眼下存在的问题,提供最佳解决方案。

选取趁手利器!火山方舟一站式实现

在构建智能应用时,模型是重中之重,如何选择更高效和更具性价比模型是模型使用者最关注的问题之一。

就目前来看,一两个超大的基座模型不可能搞定所有的通用需求,在一些垂直领域中,虽然大模型可以很好地工作,但其成本可能会很高。如果基于其特定领域数据,对模型进行精调和压缩,使之生成一个比它小 10 倍或小 100 倍的小模型,在特定任务上可能会表现得更好,大幅降低推理成本,具有极高的性价比。

在众多模型之中,除了模型大小,它们可能还使用了不同的模型结构。不同的模型结构可能一些场景表现得更好,其它场景中可能会相对平庸一点。因此,模型使用者可能需要在不同的场景应用不同的模型,以达到最佳的算法效果。

面对如此多的模型, 我们是否有一个答案,告诉我们,今天或者未来的一段时间内,哪个模型最好?关于这个问题,火山引擎智能算法负责人吴迪表示,企业需要在不同的智能应用场景,选择最适合自己场景的大模型。“大模型的整个社区以及技术都在不断地变化,现阶段我们甚至都无法预测到明年大模型的发展趋势。我们需要和时间做朋友,跟着大模型时代的浪潮一起往前发展。”吴迪如是说道。

火山引擎总裁谭待公布“火山方舟”首批大模型合作伙伴

为此,火山方舟实现了统一的工作流,对接多家模型提供商,让开发者在不同场景下选择最适合的模型。截止目前,已经接入了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI(以拼音首字母排序)等多家AI科技公司及科研院所的大模型,开发者可以通过统一的 API ,很方便地去选择合适当前业务的模型。据了解,火山方舟还将持续与模型提供方合作,上线更多更优质的模型,供大模型应用企业选择和使用。

当然,直接选择并使用对应模型可以满足多数需求,但对于有技术能力的企业,还会存在模型微调的需求,让模型能够更好地去满足特定的需求场景,让其优于通用的大基座模型。为此,火山方舟也提供了便捷的工具链,赋能企业,让企业能够方便的在火山引擎提供的高性价比算力上,快速方便的进行模型微调和训练。

火山方舟平台在模型选择及使用上,为开发者提供了一站式的解决方案,从体验到精调,再到上线以及后续的监控与运维,都提供有丰富的工具链供企业客户使用。

刚提到的用于精调模型的数据集、数据预处理中使用到的企业知识库以及在调用模型时的查询信息,随着企业在细分领域中持续发展和积累,它们成为企业的重要资产。据了解,为客户保护这些数据资产,也是火山方舟平台致力要解决的问题。

解决大模型最关键的数据安全问题

在今年 4 月份,三星员工在使用 ChatGPT 处理工作时,无意间泄露了公司的绝密数据,这是三星引入 ChatGPT 后引起第三起数据泄漏的问题。 可见在大模型兴起的初期,各个方面安全配套设施都还不够完善。

数据的安全问题深深触动着模型使用方的神经,对于很多有开发能力的企业,可以通过自研大模型的方式,自产去自销,从而避免数据泄漏的问题。大模型与之前的那些深度学习模型不一样,当前的训练门槛已经被提到一个相当高的水平,更多的开发者或企业并不具备相应的开发能力,一定会使用外部厂商提供的模型服务去实现自己的业务需求。因此要让这些企业放心使用 MaaS 服务,解决安全互信问题,是模型提供方需要解决首要问题。而对于模型提供者来说,模型的安全也至关重要,也不希望自己投入海量资源训练的模型被拷贝走了。

在这之中,信任问题至关重要,它将深深地影响大模型应用市场的格局。火山方舟作为模型使用者与模型提供者的桥梁,作为一个中立的第三方,为解决安全互信的问题也付出了巨大的努力。

当前为解决安全问题存在三种流派:安全沙箱和三方审计、 硬件支持、联邦学习。火山方舟基于火山引擎现有的云基础能力、探索软硬件的安全方案,首创大模型“安全互信计算架构”,以先进的技术手段,解决多方互信的问题。

让专业的人做专业的事,通过火山方舟,模型提供方不需要在关注模型安全的问题,将更多的资源投入到模型研发中去,做出更好更优的模型。对于模型使用者,同样不用担心数据资产泄漏,将更多的资源放应用开发及创新上。

大模型进入千行百业!

大模型的能力将进入千行百业。但在此过程中,模型本身仅为其中的一小部分,更为关键的是,大模型运行所依赖的基础设施,以及看不见的模型上下游之间的连接。火山方舟致力于补全拼图中不足的模块,帮助模型上下游客户解决问题。对于一个健康而蓬勃的大模型生态来说,用于模型推理和调优的算力,在未来的某一时刻,必然会超过模型训练所使用的算力。

我们正处在大模型高速发展的窗口期,但同时也面临着各种挑战。而火山方舟则将火山引擎和字节多年积累的基础能力对外输出,助力大模型基建建设。同时,火山引擎完整的 ToB 服务体系和团队不仅能让模型应用开发企业一站式实现智能应用的搭建与运营,同时也帮助大模型服务商实现成功的商业闭环。

ChatGPT正在形成新一轮的生产力革命,业界高呼这是第四次工业革命的到来。将大模型的选取、使用、上下游都集中到一站式的平台,火山方舟有望加速行业智能化升级。

一如火山引擎智能算法负责人吴迪所言:“火山引擎深信这波大模型不仅是一次风潮,更是一个全新的技术时代的窗口。未来,大模型将渗透到千行百业,而火山方舟的使命便是去缩短这个时间轴,帮助第一增长曲线的创业者们获得资金,加速模型研发,也帮助应用开发企业更快地用到这些大模型,并把它用好,创造更大的价值。”

#七款国产大模型登陆火山方舟#

推荐内容