↘️本文转发至国际云安全联盟CSA↙️
大语言模型(LLMs)因最近ChatGPT的爆红而备受关注。ChatGPT是由OpenAI发布的面向消费者的生成式人工智能聊天机器人,它和开源人工智能生态系统一样对企业和公司产生了巨大的影响。
云服务提供商在该领域抢得了先机。微软的云计算服务平台(Microsoft Azure)基于其平台和认知服务开发了OpenAI人工智能接口服务,并在其平台内整合了其他Open AI平台。谷歌(Google)在其托管式机器学习平台(Vertex AI)上提供了生成式人工智能功能,并开发了名为Bard的类似ChatGPT的聊天机器人。亚马逊(Amazon)也基于其托管式器学习平台SageMaker提供相关服务。
尽管人工智能还处于早期阶段,但云平台是生成式人工智能的支撑平台这一点是毋庸置疑的,企业和公司将在云端使用和开发大部分生成式人工智能应用。
基本术语
人工智能(AI)是机器模仿智能人类行为的能力。像“苹果公司的语音助手Siri”或“亚马逊公司的智能语音助理Alexa”这样能以人类的声音和人类进行交流的聊天机器人被视为人工智能。
机器学习(ML)是人工智能的一种应用,它能在经验中不断学习得到提升,是一门利用计算机算法和分析技术来构建预测模型以解决业务问题的计算机科学学科。
深度学习是机器学习的一个分支,研究的是类似人脑结构和功能的算法。深度学习算法可以处理大量结构化和非结构化数据,其关键特征是表征学习即自动学习,它会在每一层学习中创建更抽象复杂的数据表示。
生成对抗网络(GANs)是一种巧妙的生成模型训练方法,它构建了一个使用两个子模型相互对抗的监督学习问题:生成器模型用于生成新示例,判别器模型则对该示例进行分析确定其是来自真实世界中的还是机器生成的(伪造的)。
生成式人工智能是一类用于创造新内容的人工智能模型和工具。它通过如生成对抗网络(GANs)和转换器模型 (Transformer模型)的机器学习技术从大型数据集中学习并生成原创内容。
人工智能服务供应商(AISP)是向有需求的用户提供AI服务来帮助他们构建AI应用程序。这一块可以是包括AWS、GCP和Azure等云服务提供商,以及其他专业供应商。
人工智能服务用户(AISU)是使用人工智能服务供应商的服务构建用户AI应用程序的群体,通常包括企大型企业、中小企业、初创公司甚至个人开发者。
大语言模型(LLMs)是基于深度学习进行大量语言数据训练的语言模型,这些模型可以生成类似于人类的语言并执行复杂的自然语言处理任务。
提示(Prompting)是用户/软件使用自然语言与生成式人工智能模型进行交互的沟通机制,它由能够让生成式人工智能模型生成用户期望内容的所有指令构成。
语言基础化(Grounding)是通过给生成式人工智能模型提供上下文以使其在对上下文构建共同理解的基础上来回答问题,而不是天马行空毫无依据地胡乱回答。语言基础化过程可以根据特定上下文数据给出符合上下文具体场景的答案。
检索增强语言基础化(RAG)是一种将知识语言基础化的形式,通过将预训练模型的数据与具体的上下文信息相结合进行微调。
责任共担模型
NIST 800-145定义了云计算的服务模型,包括基础设施即服务(IaaS)、软件即服务(SaaS)和平台即服务(PaaS)。这些模型经过后来的发展演形成了许多其他服务模型。以下是演变的责任共担模型链接,其中包括“容器即服务”以及“无服务器运算”。
由于生成式人工智能应用也构建于云端,因此责任共担模型也可用于生成式人工智能应用。
生成式人工智能应用
生成式人工智能应用可以概括为三种---即基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。
IaaS用例
对于生成式人工智能的IaaS应用,人工智能服务用户会选择基础模型并用自有数据对模型进行训练,然后基于经过训练的大模型开发应用程序并向使用该应用程序的用户开通访问权限。这些应用程序主要是公司为满足其用户重要业务需求而开发,例如BloombergGPT、Einstein GPT和Intuit GenOS。
PaaS用例
人工智能服务用户使用诸如微软的云计算服务平台Azure上的OpenAI人工智能接口服务(或Google公司托管式机器学习平台Vertex AI上的人工智能与机器学习服务)开发PaaS应用程序。人工智能服务供应商将经训练的大模型托管在租户自己的基础设施上,用户在使用生成式人工智能时就像是在为应用程序进行特殊的API调用,许多由人工智能服务用户构建的应用程序都采用这种开发模式。
SaaS用例
现有大量的SaaS应用程序都有生成式人工智能功能,众所周知的2B应用如Microsoft365、ServiceNow和Salesforce现在都具有生成式人工智能功能。人工智能服务用户(AISU)对这些应用内部使用的模型、训练和语言基础化都没有任何感知。另外,目前还有团队正在专注于开发类似于ChatGPT的生成式人工智能应用。企业需要掌握对这些影子应用的识别能力并找到确保它们被安全使用的方法。
生成式 AI 的责任共担模型
AI 应用的安全性和合规性的责任应由 AI 服务使用者、企业(应用的所有者)和 AI 服务提供商共同承担。这种责任共担模型有助于划分和明确各自的职责。这同样能使得我们能够以更快的速度创建和部署较新的 AI 应用,同时保持安全与合规。
IaaS 服务提供方的责任
对于 IaaS 应用,包括 GPU、训练或推理基础设施在内的基础设施由 AISP 提供。AISU 负责基础架构中物理和虚拟架构的安全。AISP 可以提供精选的 AI 基础或预训练模型。这种模式可以由AISU使用任何开源或专有的数据语料库进行训练和调整。因此,选择模型血统和相关性也是AISU的责任。用于训练模型、其世系和安全性的数据语料库需要由 AISU 验证。该模型由 AISU 托管以用于推理。当应用运行时,AISU提供任何提示词和语言基础化信息(要回答的上下文)。及时控制、应用程序安全/知识产权 (IP) 和版权的所有方面都由 AISU 自己处理。
PaaS 服务提供方的责任
对于 PaaS 应用而言,基础结构以及预训练模型由 AISP 提供。模型的安全性和模型所训练的数据是 AISP 的责任。该模型由 AISP 进行托管。如果模型在特定任务上进行了训练,则AISP可以执行一些落地的工作,而用户特定的上下文信息也将由AISU增强和提供。AISP可以提供一些保护性提示控制,而AISU则处理它的其他方面。应用程序安全/知识产权(IP)和版权的所有方面都由AISU自己处理。
SaaS 服务提供方的责任
对于SaaS应用,LLM模型是从AISU中抽象出来的,它被认为是AISP的责任。SaaS 应用可以使用来自于 SaaS 应用中客户的上下文信息,也可以使用从其他应用程序获取的数据来使模型落地。在这个过程最后,应用程序安全性、大量提示过滤和 IP 过滤都是 AISU 的责任。
结论
虽然人工智能服务模型还在不断发展,责任共担模型也会不断发展,但本博客试图创建一些早期术语和框架,以帮助明确人工智能服务提供商和人工智能服务用户之间的职责划分,以便他们能够快速独立工作。
全套资料试听课在线试讲
如何轻松通过IAPP CIPP/E?分享我考CIPP/E的4个关键
CIPPE+CIPM双证到手!他如何在3个月内完美通过的?
数据合规零基础,仅用三个月456分通过 IAPP CIPP/E!!
精华帖 | 全文三千字,大神手把手教你如何高效备考CIPT!
往/期/回/顾
合规官与律师:有何区别?
中国顶级金融数据提供商因新规限制离岸访问
CIPPE+CIPM双证到手!他如何在3个月内完美通过的?
什么是合规性?不同的合规岗位的职责是什么?
GDPR(通用数据保护条例)存在的意义及对公司的作用
■ DEPTH
想了解IAPP哪个证书适合你?
全套资料长按扫码领取
全套资料试听课在线试讲
-End-
■ DEPTH
想知道IAPP哪个证书适合你吗?
资格评价可直接扫描码
免费评价/赠送一份国际隐私认证学习资料一份
感觉不错你就赞赞我吧!
点分享
点点赞
点在看
戳这个,领取IAPP备考资料包