GCP Vertex AI
Last updated
Last updated
概述
GCP Vertex AI: 这是一项完全托管的服务,可通过 Google Cloud 访问领先的生成式 AI 模型(例如 Anthropic 的 Claude 3.5 Sonnet v2)。 。
本指南专为已建立 GCP 环境(利用 IAM 角色、服务帐户和资源管理最佳实践)的组织量身定制,以确保安全且合规地使用。
1.1 创建或使用 GCP 项目
登录 GCP 控制台: 。
选择或创建项目: 使用现有项目或创建专用于 Vertex AI 的新项目。
(屏幕截图建议:GCP Console 中的项目选择/创建屏幕)
1.2 设置 IAM 权限和服务账户
分配所需角色:
向您的用户(或服务帐户)授予 Vertex AI 用户角色( roles/aiplatform.user
)。
对于服务帐户,还需附加 Vertex AI 服务代理角色 ( roles/aiplatform.serviceAgent
) 以启用某些操作。
根据需要考虑其他预定义角色:
Vertex AI Platform Express 管理员
Vertex AI 平台 Express 用户
Vertex AI 迁移服务用户
(屏幕截图建议:IAM 控制台显示角色分配)
跨项目资源访问:
对于不同项目中的 BigQuery 表,分配 BigQuery 数据查看者角色。
对于不同项目中的 Cloud Storage 存储桶,分配存储对象查看者角色。
对于外部数据源,请参阅 。
2.1 选择并确认区域
Vertex AI 支持八个区域。请选择一个符合您的延迟、合规性和容量需求的区域。示例包括:
us-east5(俄亥俄州哥伦布市)
us-east1(南卡罗来纳州)
us-east4(弗吉尼亚北部)
us-central1(爱荷华州)
us-west1(俄勒冈州达尔斯)
us-west4(内华达州拉斯维加斯)
europe-west1(比利时)
asia-southeast1(新加坡)
(屏幕截图建议:Vertex AI 仪表板中支持的区域列表或地图)
2.2 启用 Claude 3.5 Sonnet v2 模型
打开 Vertex AI 模型花园: 在云控制台中,导航至 Vertex AI → Model Garden 。
启用 Claude 3.5 Sonnet v2: 找到 Claude 3.5 Sonnet v2 的模型卡并单击启用 。
(屏幕截图建议:模型花园显示带有启用按钮的 Claude 3.5 Sonnet v2 模型卡)
3.1 安装并打开 Cline
安装 Cline 扩展:
打开 VS Code。
导航到扩展市场(Ctrl+Shift+X 或 Cmd+Shift+X)。
搜索 Cline 并安装扩展。
3.2 配置 Cline 设置
打开 Cline 设置: 单击 Cline 扩展中的设置⚙️图标。
设置 API 提供商: 从 API 提供商下拉菜单中选择 GCP Vertex AI 。
输入您的 Google Cloud 项目 ID: 提供您之前设置的项目 ID。
选择地区: 选择其中一个受支持的区域(例如 us-east5
)。
选择型号: 从可用列表中,选择 Claude 3.5 Sonnet v2 。
保存并测试: 保存您的设置并通过发送一个简单的提示进行测试(例如,“生成一个 Python 函数来检查一个数字是否为素数。”)。
(截图建议:Cline 设置显示项目 ID、区域和模型选择)
选项 A:使用您的 Google 帐户(用户凭证)
初始化和验证:
复制
这将使用您的 Google 帐户设置应用程序默认凭据 (ADC)。
(屏幕截图建议:成功的终端输出 gcloud auth application-default login
)
重新启动 VS Code: 确保 VS Code 已重新启动,以便 Cline 扩展获取新的凭据。
选项 B:使用服务帐户(JSON 密钥)
创建服务帐户:
在 GCP 控制台中,导航到 IAM 和管理 > 服务帐户 。
创建一个新的服务帐户(例如“vertex-ai-client”)。
分配角色:
附加 Vertex AI 用户 ( roles/aiplatform.user
)。
附加 Vertex AI 服务代理 ( roles/aiplatform.serviceAgent
)。
或者,根据需要添加其他角色。
(屏幕截图建议:创建具有角色分配的服务帐户)
生成 JSON 密钥:
在服务帐户部分,管理您的服务帐户的密钥并下载 JSON 密钥。
设置环境变量:
复制
这会指示 Google Cloud 客户端库(和 Cline)使用此密钥。
(屏幕截图建议:显示导出命令的终端)
重新启动 VS Code: 从设置了 GOOGLE_APPLICATION_CREDENTIALS
变量的终端启动 VS Code。
5.1 强制最低权限
最小特权原则: 仅授予最低限度的必要权限。与广泛的预定义角色相比,自定义角色可以提供更精细的控制。
5.2 管理资源访问
项目与资源级别访问: 访问权限可在两个级别进行管理。请注意,资源级权限(例如 BigQuery 或 Cloud Storage 的权限)会添加到项目级策略中,但不会覆盖项目级策略。
5.3 监控使用情况和配额
模型可观察性仪表板:
在 Vertex AI 控制台中,导航到模型可观察性仪表板。
监控请求吞吐量、延迟和错误率(包括 429 配额错误)等指标。
(屏幕截图建议:突出显示错误指标的模型可观测性仪表板)
配额管理:
如果遇到 429 错误,请检查 IAM 和管理 > 配额页面。
5.4 服务代理和跨项目考虑
服务代理: 请注意不同的服务代理:
Vertex AI 服务代理
Vertex AI RAG 数据服务代理
Vertex AI 自定义代码服务代理
Vertex AI 扩展服务代理
跨项目访问: 对于其他项目中的资源(例如,BigQuery、Cloud Storage),请确保分配适当的角色(BigQuery 数据查看器、存储对象查看器)。
通过遵循以下步骤,您的企业团队可以安全地将 GCP Vertex AI 与 Cline VS Code 扩展集成,以利用 Claude 3.5 Sonnet v2 的强大功能:
准备您的 GCP 环境: 创建或使用一个项目,以最小权限配置 IAM,并确保附加必要的角色(包括 Vertex AI 服务代理角色)。
验证区域和模型访问: 确认您选择的地区支持 Claude 3.5 Sonnet v2 并且该模型已启用。
在 VS Code 中配置 Cline: 安装 Cline,输入您的项目 ID,选择适当的区域,然后选择模型。
设置身份验证: 使用用户凭据(通过 gcloud auth application-default login
)或带有 JSON 密钥的服务帐户。
实施安全和监控: 遵守 IAM 的最佳实践,谨慎管理资源访问,并使用模型可观察性仪表板监控使用情况。
本指南将随着 GCP Vertex AI 和 Cline 的发展而更新。请务必参考最新文档以了解最新实践。
下载 VS Code: 。
安装 Google Cloud CLI: 按照。
最佳实践: 参考 。
如果有必要,请求增加配额。 。
有关更多详细信息,请参阅 以及您的内部安全政策。 编码愉快!