Firebase Vertex AI SDK简化基于Gemini的移动应用开发

InfoQ

2024-10-25 17:11发布于北京InfoQ官方账号

作者 | Sergio De Simone

译者 | 明知山

策划 | Tina

目前处于测试阶段的 Firebase Vertex AI SDK 可以让用户开发出超越简单聊天模型和文本提示词的应用程序。谷歌最近提供了一个 colab 来帮助开发者完成将 SDK 集成到应用程序所需的步骤。

新推出的 colab 涵盖了多个核心主题，包括如何设计有效的提示词、设置集成了 Vertex AI 的 Firebase 项目、配置 Android Studio 项目环境，以及如何利用 Kotlin 将这些功能整合到你的代码中。

谷歌工程师 Thomas Ezan 解释说，开发者可以使用 Vertex AI Studio 来打造高效的提示词，这是一个云端的工具，专为快速构建和测试与 Gemini 模型提示词而设计。

Vertex AI 的一项特性旨在简化开发者的工作流，让他们能够更加轻松地定制应用程序的行为，这一特性就是系统指令。

系统指令相当于用户提示词之前的“序言”，确保模型的行为能够与具体的需求和应用场景保持一致。

通过使用系统指令，开发者能够一次性设定所需的输出风格或语调、角色或身份（比如“解释给五岁的孩子听”）、任务目标或规则（例如“直接返回代码片段，无需额外解释”），以及任何与应用程序用户相关的附加上下文。

系统指令在初始化时进行设置，如下面的代码示例：

val generativeModel = Firebase.vertexAI.generativeModel(  modelName = "gemini-1.5-flash",  ...  systemInstruction =     content { text("You are a knowledgeable tutor. Answer the questions using the socratic tutoring method.") })

SDK 还允许开发者指定生成输出的 responseMimeType。比如，在生成 JSON 格式的输出时，这一功能有助于排除所有非 JSON 格式的内容，这非常实用。

Ezan 指出，将 Gemini API 集成到移动应用程序中，并不仅限于提供对话界面，这要归功于 Gemini 的多模态能力。实际上，Gemini 能够处理文本以外的多种输入类型，包括图像、音频和视频。这意味着，例如，你可以为图片生成标题、为音频文件创建摘要、描述视频场景等。

Ezan 着重介绍了另一个强大的功能：创建函数来增强模型的能力。比如，可以设计一个函数从 SQL 数据库读取数据，并将其融入到提示词的上下文中。另外，你还可以定义一组工具，让模型利用这些工具来生成输出，如下图表所示。

在这里，模型通过两次调用你的数据，获取日期和订单列表，来回答用户提出的问题。

Firebase Vertex AI 为这些特性提供了良好的支持，开发者可以自由选择他们最熟悉的编程语言，如 Swift、Kotlin、Flutter 和 JavaScript，来使用这些特性。

Firebase Vertex AI SDK 为 Android 和 iOS 开发者提供直接访问 Gemini API 的能力，不再需要使用 Python、Java 或 Go 编写的中间后端服务层。

查看英文原文：

https://www.infoq.com/news/2024/10/vertex-ai-firebase-gemini/

声明：本文为 InfoQ 翻译，未经许可禁止转载。