Oracle Cloud Infrastructure (OCI) 数据科学服务¶

Oracle Cloud Infrastructure (OCI) 数据科学是一个全托管、无服务器平台，供数据科学团队在 Oracle 云基础设施中构建、训练和管理机器学习模型。

该服务提供 AI 快捷操作，可用于在 OCI 数据科学中部署嵌入模型。AI 快捷操作面向希望快速利用 AI 能力的用户，旨在通过提供简化、无需编码且高效的基础模型操作环境，将基础模型的适用范围扩展到更广泛的用户群体。AI 快捷操作可通过数据科学笔记本访问。

关于如何使用 AI 快捷操作在 OCI 数据科学中部署嵌入模型的详细文档，请参阅此处和此处。

本笔记本将说明如何将 OCI 数据科学的嵌入模型与 LlamaIndex 结合使用。

安装配置¶

若您在 Colab 平台上打开此 Notebook，很可能需要先安装 LlamaIndex 🦙。

In [ ]:

Copied!

%pip install llama-index-embeddings-oci-data-science
%pip install llama-index-embeddings-oci-data-science

In [ ]:

Copied!

!pip install llama-index
!pip install llama-index

您还需要安装 oracle-ads SDK。

In [ ]:

Copied!

!pip install -U oracle-ads
!pip install -U oracle-ads

认证¶

LlamaIndex 支持的认证方式与其他 OCI 服务相同，遵循标准 SDK 认证方法，具体包括 API 密钥、会话令牌、实例主体和资源主体。更多详细信息可参阅此处。请确保已配置访问 OCI 数据科学模型部署端点所需的策略。oracle-ads 工具可简化 OCI 数据科学平台内的认证流程。

基本用法¶

In [ ]:

Copied!





import ads
from llama_index.embeddings.oci_data_science import OCIDataScienceEmbedding

ads.set_auth(auth="security_token", profile="<replace-with-your-profile>")

embedding = OCIDataScienceEmbedding(
    endpoint="https://<MD_OCID>/predict",
)


e1 = embeddings.get_text_embedding("This is a test document")
print(e1)

e2 = embeddings.get_text_embedding_batch(
    ["This is a test document", "This is another test document"]
)
print(e2)
import ads
from llama_index.embeddings.oci_data_science import OCIDataScienceEmbedding

ads.set_auth(auth="security_token", profile="")

embedding = OCIDataScienceEmbedding(
    endpoint="https:///predict",
)


e1 = embeddings.get_text_embedding("This is a test document")
print(e1)

e2 = embeddings.get_text_embedding_batch(
    ["This is a test document", "This is another test document"]
)
print(e2)

异步处理¶

In [ ]:

Copied!





import ads
from llama_index.embeddings.oci_data_science import OCIDataScienceEmbedding

ads.set_auth(auth="security_token", profile="<replace-with-your-profile>")

embedding = OCIDataScienceEmbedding(
    endpoint="https://<MD_OCID>/predict",
)

e1 = await embeddings.aget_text_embedding("This is a test document")
print(e1)

e2 = await embeddings.aget_text_embedding_batch(
    ["This is a test document", "This is another test document"]
)
print(e2)
import ads
from llama_index.embeddings.oci_data_science import OCIDataScienceEmbedding

ads.set_auth(auth="security_token", profile="")

embedding = OCIDataScienceEmbedding(
    endpoint="https:///predict",
)

e1 = await embeddings.aget_text_embedding("This is a test document")
print(e1)

e2 = await embeddings.aget_text_embedding_batch(
    ["This is a test document", "This is another test document"]
)
print(e2)