Oracle Cloud Infrastructure (OCI) 数据科学服务¶
Oracle Cloud Infrastructure (OCI) 数据科学 是一个全托管、无服务器平台,供数据科学团队在 Oracle 云基础设施中构建、训练和管理机器学习模型。
该服务提供 AI 快捷操作,可用于在 OCI 数据科学中部署嵌入模型。AI 快捷操作面向希望快速利用 AI 能力的用户,旨在通过提供简化、无需编码且高效的基础模型操作环境,将基础模型的适用范围扩展到更广泛的用户群体。AI 快捷操作可通过数据科学笔记本访问。
关于如何使用 AI 快捷操作在 OCI 数据科学中部署嵌入模型的详细文档,请参阅此处和此处。
本笔记本将说明如何将 OCI 数据科学的嵌入模型与 LlamaIndex 结合使用。
安装配置¶
若您在 Colab 平台上打开此 Notebook,很可能需要先安装 LlamaIndex 🦙。
In [ ]:
Copied!
%pip install llama-index-embeddings-oci-data-science
%pip install llama-index-embeddings-oci-data-science
In [ ]:
Copied!
!pip install llama-index
!pip install llama-index
您还需要安装 oracle-ads SDK。
In [ ]:
Copied!
!pip install -U oracle-ads
!pip install -U oracle-ads
认证¶
LlamaIndex 支持的认证方式与其他 OCI 服务相同,遵循标准 SDK 认证方法,具体包括 API 密钥、会话令牌、实例主体和资源主体。更多详细信息可参阅此处。请确保已配置访问 OCI 数据科学模型部署端点所需的策略。oracle-ads 工具可简化 OCI 数据科学平台内的认证流程。
基本用法¶
In [ ]:
Copied!
import ads
from llama_index.embeddings.oci_data_science import OCIDataScienceEmbedding
ads.set_auth(auth="security_token", profile="<replace-with-your-profile>")
embedding = OCIDataScienceEmbedding(
endpoint="https://<MD_OCID>/predict",
)
e1 = embeddings.get_text_embedding("This is a test document")
print(e1)
e2 = embeddings.get_text_embedding_batch(
["This is a test document", "This is another test document"]
)
print(e2)
import ads
from llama_index.embeddings.oci_data_science import OCIDataScienceEmbedding
ads.set_auth(auth="security_token", profile="")
embedding = OCIDataScienceEmbedding(
endpoint="https:///predict",
)
e1 = embeddings.get_text_embedding("This is a test document")
print(e1)
e2 = embeddings.get_text_embedding_batch(
["This is a test document", "This is another test document"]
)
print(e2)
异步处理¶
In [ ]:
Copied!
import ads
from llama_index.embeddings.oci_data_science import OCIDataScienceEmbedding
ads.set_auth(auth="security_token", profile="<replace-with-your-profile>")
embedding = OCIDataScienceEmbedding(
endpoint="https://<MD_OCID>/predict",
)
e1 = await embeddings.aget_text_embedding("This is a test document")
print(e1)
e2 = await embeddings.aget_text_embedding_batch(
["This is a test document", "This is another test document"]
)
print(e2)
import ads
from llama_index.embeddings.oci_data_science import OCIDataScienceEmbedding
ads.set_auth(auth="security_token", profile="")
embedding = OCIDataScienceEmbedding(
endpoint="https:///predict",
)
e1 = await embeddings.aget_text_embedding("This is a test document")
print(e1)
e2 = await embeddings.aget_text_embedding_batch(
["This is a test document", "This is another test document"]
)
print(e2)