Oracle Database 23ai - AI 向量搜尋

Oracle Database 23ai (23.4+) 的 AI 向量搜尋功能作為 Spring AI 的 VectorStore 提供，可幫助您儲存文件嵌入並執行相似性搜尋。當然，所有其他功能也可用。

本地執行 Oracle Database 23ai 附錄展示瞭如何使用輕量級 Docker 容器啟動資料庫。

自動配置

Spring AI 自動配置、啟動模組的工件名稱發生了重大變化。請參閱升級說明以獲取更多資訊。

首先將 Oracle 向量儲存啟動器依賴項新增到您的專案中

<dependency>
	<groupId>org.springframework.ai</groupId>
	<artifactId>spring-ai-starter-vector-store-oracle</artifactId>
</dependency>

或新增到您的 Gradle build.gradle 構建檔案中。

dependencies {
    implementation 'org.springframework.ai:spring-ai-starter-vector-store-oracle'
}

如果您需要此向量儲存為您初始化模式，那麼您需要在相應的建構函式中為 initializeSchema 布林引數傳遞 true，或者在 application.properties 檔案中設定 …initialize-schema=true。

這是一個重大更改！在早期版本的 Spring AI 中，此模式初始化是預設發生的。

向量儲存還需要一個 EmbeddingModel 例項來計算文件的嵌入。您可以選擇一個可用的 EmbeddingModel 實現。

例如，要使用 OpenAI EmbeddingModel，請將以下依賴項新增到您的專案中

<dependency>
	<groupId>org.springframework.ai</groupId>
	<artifactId>spring-ai-starter-model-openai</artifactId>
</dependency>

或新增到您的 Gradle build.gradle 構建檔案中。

dependencies {
    implementation 'org.springframework.ai:spring-ai-starter-model-openai'
}

請參閱依賴管理部分，將 Spring AI BOM 新增到您的構建檔案中。請參閱Artifact Repositories部分，將 Maven Central 和/或 Snapshot Repositories 新增到您的構建檔案中。

要連線和配置 OracleVectorStore，您需要提供資料庫的訪問詳細資訊。一個簡單的配置可以透過 Spring Boot 的 application.yml 提供

spring:
  datasource:
    url: jdbc:oracle:thin:@//:1521/freepdb1
    username: mlops
    password: mlops
  ai:
	vectorstore:
	  oracle:
		index-type: IVF
		distance-type: COSINE
		dimensions: 1536

檢視配置引數列表，瞭解預設值和配置選項。

現在您可以在您的應用程式中自動裝配 OracleVectorStore 並使用它

@Autowired VectorStore vectorStore;

// ...

List<Document> documents = List.of(
    new Document("Spring AI rocks!! Spring AI rocks!! Spring AI rocks!! Spring AI rocks!! Spring AI rocks!!", Map.of("meta1", "meta1")),
    new Document("The World is Big and Salvation Lurks Around the Corner"),
    new Document("You walk forward facing the past and you turn back toward the future.", Map.of("meta2", "meta2")));

// Add the documents to Oracle Vector Store
vectorStore.add(documents);

// Retrieve documents similar to a query
List<Document> results = this.vectorStore.similaritySearch(SearchRequest.builder().query("Spring").topK(5).build());

配置屬性

您可以在 Spring Boot 配置中使用以下屬性來自定義 OracleVectorStore。

財產描述預設值

財產	描述	預設值
`spring.ai.vectorstore.oracle.index-type`	最近鄰搜尋索引型別。選項包括 `NONE` - 精確最近鄰搜尋，`IVF` - 倒排平面檔案索引。它具有更快的構建時間和更少的記憶體使用，但查詢效能較低（在速度-召回權衡方面）。`HNSW` - 建立多層圖。它具有較慢的構建時間和更多的記憶體使用，但查詢效能更好（在速度-召回權衡方面）。	NONE
`spring.ai.vectorstore.oracle.distance-type`	搜尋距離型別包括 `COSINE` (預設)、`DOT`、`EUCLIDEAN`、`EUCLIDEAN_SQUARED` 和 `MANHATTAN`。注意：如果向量已歸一化，您可以使用 `DOT` 或 `COSINE` 以獲得最佳效能。	COSINE
`spring.ai.vectorstore.oracle.forced-normalization`	允許在插入前和相似性搜尋時啟用向量歸一化（如果為 true）。注意：將其設定為 true 是允許搜尋請求相似性閾值的必要條件。注意：如果向量已歸一化，您可以使用 `DOT` 或 `COSINE` 以獲得最佳效能。	假
`spring.ai.vectorstore.oracle.dimensions`	嵌入維度。如果未明確指定，OracleVectorStore 將允許最大值：65535。維度在表建立時設定為嵌入列。如果您更改維度，則需要重新建立表。	65535
`spring.ai.vectorstore.oracle.remove-existing-vector-store-table`	在啟動時刪除現有表。	假
`spring.ai.vectorstore.oracle.initialize-schema`	是否初始化所需的模式。	假
`spring.ai.vectorstore.oracle.search-accuracy`	表示在存在索引的情況下請求的精度目標。預設停用。您需要提供一個介於 [1,100] 之間的整數來覆蓋預設索引精度 (95)。使用較低的精度提供近似相似性搜尋，以速度換取精度。	-1 (`DEFAULT_SEARCH_ACCURACY`)

spring.ai.vectorstore.oracle.index-type

最近鄰搜尋索引型別。選項包括 NONE - 精確最近鄰搜尋，IVF - 倒排平面檔案索引。它具有更快的構建時間和更少的記憶體使用，但查詢效能較低（在速度-召回權衡方面）。HNSW - 建立多層圖。它具有較慢的構建時間和更多的記憶體使用，但查詢效能更好（在速度-召回權衡方面）。

NONE

spring.ai.vectorstore.oracle.distance-type

搜尋距離型別包括 COSINE (預設)、DOT、EUCLIDEAN、EUCLIDEAN_SQUARED 和 MANHATTAN。

注意：如果向量已歸一化，您可以使用 DOT 或 COSINE 以獲得最佳效能。

COSINE

spring.ai.vectorstore.oracle.forced-normalization

允許在插入前和相似性搜尋時啟用向量歸一化（如果為 true）。

注意：將其設定為 true 是允許搜尋請求相似性閾值的必要條件。

注意：如果向量已歸一化，您可以使用 DOT 或 COSINE 以獲得最佳效能。

假

spring.ai.vectorstore.oracle.dimensions

嵌入維度。如果未明確指定，OracleVectorStore 將允許最大值：65535。維度在表建立時設定為嵌入列。如果您更改維度，則需要重新建立表。

65535

spring.ai.vectorstore.oracle.remove-existing-vector-store-table

在啟動時刪除現有表。

假

spring.ai.vectorstore.oracle.initialize-schema

是否初始化所需的模式。

假

spring.ai.vectorstore.oracle.search-accuracy

表示在存在索引的情況下請求的精度目標。預設停用。您需要提供一個介於 [1,100] 之間的整數來覆蓋預設索引精度 (95)。使用較低的精度提供近似相似性搜尋，以速度換取精度。

-1 (DEFAULT_SEARCH_ACCURACY)

元資料過濾

您可以將通用、可移植的元資料過濾器與 OracleVectorStore 一起使用。

例如，您可以使用文字表示式語言

vectorStore.similaritySearch(
    SearchRequest.builder()
    .query("The World")
    .topK(TOP_K)
    .similarityThreshold(SIMILARITY_THRESHOLD)
    .filterExpression("author in ['john', 'jill'] && article_type == 'blog'").build());

或使用 `Filter.Expression` DSL 以程式設計方式

FilterExpressionBuilder b = new FilterExpressionBuilder();

vectorStore.similaritySearch(SearchRequest.builder()
    .query("The World")
    .topK(TOP_K)
    .similarityThreshold(SIMILARITY_THRESHOLD)
    .filterExpression(b.and(
        b.in("author","john", "jill"),
        b.eq("article_type", "blog")).build()).build());

這些過濾表示式將轉換為等效的 OracleVectorStore 過濾器。

手動配置

您可以透過手動配置 OracleVectorStore 而不是使用 Spring Boot 自動配置。為此，您需要將 Oracle JDBC 驅動程式和 JdbcTemplate 自動配置依賴項新增到您的專案中

<dependency>
	<groupId>org.springframework.boot</groupId>
	<artifactId>spring-boot-starter-jdbc</artifactId>
</dependency>

<dependency>
	<groupId>com.oracle.database.jdbc</groupId>
	<artifactId>ojdbc11</artifactId>
	<scope>runtime</scope>
</dependency>

<dependency>
	<groupId>org.springframework.ai</groupId>
	<artifactId>spring-ai-oracle-store</artifactId>
</dependency>

請參閱依賴項管理部分，將 Spring AI BOM 新增到您的構建檔案中。

要在您的應用程式中配置 OracleVectorStore，您可以使用以下設定

@Bean
public VectorStore vectorStore(JdbcTemplate jdbcTemplate, EmbeddingModel embeddingModel) {
    return OracleVectorStore.builder(jdbcTemplate, embeddingModel)
        .tableName("my_vectors")
        .indexType(OracleVectorStoreIndexType.IVF)
        .distanceType(OracleVectorStoreDistanceType.COSINE)
        .dimensions(1536)
        .searchAccuracy(95)
        .initializeSchema(true)
        .build();
}

本地執行 Oracle Database 23ai

docker run --rm --name oracle23ai -p 1521:1521 -e APP_USER=mlops -e APP_USER_PASSWORD=mlops -e ORACLE_PASSWORD=mlops gvenzl/oracle-free:23-slim

然後您可以使用以下方式連線到資料庫

sql mlops/mlops@localhost/freepdb1

訪問原生客戶端

Oracle Vector Store 實現透過 getNativeClient() 方法提供對底層原生 Oracle 客戶端 (OracleConnection) 的訪問

OracleVectorStore vectorStore = context.getBean(OracleVectorStore.class);
Optional<OracleConnection> nativeClient = vectorStore.getNativeClient();

if (nativeClient.isPresent()) {
    OracleConnection connection = nativeClient.get();
    // Use the native client for Oracle-specific operations
}

原生客戶端允許您訪問可能未透過 VectorStore 介面公開的特定於 Oracle 的功能和操作。