vercel · May 14, 2024
diff --git a/Diff for: ‎.changeset/witty-beds-sell.md
+8 b/Diff for: ‎.changeset/witty-beds-sell.md
+8
diff --git a/Diff for: ‎content/docs/03-ai-sdk-core/30-embeddings.mdx
+24 b/Diff for: ‎content/docs/03-ai-sdk-core/30-embeddings.mdx
+24
diff --git a/Diff for: ‎examples/ai-core/src/embed/mistral.ts
+16 b/Diff for: ‎examples/ai-core/src/embed/mistral.ts
+16
diff --git a/Diff for: ‎examples/ai-core/src/embed/openai.ts
+16 b/Diff for: ‎examples/ai-core/src/embed/openai.ts
+16
diff --git a/Diff for: ‎packages/core/core/embed/embed.test.ts
+25 b/Diff for: ‎packages/core/core/embed/embed.test.ts
+25
diff --git a/Diff for: ‎packages/core/core/embed/embed.ts
+95 b/Diff for: ‎packages/core/core/embed/embed.ts
+95
diff --git a/Diff for: ‎packages/core/core/embed/index.ts
+1 b/Diff for: ‎packages/core/core/embed/index.ts
+1
diff --git a/Diff for: ‎packages/core/core/index.ts
+1 b/Diff for: ‎packages/core/core/index.ts
+1
diff --git a/Diff for: ‎packages/core/core/test/mock-embedding-model-v1.ts
+36 b/Diff for: ‎packages/core/core/test/mock-embedding-model-v1.ts
+36
diff --git a/Diff for: ‎packages/core/core/types/embedding-model.ts
+11 b/Diff for: ‎packages/core/core/types/embedding-model.ts
+11
diff --git a/Diff for: ‎packages/core/core/types/index.ts
+1 b/Diff for: ‎packages/core/core/types/index.ts
+1
diff --git a/Diff for: ‎packages/mistral/src/mistral-embedding-model.test.ts
+106 b/Diff for: ‎packages/mistral/src/mistral-embedding-model.test.ts
+106
diff --git a/Diff for: ‎packages/mistral/src/mistral-embedding-model.ts
+98 b/Diff for: ‎packages/mistral/src/mistral-embedding-model.ts
+98
diff --git a/Diff for: ‎packages/mistral/src/mistral-embedding-settings.ts
+13 b/Diff for: ‎packages/mistral/src/mistral-embedding-settings.ts
+13
diff --git a/Diff for: ‎packages/mistral/src/mistral-provider.ts
+45-14 b/Diff for: ‎packages/mistral/src/mistral-provider.ts
+45-14
diff --git a/Diff for: ‎packages/openai/src/openai-embedding-model.test.ts
+127 b/Diff for: ‎packages/openai/src/openai-embedding-model.test.ts
+127
diff --git a/Diff for: ‎packages/openai/src/openai-embedding-model.ts
+98 b/Diff for: ‎packages/openai/src/openai-embedding-model.ts
+98
diff --git a/Diff for: ‎packages/openai/src/openai-embedding-settings.ts
+29 b/Diff for: ‎packages/openai/src/openai-embedding-settings.ts
+29
diff --git a/Diff for: ‎packages/openai/src/openai-provider.ts
+74-8 b/Diff for: ‎packages/openai/src/openai-provider.ts
+74-8
diff --git a/Diff for: ‎packages/provider/src/embedding-model/index.ts
+1 b/Diff for: ‎packages/provider/src/embedding-model/index.ts
+1
diff --git a/Diff for: ‎packages/provider/src/embedding-model/v1/embedding-model-v1-embedding.ts
+5 b/Diff for: ‎packages/provider/src/embedding-model/v1/embedding-model-v1-embedding.ts
+5
diff --git a/Diff for: ‎packages/provider/src/embedding-model/v1/embedding-model-v1.ts
+73 b/Diff for: ‎packages/provider/src/embedding-model/v1/embedding-model-v1.ts
+73
diff --git a/Diff for: ‎packages/provider/src/embedding-model/v1/index.ts
+2 b/Diff for: ‎packages/provider/src/embedding-model/v1/index.ts
+2
diff --git a/Diff for: ‎packages/provider/src/errors/index.ts
+1 b/Diff for: ‎packages/provider/src/errors/index.ts
+1
diff --git a/Diff for: ‎packages/provider/src/errors/too-many-embedding-values-for-call-error.ts
+56 b/Diff for: ‎packages/provider/src/errors/too-many-embedding-values-for-call-error.ts
+56
diff --git a/Diff for: ‎packages/provider/src/index.ts
+1 b/Diff for: ‎packages/provider/src/index.ts
+1
@@ -0,0 +1,8 @@
+---
+'@ai-sdk/provider': patch
+'@ai-sdk/mistral': patch
+'@ai-sdk/openai': patch
+'ai': patch
+---
+
+feat (ai/core): add embed function
@@ -0,0 +1,24 @@
+---
+title: Embeddings
+description: Learn how to embed values with the Vercel AI SDK.
+---
+
+# Embeddings
+
+Embeddings are a way to represent words, phrases, or images as vectors in a high-dimensional space.
+In this space, similar words are close to each other, and the distance between words can be used to measure their similarity.
+
+## Embedding a Single Value
+
+The Vercel AI SDK provides the `embed` function to embed single values, which is useful for tasks such as finding similar words
+or phrases or clustering text. You can use it with embeddings models, e.g. `openai.embedding('text-embedding-3-large')` or `mistral.embedding('mistral-embed')`.
+
+```tsx
+import { embed } from 'ai';
+import { openai } from '@ai-sdk/openai';
+
+const { embedding } = await embed({
+  model: openai.embedding('text-embedding-3-small'),
+  value: 'sunny day at the beach',
+});
+```
@@ -0,0 +1,16 @@
+import { mistral } from '@ai-sdk/mistral';
+import { embed } from 'ai';
+import dotenv from 'dotenv';
+
+dotenv.config();
+
+async function main() {
+  const { embedding } = await embed({
+    model: mistral.embedding('mistral-embed'),
+    value: 'sunny day at the beach',
+  });
+
+  console.log(embedding);
+}
+
+main().catch(console.error);
@@ -0,0 +1,16 @@
+import { openai } from '@ai-sdk/openai';
+import { embed } from 'ai';
+import dotenv from 'dotenv';
+
+dotenv.config();
+
+async function main() {
+  const { embedding } = await embed({
+    model: openai.embedding('text-embedding-3-small'),
+    value: 'sunny day at the beach',
+  });
+
+  console.log(embedding);
+}
+
+main().catch(console.error);
@@ -0,0 +1,25 @@
+import assert from 'node:assert';
+import { MockEmbeddingModelV1 } from '../test/mock-embedding-model-v1';
+import { embed } from './embed';
+
+const dummyEmbedding = [0.1, 0.2, 0.3];
+const testValue = 'sunny day at the beach';
+
+describe('result.embedding', () => {
+  it('should generate embedding', async () => {
+    const result = await embed({
+      model: new MockEmbeddingModelV1({
+        doEmbed: async ({ values }) => {
+          assert.deepStrictEqual(values, [testValue]);
+
+          return {
+            embeddings: [dummyEmbedding],
+          };
+        },
+      }),
+      value: testValue,
+    });
+
+    assert.deepStrictEqual(result.embedding, dummyEmbedding);
+  });
+});
@@ -0,0 +1,95 @@
+import { Embedding, EmbeddingModel } from '../types';
+import { retryWithExponentialBackoff } from '../util/retry-with-exponential-backoff';
+
+/**
+Embed a value using an embedding model. The type of the value is defined by the embedding model.
+
+@param model - The embedding model to use.
+@param value - The value that should be embedded.
+
+@param maxRetries - Maximum number of retries. Set to 0 to disable retries. Default: 2.
+@param abortSignal - An optional abort signal that can be used to cancel the call.
+
+@returns A result object that contains the embedding, the value, and additional information.
+ */
+export async function embed<VALUE>({
+  model,
+  value,
+  maxRetries,
+  abortSignal,
+}: {
+  /**
+The embedding model to use.
+     */
+  model: EmbeddingModel<VALUE>;
+
+  /**
+The value that should be embedded.
+   */
+  value: VALUE;
+
+  /**
+Maximum number of retries per embedding model call. Set to 0 to disable retries.
+
+@default 2
+   */
+  maxRetries?: number;
+
+  /**
+Abort signal.
+ */
+  abortSignal?: AbortSignal;
+}): Promise<EmbedResult<VALUE>> {
+  const retry = retryWithExponentialBackoff({ maxRetries });
+
+  const modelResponse = await retry(() =>
+    model.doEmbed({
+      values: [value],
+      abortSignal,
+    }),
+  );
+
+  return new EmbedResult({
+    value,
+    embedding: modelResponse.embeddings[0],
+    rawResponse: modelResponse.rawResponse,
+  });
+}
+
+/**
+The result of a `embed` call.
+It contains the embedding, the value, and additional information.
+ */
+export class EmbedResult<VALUE> {
+  /**
+The value that was embedded.
+   */
+  readonly value: VALUE;
+
+  /**
+The embedding of the value.
+  */
+  readonly embedding: Embedding;
+
+  /**
+Optional raw response data.
+   */
+  readonly rawResponse?: {
+    /**
+Response headers.
+     */
+    headers?: Record<string, string>;
+  };
+
+  constructor(options: {
+    value: VALUE;
+    embedding: Embedding;
+    rawResponse?: {
+      headers?: Record<string, string>;
+    };
+  }) {
+    this.value = options.value;
+    this.embedding = options.embedding;
+    this.rawResponse = options.rawResponse;
+  }
+}
@@ -0,0 +1 @@
+export * from './embed';
@@ -1,3 +1,4 @@
+export * from './embed';
 export * from './generate-object';
 export * from './generate-text';
 export * from './prompt';
 
@@ -0,0 +1,36 @@
+import { EmbeddingModelV1 } from '@ai-sdk/provider';
+
+export class MockEmbeddingModelV1<VALUE> implements EmbeddingModelV1<VALUE> {
+  readonly specificationVersion = 'v1';
+
+  readonly provider: EmbeddingModelV1<VALUE>['provider'];
+  readonly modelId: EmbeddingModelV1<VALUE>['modelId'];
+  readonly maxEmbeddingsPerCall: EmbeddingModelV1<VALUE>['maxEmbeddingsPerCall'];
+  readonly supportsParallelCalls: EmbeddingModelV1<VALUE>['supportsParallelCalls'];
+
+  doEmbed: EmbeddingModelV1<VALUE>['doEmbed'];
+
+  constructor({
+    provider = 'mock-provider',
+    modelId = 'mock-model-id',
+    maxEmbeddingsPerCall = 1,
+    supportsParallelCalls = false,
+    doEmbed = notImplemented,
+  }: {
+    provider?: EmbeddingModelV1<VALUE>['provider'];
+    modelId?: EmbeddingModelV1<VALUE>['modelId'];
+    maxEmbeddingsPerCall?: EmbeddingModelV1<VALUE>['maxEmbeddingsPerCall'];
+    supportsParallelCalls?: EmbeddingModelV1<VALUE>['supportsParallelCalls'];
+    doEmbed?: EmbeddingModelV1<VALUE>['doEmbed'];
+  }) {
+    this.provider = provider;
+    this.modelId = modelId;
+    this.maxEmbeddingsPerCall = maxEmbeddingsPerCall;
+    this.supportsParallelCalls = supportsParallelCalls;
+    this.doEmbed = doEmbed;
+  }
+}
+
+function notImplemented(): never {
+  throw new Error('Not implemented');
+}
@@ -0,0 +1,11 @@
+import { EmbeddingModelV1, EmbeddingModelV1Embedding } from '@ai-sdk/provider';
+
+/**
+Embedding model that is used by the AI SDK Core functions.
+*/
+export type EmbeddingModel<VALUE> = EmbeddingModelV1<VALUE>;
+
+/**
+Embedding.
+ */
+export type Embedding = EmbeddingModelV1Embedding;
@@ -1,2 +1,3 @@
+export * from './embedding-model';
 export * from './errors';
 export * from './language-model';
@@ -0,0 +1,106 @@
+import { EmbeddingModelV1Embedding } from '@ai-sdk/provider';
+import { JsonTestServer } from '@ai-sdk/provider-utils/test';
+import { createMistral } from './mistral-provider';
+
+const dummyEmbeddings = [
+  [0.1, 0.2, 0.3, 0.4, 0.5],
+  [0.6, 0.7, 0.8, 0.9, 1.0],
+];
+const testValues = ['sunny day at the beach', 'rainy day in the city'];
+
+const provider = createMistral({ apiKey: 'test-api-key' });
+const model = provider.embedding('mistral-embed');
+
+describe('doEmbed', () => {
+  const server = new JsonTestServer('https://api.mistral.ai/v1/embeddings');
+
+  server.setupTestEnvironment();
+
+  function prepareJsonResponse({
+    embeddings = dummyEmbeddings,
+  }: {
+    embeddings?: EmbeddingModelV1Embedding[];
+  } = {}) {
+    server.responseBodyJson = {
+      id: 'b322cfc2b9d34e2f8e14fc99874faee5',
+      object: 'list',
+      data: embeddings.map((embedding, i) => ({
+        object: 'embedding',
+        embedding,
+        index: i,
+      })),
+      model: 'mistral-embed',
+      usage: { prompt_tokens: 8, total_tokens: 8, completion_tokens: 0 },
+    };
+  }
+
+  it('should extract embedding', async () => {
+    prepareJsonResponse();
+
+    const { embeddings } = await model.doEmbed({ values: testValues });
+
+    expect(embeddings).toStrictEqual(dummyEmbeddings);
+  });
+
+  it('should expose the raw response headers', async () => {
+    prepareJsonResponse();
+
+    server.responseHeaders = {
+      'test-header': 'test-value',
+    };
+
+    const { rawResponse } = await model.doEmbed({ values: testValues });
+
+    expect(rawResponse?.headers).toStrictEqual({
+      // default headers:
+      'content-type': 'application/json',
+
+      // custom header
+      'test-header': 'test-value',
+    });
+  });
+
+  it('should pass the model and the values', async () => {
+    prepareJsonResponse();
+
+    await model.doEmbed({ values: testValues });
+
+    expect(await server.getRequestBodyJson()).toStrictEqual({
+      model: 'mistral-embed',
+      input: testValues,
+      encoding_format: 'float',
+    });
+  });
+
+  it('should pass custom headers', async () => {
+    prepareJsonResponse();
+
+    const provider = createMistral({
+      apiKey: 'test-api-key',
+      headers: {
+        'Custom-Header': 'test-header',
+      },
+    });
+
+    await provider.embedding('mistral-embed').doEmbed({
+      values: testValues,
+    });
+
+    const requestHeaders = await server.getRequestHeaders();
+    expect(requestHeaders.get('Custom-Header')).toStrictEqual('test-header');
+  });
+
+  it('should pass the api key as Authorization header', async () => {
+    prepareJsonResponse();
+
+    const provider = createMistral({ apiKey: 'test-api-key' });
+
+    await provider.embedding('mistral-embed').doEmbed({
+      values: testValues,
+    });
+
+    expect(
+      (await server.getRequestHeaders()).get('Authorization'),
+    ).toStrictEqual('Bearer test-api-key');
+  });
+});
@@ -0,0 +1,98 @@
+import {
+  EmbeddingModelV1,
+  TooManyEmbeddingValuesForCallError,
+} from '@ai-sdk/provider';
+import {
+  createJsonResponseHandler,
+  postJsonToApi,
+} from '@ai-sdk/provider-utils';
+import { z } from 'zod';
+import {
+  MistralEmbeddingModelId,
+  MistralEmbeddingSettings,
+} from './mistral-embedding-settings';
+import { mistralFailedResponseHandler } from './mistral-error';
+
+type MistralEmbeddingConfig = {
+  provider: string;
+  baseURL: string;
+  headers: () => Record<string, string | undefined>;
+};
+
+export class MistralEmbeddingModel implements EmbeddingModelV1<string> {
+  readonly specificationVersion = 'v1';
+  readonly modelId: MistralEmbeddingModelId;
+
+  private readonly config: MistralEmbeddingConfig;
+  private readonly settings: MistralEmbeddingSettings;
+
+  get provider(): string {
+    return this.config.provider;
+  }
+
+  get maxEmbeddingsPerCall(): number {
+    return this.settings.maxEmbeddingsPerCall ?? 32;
+  }
+
+  get supportsParallelCalls(): boolean {
+    // Parallel calls are technically possible,
+    // but I have been hitting rate limits and disable them for now.
+    return this.settings.supportsParallelCalls ?? false;
+  }
+
+  constructor(
+    modelId: MistralEmbeddingModelId,
+    settings: MistralEmbeddingSettings,
+    config: MistralEmbeddingConfig,
+  ) {
+    this.modelId = modelId;
+    this.settings = settings;
+    this.config = config;
+  }
+
+  async doEmbed({
+    values,
+    abortSignal,
+  }: Parameters<EmbeddingModelV1<string>['doEmbed']>[0]): Promise<
+    Awaited<ReturnType<EmbeddingModelV1<string>['doEmbed']>>
+  > {
+    if (values.length > this.maxEmbeddingsPerCall) {
+      throw new TooManyEmbeddingValuesForCallError({
+        provider: this.provider,
+        modelId: this.modelId,
+        maxEmbeddingsPerCall: this.maxEmbeddingsPerCall,
+        values,
+      });
+    }
+
+    const { responseHeaders, value: response } = await postJsonToApi({
+      url: `${this.config.baseURL}/embeddings`,
+      headers: this.config.headers(),
+      body: {
+        model: this.modelId,
+        input: values,
+        encoding_format: 'float',
+      },
+      failedResponseHandler: mistralFailedResponseHandler,
+      successfulResponseHandler: createJsonResponseHandler(
+        MistralTextEmbeddingResponseSchema,
+      ),
+      abortSignal,
+    });
+
+    return {
+      embeddings: response.data.map(item => item.embedding),
+      rawResponse: { headers: responseHeaders },
+    };
+  }
+}
+
+// minimal version of the schema, focussed on what is needed for the implementation
+// this approach limits breakages when the API changes and increases efficiency
+const MistralTextEmbeddingResponseSchema = z.object({
+  data: z.array(
+    z.object({
+      embedding: z.array(z.number()),
+    }),
+  ),
+});
@@ -0,0 +1,13 @@
+export type MistralEmbeddingModelId = 'mistral-embed' | (string & {});
+
+export interface MistralEmbeddingSettings {
+  /**
+Override the maximum number of embeddings per call.
+   */
+  maxEmbeddingsPerCall?: number;
+
+  /**
+Override the parallelism of embedding calls.
+    */
+  supportsParallelCalls?: boolean;
+}
@@ -8,17 +8,33 @@ import {
   MistralChatModelId,
   MistralChatSettings,
 } from './mistral-chat-settings';
+import {
+  MistralEmbeddingModelId,
+  MistralEmbeddingSettings,
+} from './mistral-embedding-settings';
+import { MistralEmbeddingModel } from './mistral-embedding-model';
 
 export interface MistralProvider {
   (
     modelId: MistralChatModelId,
     settings?: MistralChatSettings,
   ): MistralChatLanguageModel;
 
+  /**
+Creates a model for text generation.
+*/
   chat(
     modelId: MistralChatModelId,
     settings?: MistralChatSettings,
   ): MistralChatLanguageModel;
+
+  /**
+Creates a model for text embeddings.
+   */
+  embedding(
+    modelId: MistralEmbeddingModelId,
+    settings?: MistralEmbeddingSettings,
+  ): MistralEmbeddingModel;
 }
 
 export interface MistralProviderSettings {
@@ -53,26 +69,40 @@ Create a Mistral AI provider instance.
 export function createMistral(
   options: MistralProviderSettings = {},
 ): MistralProvider {
-  const createModel = (
+  const baseURL =
+    withoutTrailingSlash(options.baseURL ?? options.baseUrl) ??
+    'https://api.mistral.ai/v1';
+
+  const getHeaders = () => ({
+    Authorization: `Bearer ${loadApiKey({
+      apiKey: options.apiKey,
+      environmentVariableName: 'MISTRAL_API_KEY',
+      description: 'Mistral',
+    })}`,
+    ...options.headers,
+  });
+
+  const createChatModel = (
     modelId: MistralChatModelId,
     settings: MistralChatSettings = {},
   ) =>
     new MistralChatLanguageModel(modelId, settings, {
       provider: 'mistral.chat',
-      baseURL:
-        withoutTrailingSlash(options.baseURL ?? options.baseUrl) ??
-        'https://api.mistral.ai/v1',
-      headers: () => ({
-        Authorization: `Bearer ${loadApiKey({
-          apiKey: options.apiKey,
-          environmentVariableName: 'MISTRAL_API_KEY',
-          description: 'Mistral',
-        })}`,
-        ...options.headers,
-      }),
+      baseURL,
+      headers: getHeaders,
       generateId: options.generateId ?? generateId,
     });
 
+  const createEmbeddingModel = (
+    modelId: MistralEmbeddingModelId,
+    settings: MistralEmbeddingSettings = {},
+  ) =>
+    new MistralEmbeddingModel(modelId, settings, {
+      provider: 'mistral.embedding',
+      baseURL,
+      headers: getHeaders,
+    });
+
   const provider = function (
     modelId: MistralChatModelId,
     settings?: MistralChatSettings,
@@ -83,10 +113,11 @@ export function createMistral(
       );
     }
 
-    return createModel(modelId, settings);
+    return createChatModel(modelId, settings);
   };
 
-  provider.chat = createModel;
+  provider.chat = createChatModel;
+  provider.embedding = createEmbeddingModel;
 
   return provider as MistralProvider;
 }
 
@@ -0,0 +1,127 @@
+import { EmbeddingModelV1Embedding } from '@ai-sdk/provider';
+import { JsonTestServer } from '@ai-sdk/provider-utils/test';
+import { createOpenAI } from './openai-provider';
+
+const dummyEmbeddings = [
+  [0.1, 0.2, 0.3, 0.4, 0.5],
+  [0.6, 0.7, 0.8, 0.9, 1.0],
+];
+const testValues = ['sunny day at the beach', 'rainy day in the city'];
+
+const provider = createOpenAI({ apiKey: 'test-api-key' });
+const model = provider.embedding('text-embedding-3-large');
+
+describe('doEmbed', () => {
+  const server = new JsonTestServer('https://api.openai.com/v1/embeddings');
+
+  server.setupTestEnvironment();
+
+  function prepareJsonResponse({
+    embeddings = dummyEmbeddings,
+  }: {
+    embeddings?: EmbeddingModelV1Embedding[];
+  } = {}) {
+    server.responseBodyJson = {
+      object: 'list',
+      data: embeddings.map((embedding, i) => ({
+        object: 'embedding',
+        index: i,
+        embedding,
+      })),
+      model: 'text-embedding-3-large',
+      usage: { prompt_tokens: 8, total_tokens: 8 },
+    };
+  }
+
+  it('should extract embedding', async () => {
+    prepareJsonResponse();
+
+    const { embeddings } = await model.doEmbed({ values: testValues });
+
+    expect(embeddings).toStrictEqual(dummyEmbeddings);
+  });
+
+  it('should expose the raw response headers', async () => {
+    prepareJsonResponse();
+
+    server.responseHeaders = {
+      'test-header': 'test-value',
+    };
+
+    const { rawResponse } = await model.doEmbed({ values: testValues });
+
+    expect(rawResponse?.headers).toStrictEqual({
+      // default headers:
+      'content-type': 'application/json',
+
+      // custom header
+      'test-header': 'test-value',
+    });
+  });
+
+  it('should pass the model and the values', async () => {
+    prepareJsonResponse();
+
+    await model.doEmbed({ values: testValues });
+
+    expect(await server.getRequestBodyJson()).toStrictEqual({
+      model: 'text-embedding-3-large',
+      input: testValues,
+      encoding_format: 'float',
+    });
+  });
+
+  it('should pass the dimensions setting', async () => {
+    prepareJsonResponse();
+
+    await provider
+      .embedding('text-embedding-3-large', { dimensions: 64 })
+      .doEmbed({ values: testValues });
+
+    expect(await server.getRequestBodyJson()).toStrictEqual({
+      model: 'text-embedding-3-large',
+      input: testValues,
+      encoding_format: 'float',
+      dimensions: 64,
+    });
+  });
+
+  it('should pass custom headers', async () => {
+    prepareJsonResponse();
+
+    const provider = createOpenAI({
+      apiKey: 'test-api-key',
+      organization: 'test-organization',
+      project: 'test-project',
+      headers: {
+        'Custom-Header': 'test-header',
+      },
+    });
+
+    await provider.embedding('text-embedding-3-large').doEmbed({
+      values: testValues,
+    });
+
+    const requestHeaders = await server.getRequestHeaders();
+
+    expect(requestHeaders.get('OpenAI-Organization')).toStrictEqual(
+      'test-organization',
+    );
+    expect(requestHeaders.get('OpenAI-Project')).toStrictEqual('test-project');
+    expect(requestHeaders.get('Custom-Header')).toStrictEqual('test-header');
+  });
+
+  it('should pass the api key as Authorization header', async () => {
+    prepareJsonResponse();
+
+    const provider = createOpenAI({ apiKey: 'test-api-key' });
+
+    await provider.embedding('text-embedding-3-large').doEmbed({
+      values: testValues,
+    });
+
+    expect(
+      (await server.getRequestHeaders()).get('Authorization'),
+    ).toStrictEqual('Bearer test-api-key');
+  });
+});
@@ -0,0 +1,98 @@
+import {
+  EmbeddingModelV1,
+  TooManyEmbeddingValuesForCallError,
+} from '@ai-sdk/provider';
+import {
+  createJsonResponseHandler,
+  postJsonToApi,
+} from '@ai-sdk/provider-utils';
+import { z } from 'zod';
+import {
+  OpenAIEmbeddingModelId,
+  OpenAIEmbeddingSettings,
+} from './openai-embedding-settings';
+import { openaiFailedResponseHandler } from './openai-error';
+
+type OpenAIEmbeddingConfig = {
+  provider: string;
+  baseURL: string;
+  headers: () => Record<string, string | undefined>;
+};
+
+export class OpenAIEmbeddingModel implements EmbeddingModelV1<string> {
+  readonly specificationVersion = 'v1';
+  readonly modelId: OpenAIEmbeddingModelId;
+
+  private readonly config: OpenAIEmbeddingConfig;
+  private readonly settings: OpenAIEmbeddingSettings;
+
+  get provider(): string {
+    return this.config.provider;
+  }
+
+  get maxEmbeddingsPerCall(): number {
+    return this.settings.maxEmbeddingsPerCall ?? 2048;
+  }
+
+  get supportsParallelCalls(): boolean {
+    return this.settings.supportsParallelCalls ?? true;
+  }
+
+  constructor(
+    modelId: OpenAIEmbeddingModelId,
+    settings: OpenAIEmbeddingSettings,
+    config: OpenAIEmbeddingConfig,
+  ) {
+    this.modelId = modelId;
+    this.settings = settings;
+    this.config = config;
+  }
+
+  async doEmbed({
+    values,
+    abortSignal,
+  }: Parameters<EmbeddingModelV1<string>['doEmbed']>[0]): Promise<
+    Awaited<ReturnType<EmbeddingModelV1<string>['doEmbed']>>
+  > {
+    if (values.length > this.maxEmbeddingsPerCall) {
+      throw new TooManyEmbeddingValuesForCallError({
+        provider: this.provider,
+        modelId: this.modelId,
+        maxEmbeddingsPerCall: this.maxEmbeddingsPerCall,
+        values,
+      });
+    }
+
+    const { responseHeaders, value: response } = await postJsonToApi({
+      url: `${this.config.baseURL}/embeddings`,
+      headers: this.config.headers(),
+      body: {
+        model: this.modelId,
+        input: values,
+        encoding_format: 'float',
+        dimensions: this.settings.dimensions,
+        user: this.settings.user,
+      },
+      failedResponseHandler: openaiFailedResponseHandler,
+      successfulResponseHandler: createJsonResponseHandler(
+        openaiTextEmbeddingResponseSchema,
+      ),
+      abortSignal,
+    });
+
+    return {
+      embeddings: response.data.map(item => item.embedding),
+      rawResponse: { headers: responseHeaders },
+    };
+  }
+}
+
+// minimal version of the schema, focussed on what is needed for the implementation
+// this approach limits breakages when the API changes and increases efficiency
+const openaiTextEmbeddingResponseSchema = z.object({
+  data: z.array(
+    z.object({
+      embedding: z.array(z.number()),
+    }),
+  ),
+});
@@ -0,0 +1,29 @@
+export type OpenAIEmbeddingModelId =
+  | 'text-embedding-3-small'
+  | 'text-embedding-3-large'
+  | 'text-embedding-ada-002'
+  | (string & {});
+
+export interface OpenAIEmbeddingSettings {
+  /**
+Override the maximum number of embeddings per call.
+   */
+  maxEmbeddingsPerCall?: number;
+
+  /**
+Override the parallelism of embedding calls.
+    */
+  supportsParallelCalls?: boolean;
+
+  /**
+The number of dimensions the resulting output embeddings should have.
+Only supported in text-embedding-3 and later models.
+   */
+  dimensions?: number;
+
+  /**
+A unique identifier representing your end-user, which can help OpenAI to
+monitor and detect abuse. Learn more.
+*/
+  user?: string;
+}
@@ -1,11 +1,16 @@
+import { loadApiKey, withoutTrailingSlash } from '@ai-sdk/provider-utils';
 import { OpenAIChatLanguageModel } from './openai-chat-language-model';
 import { OpenAIChatModelId, OpenAIChatSettings } from './openai-chat-settings';
 import { OpenAICompletionLanguageModel } from './openai-completion-language-model';
 import {
   OpenAICompletionModelId,
   OpenAICompletionSettings,
 } from './openai-completion-settings';
-import { OpenAI } from './openai-facade';
+import { OpenAIEmbeddingModel } from './openai-embedding-model';
+import {
+  OpenAIEmbeddingModelId,
+  OpenAIEmbeddingSettings,
+} from './openai-embedding-settings';
 
 export interface OpenAIProvider {
   (
@@ -17,15 +22,29 @@ export interface OpenAIProvider {
     settings?: OpenAIChatSettings,
   ): OpenAIChatLanguageModel;
 
+  /**
+Creates an OpenAI chat model for text generation.
+   */
   chat(
     modelId: OpenAIChatModelId,
     settings?: OpenAIChatSettings,
   ): OpenAIChatLanguageModel;
 
+  /**
+Creates an OpenAI completion model for text generation.
+   */
   completion(
     modelId: OpenAICompletionModelId,
     settings?: OpenAICompletionSettings,
   ): OpenAICompletionLanguageModel;
+
+  /**
+Creates a model for text embeddings.
+   */
+  embedding(
+    modelId: OpenAIEmbeddingModelId,
+    settings?: OpenAIEmbeddingSettings,
+  ): OpenAIEmbeddingModel;
 }
 
 export interface OpenAIProviderSettings {
@@ -66,7 +85,50 @@ Create an OpenAI provider instance.
 export function createOpenAI(
   options: OpenAIProviderSettings = {},
 ): OpenAIProvider {
-  const openai = new OpenAI(options);
+  const baseURL =
+    withoutTrailingSlash(options.baseURL ?? options.baseUrl) ??
+    'https://api.openai.com/v1';
+
+  const getHeaders = () => ({
+    Authorization: `Bearer ${loadApiKey({
+      apiKey: options.apiKey,
+      environmentVariableName: 'OPENAI_API_KEY',
+      description: 'OpenAI',
+    })}`,
+    'OpenAI-Organization': options.organization,
+    'OpenAI-Project': options.project,
+    ...options.headers,
+  });
+
+  const createChatModel = (
+    modelId: OpenAIChatModelId,
+    settings: OpenAIChatSettings = {},
+  ) =>
+    new OpenAIChatLanguageModel(modelId, settings, {
+      provider: 'openai.chat',
+      baseURL,
+      headers: getHeaders,
+    });
+
+  const createCompletionModel = (
+    modelId: OpenAICompletionModelId,
+    settings: OpenAICompletionSettings = {},
+  ) =>
+    new OpenAICompletionLanguageModel(modelId, settings, {
+      provider: 'openai.completion',
+      baseURL,
+      headers: getHeaders,
+    });
+
+  const createEmbeddingModel = (
+    modelId: OpenAIEmbeddingModelId,
+    settings: OpenAIEmbeddingSettings = {},
+  ) =>
+    new OpenAIEmbeddingModel(modelId, settings, {
+      provider: 'openai.embedding',
+      baseURL,
+      headers: getHeaders,
+    });
 
   const provider = function (
     modelId: OpenAIChatModelId | OpenAICompletionModelId,
@@ -79,19 +141,23 @@ export function createOpenAI(
     }
 
     if (modelId === 'gpt-3.5-turbo-instruct') {
-      return openai.completion(modelId, settings as OpenAICompletionSettings);
-    } else {
-      return openai.chat(modelId, settings as OpenAIChatSettings);
+      return createCompletionModel(
+        modelId,
+        settings as OpenAICompletionSettings,
+      );
     }
+
+    return createChatModel(modelId, settings as OpenAIChatSettings);
   };
 
-  provider.chat = openai.chat.bind(openai);
-  provider.completion = openai.completion.bind(openai);
+  provider.chat = createChatModel;
+  provider.completion = createCompletionModel;
+  provider.embedding = createEmbeddingModel;
 
   return provider as OpenAIProvider;
 }
 
 /**
- * Default OpenAI provider instance.
+Default OpenAI provider instance.
  */
 export const openai = createOpenAI();
@@ -0,0 +1 @@
+export * from './v1/index';
@@ -0,0 +1,5 @@
+/**
+An embedding is a vector, i.e. an array of numbers.
+It is e.g. used to represent a text as a vector of word embeddings.
+ */
+export type EmbeddingModelV1Embedding = Array<number>;
@@ -0,0 +1,73 @@
+import { EmbeddingModelV1Embedding } from './embedding-model-v1-embedding';
+
+/**
+Experimental: Specification for an embedding model that implements the embedding model 
+interface version 1.
+
+VALUE is the type of the values that the model can embed.
+This will allow us to go beyond text embeddings in the future,
+e.g. to support image embeddings
+ */
+export type EmbeddingModelV1<VALUE> = {
+  /**
+The embedding model must specify which embedding model interface
+version it implements. This will allow us to evolve the embedding
+model interface and retain backwards compatibility. The different
+implementation versions can be handled as a discriminated union
+on our side.
+   */
+  readonly specificationVersion: 'v1';
+
+  /**
+Name of the provider for logging purposes.
+   */
+  readonly provider: string;
+
+  /**
+Provider-specific model ID for logging purposes.
+   */
+  readonly modelId: string;
+
+  /**
+Limit of how many embeddings can be generated in a single API call.
+   */
+  readonly maxEmbeddingsPerCall: number | undefined;
+
+  /**
+True if the model can handle multiple embedding calls in parallel.
+   */
+  readonly supportsParallelCalls: boolean;
+
+  /**
+Generates a list of embeddings for the given input text.
+
+Naming: "do" prefix to prevent accidental direct usage of the method
+by the user.
+   */
+  doEmbed(options: {
+    /**
+List of values to embed.
+     */
+    values: Array<VALUE>;
+
+    /**
+Abort signal for cancelling the operation.
+     */
+    abortSignal?: AbortSignal;
+  }): PromiseLike<{
+    /**
+Generated embeddings. They are in the same order as the input values.
+     */
+    embeddings: Array<EmbeddingModelV1Embedding>;
+
+    /**
+Optional raw response information for debugging purposes.
+     */
+    rawResponse?: {
+      /**
+Response headers.
+       */
+      headers?: Record<string, string>;
+    };
+  }>;
+};
@@ -0,0 +1,2 @@
+export * from './embedding-model-v1';
+export * from './embedding-model-v1-embedding';
@@ -10,6 +10,7 @@ export * from './load-api-key-error';
 export * from './no-object-generated-error';
 export * from './no-such-tool-error';
 export * from './retry-error';
+export * from './too-many-embedding-values-for-call-error';
 export * from './tool-call-parse-error';
 export * from './type-validation-error';
 export * from './unsupported-functionality-error';
 
@@ -0,0 +1,56 @@
+export class TooManyEmbeddingValuesForCallError extends Error {
+  readonly provider: string;
+  readonly modelId: string;
+  readonly maxEmbeddingsPerCall: number;
+  readonly values: Array<unknown>;
+
+  constructor(options: {
+    provider: string;
+    modelId: string;
+    maxEmbeddingsPerCall: number;
+    values: Array<unknown>;
+  }) {
+    super(
+      `Too many values for a single embedding call. ` +
+        `The ${options.provider} model "${options.modelId}" can only embed up to ` +
+        `${options.maxEmbeddingsPerCall} values per call, but ${options.values.length} values were provided.`,
+    );
+
+    this.name = 'AI_TooManyEmbeddingValuesForCallError';
+
+    this.provider = options.provider;
+    this.modelId = options.modelId;
+    this.maxEmbeddingsPerCall = options.maxEmbeddingsPerCall;
+    this.values = options.values;
+  }
+
+  static isInvalidPromptError(
+    error: unknown,
+  ): error is TooManyEmbeddingValuesForCallError {
+    return (
+      error instanceof Error &&
+      error.name === 'AI_TooManyEmbeddingValuesForCallError' &&
+      'provider' in error &&
+      typeof error.provider === 'string' &&
+      'modelId' in error &&
+      typeof error.modelId === 'string' &&
+      'maxEmbeddingsPerCall' in error &&
+      typeof error.maxEmbeddingsPerCall === 'number' &&
+      'values' in error &&
+      Array.isArray(error.values)
+    );
+  }
+
+  toJSON() {
+    return {
+      name: this.name,
+      message: this.message,
+      stack: this.stack,
+
+      provider: this.provider,
+      modelId: this.modelId,
+      maxEmbeddingsPerCall: this.maxEmbeddingsPerCall,
+      values: this.values,
+    };
+  }
+}
@@ -1,2 +1,3 @@
+export * from './embedding-model/index';
 export * from './errors/index';
 export * from './language-model/index';
Original file line number	Diff line number	Diff line change
`@@ -1,3 +1,4 @@`
	`1`	`+export * from './embed';`
`1`	`2`	`export * from './generate-object';`
`2`	`3`	`export * from './generate-text';`
`3`	`4`	`export * from './prompt';`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,3 @@`
	`1`	`+export * from './embedding-model';`
`1`	`2`	`export * from './errors';`
`2`	`3`	`export * from './language-model';`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,2 @@`
	`1`	`+export * from './embedding-model-v1';`
	`2`	`+export * from './embedding-model-v1-embedding';`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,3 @@`
	`1`	`+export * from './embedding-model/index';`
`1`	`2`	`export * from './errors/index';`
`2`	`3`	`export * from './language-model/index';`