vercel · Mar 13, 2024
diff --git a/‎.changeset/nine-planets-flow.md
+5 b/‎.changeset/nine-planets-flow.md
+5
diff --git a/‎docs/pages/docs/api-reference/providers/assistant-response.mdx
+69-106 b/‎docs/pages/docs/api-reference/providers/assistant-response.mdx
+69-106
diff --git a/‎examples/next-openai/app/api/assistant/route.ts
+68-105 b/‎examples/next-openai/app/api/assistant/route.ts
+68-105
diff --git a/‎examples/next-openai/package.json
+1-1 b/‎examples/next-openai/package.json
+1-1
diff --git a/‎packages/core/package.json
+1-1 b/‎packages/core/package.json
+1-1
diff --git a/‎packages/core/react/use-assistant.ts
+19-1 b/‎packages/core/react/use-assistant.ts
+19-1
diff --git a/‎packages/core/streams/assistant-response.ts
+47-1 b/‎packages/core/streams/assistant-response.ts
+47-1
diff --git a/‎pnpm-lock.yaml
+348-11 b/‎pnpm-lock.yaml
+348-11
@@ -0,0 +1,5 @@
+---
+'ai': patch
+---
+
+Added OpenAI assistants streaming.
@@ -35,7 +35,7 @@ The process parameter is a callback in which you can run the assistant on thread
 
 It gets invoked with the following functions that you can use to send messages and data messages to the client:
 
-- `sendMessage: (message: AssistantMessage) => void`: Sends an assistant message to the client.
+- `forwardStream: (stream: AssistantStream) => void`: Forwards the assistant response stream to the client.
 - `sendDataMessage: (message: DataMessage) => void`: Send a data message to the client. You can use this to provide information for rendering custom UIs while the assistant is processing the thread.
 
 ## Example
@@ -50,7 +50,6 @@ Server:
 ```tsx filename="app/api/assistant/route.ts"
 import { experimental_AssistantResponse } from 'ai';
 import OpenAI from 'openai';
-import { MessageContentText } from 'openai/resources/beta/threads/messages/messages';
 
 // Create an OpenAI API client (that's edge friendly!)
 const openai = new OpenAI({
@@ -86,118 +85,82 @@ export async function POST(req: Request) {
 
   return experimental_AssistantResponse(
     { threadId, messageId: createdMessage.id },
-    async ({ threadId, sendMessage, sendDataMessage }) => {
+    async ({ forwardStream, sendDataMessage }) => {
       // Run the assistant on the thread
-      const run = await openai.beta.threads.runs.create(threadId, {
+      const runStream = openai.beta.threads.runs.createAndStream(threadId, {
         assistant_id:
           process.env.ASSISTANT_ID ??
           (() => {
             throw new Error('ASSISTANT_ID is not set');
           })(),
       });
 
-      async function waitForRun(run: OpenAI.Beta.Threads.Runs.Run) {
-        // Poll for status change
-        while (run.status === 'queued' || run.status === 'in_progress') {
-          // delay for 500ms:
-          await new Promise(resolve => setTimeout(resolve, 500));
-
-          run = await openai.beta.threads.runs.retrieve(threadId!, run.id);
-        }
-
-        // Check the run status
-        if (
-          run.status === 'cancelled' ||
-          run.status === 'cancelling' ||
-          run.status === 'failed' ||
-          run.status === 'expired'
-        ) {
-          throw new Error(run.status);
-        }
-
-        if (run.status === 'requires_action') {
-          if (run.required_action?.type === 'submit_tool_outputs') {
-            const tool_outputs =
-              run.required_action.submit_tool_outputs.tool_calls.map(
-                toolCall => {
-                  const parameters = JSON.parse(toolCall.function.arguments);
-
-                  switch (toolCall.function.name) {
-                    case 'getRoomTemperature': {
-                      const temperature =
-                        homeTemperatures[
-                          parameters.room as keyof typeof homeTemperatures
-                        ];
-
-                      return {
-                        tool_call_id: toolCall.id,
-                        output: temperature.toString(),
-                      };
-                    }
-
-                    case 'setRoomTemperature': {
-                      const oldTemperature =
-                        homeTemperatures[
-                          parameters.room as keyof typeof homeTemperatures
-                        ];
-
-                      homeTemperatures[
-                        parameters.room as keyof typeof homeTemperatures
-                      ] = parameters.temperature;
-
-                      sendDataMessage({
-                        role: 'data',
-                        data: {
-                          oldTemperature,
-                          newTemperature: parameters.temperature,
-                          description: `Temperature in ${parameters.room} changed from ${oldTemperature} to ${parameters.temperature}`,
-                        },
-                      });
-
-                      return {
-                        tool_call_id: toolCall.id,
-                        output: `temperature set successfully`,
-                      };
-                    }
-
-                    default:
-                      throw new Error(
-                        `Unknown tool call function: ${toolCall.function.name}`,
-                      );
-                  }
-                },
-              );
-
-            run = await openai.beta.threads.runs.submitToolOutputs(
-              threadId!,
-              run.id,
-              { tool_outputs },
-            );
-
-            await waitForRun(run);
-          }
-        }
-      }
-
-      await waitForRun(run);
-
-      // Get new thread messages (after our message)
-      const responseMessages = (
-        await openai.beta.threads.messages.list(threadId, {
-          after: createdMessage.id,
-          order: 'asc',
-        })
-      ).data;
-
-      // Send the messages
-      for (const message of responseMessages) {
-        sendMessage({
-          id: message.id,
-          role: 'assistant',
-          content: message.content.filter(
-            content => content.type === 'text',
-          ) as Array<MessageContentText>,
-        });
+      // forward run status would stream message deltas
+      let runResult = await forwardStream(runStream);
+
+      // status can be: queued, in_progress, requires_action, cancelling, cancelled, failed, completed, or expired
+      while (
+        runResult.status === 'requires_action' &&
+        runResult.required_action?.type === 'submit_tool_outputs'
+      ) {
+        const tool_outputs =
+          runResult.required_action.submit_tool_outputs.tool_calls.map(
+            (toolCall: any) => {
+              const parameters = JSON.parse(toolCall.function.arguments);
+
+              switch (toolCall.function.name) {
+                case 'getRoomTemperature': {
+                  const temperature =
+                    homeTemperatures[
+                      parameters.room as keyof typeof homeTemperatures
+                    ];
+
+                  return {
+                    tool_call_id: toolCall.id,
+                    output: temperature.toString(),
+                  };
+                }
+
+                case 'setRoomTemperature': {
+                  const oldTemperature =
+                    homeTemperatures[
+                      parameters.room as keyof typeof homeTemperatures
+                    ];
+
+                  homeTemperatures[
+                    parameters.room as keyof typeof homeTemperatures
+                  ] = parameters.temperature;
+
+                  sendDataMessage({
+                    role: 'data',
+                    data: {
+                      oldTemperature,
+                      newTemperature: parameters.temperature,
+                      description: `Temperature in ${parameters.room} changed from ${oldTemperature} to ${parameters.temperature}`,
+                    },
+                  });
+
+                  return {
+                    tool_call_id: toolCall.id,
+                    output: `temperature set successfully`,
+                  };
+                }
+
+                default:
+                  throw new Error(
+                    `Unknown tool call function: ${toolCall.function.name}`,
+                  );
+              }
+            },
+          );
+
+        runResult = await forwardStream(
+          openai.beta.threads.runs.submitToolOutputsStream(
+            threadId,
+            runResult.id,
+            { tool_outputs },
+          ),
+        );
       }
     },
   );
 
@@ -1,6 +1,5 @@
 import { experimental_AssistantResponse } from 'ai';
 import OpenAI from 'openai';
-import { MessageContentText } from 'openai/resources/beta/threads/messages/messages';
 
 // Create an OpenAI API client (that's edge friendly!)
 const openai = new OpenAI({
@@ -36,118 +35,82 @@ export async function POST(req: Request) {
 
   return experimental_AssistantResponse(
     { threadId, messageId: createdMessage.id },
-    async ({ threadId, sendMessage, sendDataMessage }) => {
+    async ({ forwardStream, sendDataMessage }) => {
       // Run the assistant on the thread
-      const run = await openai.beta.threads.runs.create(threadId, {
+      const runStream = openai.beta.threads.runs.createAndStream(threadId, {
         assistant_id:
           process.env.ASSISTANT_ID ??
           (() => {
             throw new Error('ASSISTANT_ID is not set');
           })(),
       });
 
-      async function waitForRun(run: OpenAI.Beta.Threads.Runs.Run) {
-        // Poll for status change
-        while (run.status === 'queued' || run.status === 'in_progress') {
-          // delay for 500ms:
-          await new Promise(resolve => setTimeout(resolve, 500));
-
-          run = await openai.beta.threads.runs.retrieve(threadId!, run.id);
-        }
-
-        // Check the run status
-        if (
-          run.status === 'cancelled' ||
-          run.status === 'cancelling' ||
-          run.status === 'failed' ||
-          run.status === 'expired'
-        ) {
-          throw new Error(run.status);
-        }
-
-        if (run.status === 'requires_action') {
-          if (run.required_action?.type === 'submit_tool_outputs') {
-            const tool_outputs =
-              run.required_action.submit_tool_outputs.tool_calls.map(
-                toolCall => {
-                  const parameters = JSON.parse(toolCall.function.arguments);
-
-                  switch (toolCall.function.name) {
-                    case 'getRoomTemperature': {
-                      const temperature =
-                        homeTemperatures[
-                          parameters.room as keyof typeof homeTemperatures
-                        ];
-
-                      return {
-                        tool_call_id: toolCall.id,
-                        output: temperature.toString(),
-                      };
-                    }
-
-                    case 'setRoomTemperature': {
-                      const oldTemperature =
-                        homeTemperatures[
-                          parameters.room as keyof typeof homeTemperatures
-                        ];
-
-                      homeTemperatures[
-                        parameters.room as keyof typeof homeTemperatures
-                      ] = parameters.temperature;
-
-                      sendDataMessage({
-                        role: 'data',
-                        data: {
-                          oldTemperature,
-                          newTemperature: parameters.temperature,
-                          description: `Temperature in ${parameters.room} changed from ${oldTemperature} to ${parameters.temperature}`,
-                        },
-                      });
-
-                      return {
-                        tool_call_id: toolCall.id,
-                        output: `temperature set successfully`,
-                      };
-                    }
-
-                    default:
-                      throw new Error(
-                        `Unknown tool call function: ${toolCall.function.name}`,
-                      );
-                  }
-                },
-              );
-
-            run = await openai.beta.threads.runs.submitToolOutputs(
-              threadId!,
-              run.id,
-              { tool_outputs },
-            );
-
-            await waitForRun(run);
-          }
-        }
-      }
-
-      await waitForRun(run);
-
-      // Get new thread messages (after our message)
-      const responseMessages = (
-        await openai.beta.threads.messages.list(threadId, {
-          after: createdMessage.id,
-          order: 'asc',
-        })
-      ).data;
-
-      // Send the messages
-      for (const message of responseMessages) {
-        sendMessage({
-          id: message.id,
-          role: 'assistant',
-          content: message.content.filter(
-            content => content.type === 'text',
-          ) as Array<MessageContentText>,
-        });
+      // forward run status would stream message deltas
+      let runResult = await forwardStream(runStream);
+
+      // status can be: queued, in_progress, requires_action, cancelling, cancelled, failed, completed, or expired
+      while (
+        runResult.status === 'requires_action' &&
+        runResult.required_action?.type === 'submit_tool_outputs'
+      ) {
+        const tool_outputs =
+          runResult.required_action.submit_tool_outputs.tool_calls.map(
+            (toolCall: any) => {
+              const parameters = JSON.parse(toolCall.function.arguments);
+
+              switch (toolCall.function.name) {
+                case 'getRoomTemperature': {
+                  const temperature =
+                    homeTemperatures[
+                      parameters.room as keyof typeof homeTemperatures
+                    ];
+
+                  return {
+                    tool_call_id: toolCall.id,
+                    output: temperature.toString(),
+                  };
+                }
+
+                case 'setRoomTemperature': {
+                  const oldTemperature =
+                    homeTemperatures[
+                      parameters.room as keyof typeof homeTemperatures
+                    ];
+
+                  homeTemperatures[
+                    parameters.room as keyof typeof homeTemperatures
+                  ] = parameters.temperature;
+
+                  sendDataMessage({
+                    role: 'data',
+                    data: {
+                      oldTemperature,
+                      newTemperature: parameters.temperature,
+                      description: `Temperature in ${parameters.room} changed from ${oldTemperature} to ${parameters.temperature}`,
+                    },
+                  });
+
+                  return {
+                    tool_call_id: toolCall.id,
+                    output: `temperature set successfully`,
+                  };
+                }
+
+                default:
+                  throw new Error(
+                    `Unknown tool call function: ${toolCall.function.name}`,
+                  );
+              }
+            },
+          );
+
+        runResult = await forwardStream(
+          openai.beta.threads.runs.submitToolOutputsStream(
+            threadId,
+            runResult.id,
+            { tool_outputs },
+          ),
+        );
       }
     },
   );
 
@@ -11,7 +11,7 @@
   "dependencies": {
     "ai": "3.0.10",
     "next": "14.1.1",
-    "openai": "4.16.1",
+    "openai": "4.29.0",
     "react": "18.2.0",
     "react-dom": "^18.2.0"
   },
 
@@ -109,7 +109,7 @@
     "jsdom": "^23.0.0",
     "langchain": "0.0.196",
     "msw": "2.0.9",
-    "openai": "4.28.4",
+    "openai": "4.29.0",
     "react-dom": "^18.2.0",
     "react-server-dom-webpack": "18.3.0-canary-eb33bd747-20240312",
     "solid-js": "^1.8.7",
 
@@ -3,6 +3,7 @@
 import { useState } from 'react';
 import { readDataStream } from '../shared/read-data-stream';
 import { Message } from '../shared/types';
+import { nanoid } from 'nanoid';
 
 export type AssistantStatus = 'in_progress' | 'awaiting_message';
 
@@ -172,11 +173,28 @@ export function experimental_useAssistant({
             break;
           }
 
+          case 'text': {
+            // text delta - add to last message:
+            setMessages(messages => {
+              const lastMessage = messages[messages.length - 1];
+              return [
+                ...messages.slice(0, messages.length - 1),
+                {
+                  id: lastMessage.id,
+                  role: lastMessage.role,
+                  content: lastMessage.content + value,
+                },
+              ];
+            });
+
+            break;
+          }
+
           case 'data_message': {
             setMessages(messages => [
               ...messages,
               {
-                id: value.id ?? '',
+                id: value.id ?? nanoid(),
                 role: 'data',
                 content: '',
                 data: value.data,
 
@@ -1,3 +1,4 @@
+import { AssistantStream } from 'openai/lib/AssistantStream';
 import { formatStreamPart } from '../shared/stream-parts';
 import { AssistantMessage, DataMessage } from '../shared/types';
 
@@ -6,11 +7,12 @@ type AssistantResponseSettings = {
   messageId: string;
 };
 
-type AssistantResponseCallback = (stream: {
+type AssistantResponseCallback = (options: {
   threadId: string;
   messageId: string;
   sendMessage: (message: AssistantMessage) => void;
   sendDataMessage: (message: DataMessage) => void;
+  forwardStream: (stream: AssistantStream) => Promise<any>;
 }) => Promise<void>;
 
 export function experimental_AssistantResponse(
@@ -39,6 +41,49 @@ export function experimental_AssistantResponse(
         );
       };
 
+      const forwardStream = async (stream: AssistantStream) => {
+        let result: any = undefined;
+
+        for await (const value of stream) {
+          switch (value.event) {
+            case 'thread.message.created': {
+              controller.enqueue(
+                textEncoder.encode(
+                  formatStreamPart('assistant_message', {
+                    id: value.data.id,
+                    role: 'assistant',
+                    content: [{ type: 'text', text: { value: '' } }],
+                  }),
+                ),
+              );
+              break;
+            }
+
+            case 'thread.message.delta': {
+              const content = value.data.delta.content?.[0];
+
+              if (content?.type === 'text' && content.text?.value != null) {
+                controller.enqueue(
+                  textEncoder.encode(
+                    formatStreamPart('text', content.text.value),
+                  ),
+                );
+              }
+
+              break;
+            }
+
+            case 'thread.run.completed':
+            case 'thread.run.requires_action': {
+              result = value.data;
+              break;
+            }
+          }
+        }
+
+        return result;
+      };
+
       // send the threadId and messageId as the first message:
       controller.enqueue(
         textEncoder.encode(
@@ -55,6 +100,7 @@ export function experimental_AssistantResponse(
           messageId,
           sendMessage,
           sendDataMessage,
+          forwardStream,
         });
       } catch (error) {
         sendError((error as any).message ?? `${error}`);