fix (ai/core): generateText token usage is sum over all roundtrips (#2304)

lgrammel · web-flow · commit 811f4493283f · 2024-07-16T20:28:28.000+02:00
diff --git a/.changeset/cyan-brooms-share.md b/.changeset/cyan-brooms-share.md
@@ -0,0 +1,5 @@
+---
+'ai': patch
+---
+
+fix (ai/core): generateText token usage is sum over all roundtrips
diff --git a/packages/core/core/generate-text/generate-text.test.ts b/packages/core/core/generate-text/generate-text.test.ts
@@ -494,6 +494,14 @@ describe('options.maxToolRoundtrips', () => {
       assert.deepStrictEqual(result.toolResults, []);
     });
 
+    it('should sum token usage', () => {
+      assert.deepStrictEqual(result.usage, {
+        completionTokens: 25,
+        promptTokens: 20,
+        totalTokens: 45,
+      });
+    });
+
     it('should return information about all roundtrips', () => {
       assert.deepStrictEqual(result.roundtrips, [
         {
diff --git a/packages/core/core/generate-text/generate-text.ts b/packages/core/core/generate-text/generate-text.ts
@@ -165,6 +165,11 @@ By default, it's set to 0, which will disable the feature.
       const responseMessages: Array<CoreAssistantMessage | CoreToolMessage> =
         [];
       const roundtrips: GenerateTextResult<TOOLS>['roundtrips'] = [];
+      const usage: CompletionTokenUsage = {
+        completionTokens: 0,
+        promptTokens: 0,
+        totalTokens: 0,
+      };
 
       do {
         // once we have a roundtrip, we need to switch to messages format:
@@ -219,13 +224,21 @@ By default, it's set to 0, which will disable the feature.
                 tracer,
               });
 
+        // token usage:
+        const currentUsage = calculateCompletionTokenUsage(
+          currentModelResponse.usage,
+        );
+        usage.completionTokens += currentUsage.completionTokens;
+        usage.promptTokens += currentUsage.promptTokens;
+        usage.totalTokens += currentUsage.totalTokens;
+
         // add roundtrip information:
         roundtrips.push({
           text: currentModelResponse.text ?? '',
           toolCalls: currentToolCalls,
           toolResults: currentToolResults,
           finishReason: currentModelResponse.finishReason,
-          usage: calculateCompletionTokenUsage(currentModelResponse.usage),
+          usage: currentUsage,
           warnings: currentModelResponse.warnings,
           logprobs: currentModelResponse.logprobs,
         });
@@ -267,7 +280,7 @@ By default, it's set to 0, which will disable the feature.
         toolCalls: currentToolCalls,
         toolResults: currentToolResults,
         finishReason: currentModelResponse.finishReason,
-        usage: calculateCompletionTokenUsage(currentModelResponse.usage),
+        usage,
         warnings: currentModelResponse.warnings,
         rawResponse: currentModelResponse.rawResponse,
         logprobs: currentModelResponse.logprobs,