feat (provider/groq): reasoning format support (#5273)

lgrammel · web-flow · commit d0c4659ec134 · 2025-03-20T10:47:02.000+01:00
diff --git a/.changeset/perfect-frogs-notice.md b/.changeset/perfect-frogs-notice.md
@@ -0,0 +1,7 @@
+---
+'@ai-sdk/provider-utils': patch
+'@ai-sdk/google': patch
+'@ai-sdk/groq': patch
+---
+
+feat (provider-utils): parseProviderOptions function
diff --git a/.changeset/selfish-berries-think.md b/.changeset/selfish-berries-think.md
@@ -0,0 +1,5 @@
+---
+'@ai-sdk/groq': patch
+---
+
+fix (provider/groq): skip empty text deltas
diff --git a/.changeset/silent-bees-smell.md b/.changeset/silent-bees-smell.md
@@ -0,0 +1,5 @@
+---
+'@ai-sdk/groq': patch
+---
+
+feat (provider/groq): reasoning format support
diff --git a/content/providers/01-ai-sdk-providers/09-groq.mdx b/content/providers/01-ai-sdk-providers/09-groq.mdx
@@ -77,20 +77,24 @@ const model = groq('gemma2-9b-it');
 
 ### Reasoning Models
 
-Groq exposes the thinking of `deepseek-r1-distill-llama-70b` in the generated text using the `<think>` tag.
-You can use the `extractReasoningMiddleware` to extract this reasoning and expose it as a `reasoning` property on the result:
+Groq offers several reasoning models such as `qwen-qwq-32b` and `deepseek-r1-distill-llama-70b`.
+You can configure how the reasoning is exposed in the generated text by using the `reasoningFormat` option.
+It supports the options `parsed`, `hidden`, and `raw`.
 
 ```ts
 import { groq } from '@ai-sdk/groq';
-import { wrapLanguageModel, extractReasoningMiddleware } from 'ai';
+import { generateText } from 'ai';
 
-const enhancedModel = wrapLanguageModel({
-  model: groq('deepseek-r1-distill-llama-70b'),
-  middleware: extractReasoningMiddleware({ tagName: 'think' }),
+const result = await generateText({
+  model: groq('qwen-qwq-32b'),
+  providerOptions: {
+    groq: { reasoningFormat: 'parsed' },
+  },
+  prompt: 'How many "r"s are in the word "strawberry"?',
 });
 ```
 
-You can then use that enhanced model in functions like `generateText` and `streamText`.
+<Note>Only Groq reasoning models support the `reasoningFormat` option.</Note>
 
 ### Example
 
@@ -110,13 +114,18 @@ const { text } = await generateText({
 
 | Model                           | Image Input         | Object Generation   | Tool Usage          | Tool Streaming      |
 | ------------------------------- | ------------------- | ------------------- | ------------------- | ------------------- |
-| `deepseek-r1-distill-llama-70b` | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `gemma2-9b-it`                  | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
 | `llama-3.3-70b-versatile`       | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
 | `llama-3.1-8b-instant`          | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
-| `mistral-saba-24b`              | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
-| `qwen-qwq-32b`                  | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `llama-guard-3-8b`              | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `llama3-70b-8192`               | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `llama3-8b-8192`                | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
 | `mixtral-8x7b-32768`            | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
-| `gemma2-9b-it`                  | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `qwen-qwq-32b`                  | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `mistral-saba-24b`              | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `qwen-2.5-32b`                  | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `deepseek-r1-distill-qwen-32b`  | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
+| `deepseek-r1-distill-llama-70b` | <Cross size={18} /> | <Check size={18} /> | <Check size={18} /> | <Check size={18} /> |
 
 <Note>
   The table above lists popular models. Please see the [Groq
diff --git a/examples/ai-core/src/generate-text/groq-reasoning.ts b/examples/ai-core/src/generate-text/groq-reasoning.ts
@@ -0,0 +1,26 @@
+import { groq } from '@ai-sdk/groq';
+import { generateText } from 'ai';
+import 'dotenv/config';
+
+async function main() {
+  const result = await generateText({
+    model: groq('qwen-qwq-32b'),
+    providerOptions: {
+      groq: { reasoningFormat: 'parsed' },
+    },
+    prompt: 'How many "r"s are in the word "strawberry"?',
+  });
+
+  console.log('Reasoning:');
+  console.log(result.reasoning);
+  console.log();
+
+  console.log('Text:');
+  console.log(result.text);
+  console.log();
+
+  console.log('Token usage:', result.usage);
+  console.log('Finish reason:', result.finishReason);
+}
+
+main().catch(console.error);
diff --git a/examples/ai-core/src/stream-text/groq-reasoning-fullstream.ts b/examples/ai-core/src/stream-text/groq-reasoning-fullstream.ts
@@ -1,13 +1,13 @@
 import { groq } from '@ai-sdk/groq';
-import { extractReasoningMiddleware, streamText, wrapLanguageModel } from 'ai';
+import { streamText } from 'ai';
 import 'dotenv/config';
 
 async function main() {
   const result = streamText({
-    model: wrapLanguageModel({
-      model: groq('deepseek-r1-distill-llama-70b'),
-      middleware: extractReasoningMiddleware({ tagName: 'think' }),
-    }),
+    model: groq('deepseek-r1-distill-llama-70b'),
+    providerOptions: {
+      groq: { reasoningFormat: 'parsed' },
+    },
     prompt: 'How many "r"s are in the word "strawberry"?',
   });
 
diff --git a/packages/google/src/google-generative-ai-language-model.ts b/packages/google/src/google-generative-ai-language-model.ts
@@ -1,5 +1,4 @@
 import {
-  InvalidArgumentError,
   LanguageModelV1,
   LanguageModelV1CallWarning,
   LanguageModelV1FinishReason,
@@ -14,9 +13,9 @@ import {
   combineHeaders,
   createEventSourceResponseHandler,
   createJsonResponseHandler,
+  parseProviderOptions,
   postJsonToApi,
   resolve,
-  safeValidateTypes,
 } from '@ai-sdk/provider-utils';
 import { z } from 'zod';
 import { convertJSONSchemaToOpenAPISchema } from './convert-json-schema-to-openapi-schema';
@@ -86,22 +85,13 @@ export class GoogleGenerativeAILanguageModel implements LanguageModelV1 {
 
     const warnings: LanguageModelV1CallWarning[] = [];
 
-    // parse and validate provider options:
-    const parsedProviderOptions =
-      providerMetadata != null
-        ? safeValidateTypes({
-            value: providerMetadata,
-            schema: providerOptionsSchema,
-          })
-        : { success: true as const, value: undefined };
-    if (!parsedProviderOptions.success) {
-      throw new InvalidArgumentError({
-        argument: 'providerOptions',
-        message: 'invalid provider options',
-        cause: parsedProviderOptions.error,
-      });
-    }
-    const googleOptions = parsedProviderOptions.value?.google;
+    const googleOptions = parseProviderOptions({
+      provider: 'google',
+      providerOptions: providerMetadata,
+      schema: z.object({
+        responseModalities: z.array(z.enum(['TEXT', 'IMAGE'])).nullish(),
+      }),
+    });
 
     const generationConfig = {
       // standardized settings:
@@ -633,11 +623,3 @@ const chunkSchema = z.object({
     })
     .nullish(),
 });
-
-const providerOptionsSchema = z.object({
-  google: z
-    .object({
-      responseModalities: z.array(z.enum(['TEXT', 'IMAGE'])).nullish(),
-    })
-    .nullish(),
-});
diff --git a/packages/groq/src/groq-chat-language-model.test.ts b/packages/groq/src/groq-chat-language-model.test.ts
@@ -46,6 +46,7 @@ describe('doGenerate', () => {
 
   function prepareJsonResponse({
     content = '',
+    reasoning,
     tool_calls,
     function_call,
     usage = {
@@ -59,6 +60,7 @@ describe('doGenerate', () => {
     model = 'gemma2-9b-it',
   }: {
     content?: string;
+    reasoning?: string;
     tool_calls?: Array<{
       id: string;
       type: 'function';
@@ -92,6 +94,7 @@ describe('doGenerate', () => {
           message: {
             role: 'assistant',
             content,
+            reasoning,
             tool_calls,
             function_call,
           },
@@ -115,6 +118,20 @@ describe('doGenerate', () => {
     expect(text).toStrictEqual('Hello, World!');
   });
 
+  it('should extract reasoning', async () => {
+    prepareJsonResponse({
+      reasoning: 'This is a test reasoning',
+    });
+
+    const { reasoning } = await model.doGenerate({
+      inputFormat: 'prompt',
+      mode: { type: 'regular' },
+      prompt: TEST_PROMPT,
+    });
+
+    expect(reasoning).toStrictEqual('This is a test reasoning');
+  });
+
   it('should extract usage', async () => {
     prepareJsonResponse({
       content: '',
@@ -249,13 +266,17 @@ describe('doGenerate', () => {
       inputFormat: 'prompt',
       mode: { type: 'regular' },
       prompt: TEST_PROMPT,
+      providerMetadata: {
+        groq: { reasoningFormat: 'hidden' },
+      },
     });
 
     expect(await server.getRequestBodyJson()).toStrictEqual({
       model: 'gemma2-9b-it',
       messages: [{ role: 'user', content: 'Hello' }],
       parallel_tool_calls: false,
       user: 'test-user-id',
+      reasoning_format: 'hidden',
     });
   });
 
@@ -489,7 +510,6 @@ describe('doStream', () => {
         modelId: 'gemma2-9b-it',
         timestamp: new Date('2023-12-15T16:17:00.000Z'),
       },
-      { type: 'text-delta', textDelta: '' },
       { type: 'text-delta', textDelta: 'Hello' },
       { type: 'text-delta', textDelta: ', ' },
       { type: 'text-delta', textDelta: 'World!' },
@@ -501,6 +521,50 @@ describe('doStream', () => {
     ]);
   });
 
+  it('should stream reasoning deltas', async () => {
+    server.responseChunks = [
+      `data: {"id":"chatcmpl-e7f8e220-656c-4455-a132-dacfc1370798","object":"chat.completion.chunk","created":1702657020,"model":"gemma2-9b-it",` +
+        `"system_fingerprint":null,"choices":[{"index":0,"delta":{"role":"assistant","content":""},"finish_reason":null}]}\n\n`,
+      `data: {"id":"chatcmpl-e7f8e220-656c-4455-a132-dacfc1370798","object":"chat.completion.chunk","created":1702657020,"model":"gemma2-9b-it",` +
+        `"system_fingerprint":null,"choices":[{"index":1,"delta":{"reasoning":"I think,"},"finish_reason":null}]}\n\n`,
+      `data: {"id":"chatcmpl-e7f8e220-656c-4455-a132-dacfc1370798","object":"chat.completion.chunk","created":1702657020,"model":"gemma2-9b-it",` +
+        `"system_fingerprint":null,"choices":[{"index":1,"delta":{"reasoning":"therefore I am."},"finish_reason":null}]}\n\n`,
+      `data: {"id":"chatcmpl-e7f8e220-656c-4455-a132-dacfc1370798","object":"chat.completion.chunk","created":1702657020,"model":"gemma2-9b-it",` +
+        `"system_fingerprint":null,"choices":[{"index":1,"delta":{"content":"Hello"},"finish_reason":null}]}\n\n`,
+      `data: {"id":"chatcmpl-e7f8e220-656c-4455-a132-dacfc1370798","object":"chat.completion.chunk","created":1702657020,"model":"gemma2-9b-it",` +
+        `"system_fingerprint":null,"choices":[{"index":0,"delta":{},"finish_reason":"stop"}]}\n\n`,
+      `data: {"id":"chatcmpl-e7f8e220-656c-4455-a132-dacfc1370798","object":"chat.completion.chunk","created":1729171479,"model":"gemma2-9b-it",` +
+        `"system_fingerprint":"fp_10c08bf97d","choices":[{"index":0,"delta":{},"logprobs":null,"finish_reason":"stop"}],` +
+        `"x_groq":{"id":"req_01jadadp0femyae9kav1gpkhe8","usage":{"queue_time":0.061348671,"prompt_tokens":18,"prompt_time":0.000211569,` +
+        `"completion_tokens":439,"completion_time":0.798181818,"total_tokens":457,"total_time":0.798393387}}}\n\n`,
+      'data: [DONE]\n\n',
+    ];
+
+    const { stream } = await model.doStream({
+      inputFormat: 'prompt',
+      mode: { type: 'regular' },
+      prompt: TEST_PROMPT,
+    });
+
+    // note: space moved to last chunk bc of trimming
+    expect(await convertReadableStreamToArray(stream)).toStrictEqual([
+      {
+        type: 'response-metadata',
+        id: 'chatcmpl-e7f8e220-656c-4455-a132-dacfc1370798',
+        modelId: 'gemma2-9b-it',
+        timestamp: new Date('2023-12-15T16:17:00.000Z'),
+      },
+      { type: 'reasoning', textDelta: 'I think,' },
+      { type: 'reasoning', textDelta: 'therefore I am.' },
+      { type: 'text-delta', textDelta: 'Hello' },
+      {
+        type: 'finish',
+        finishReason: 'stop',
+        usage: { promptTokens: 18, completionTokens: 439 },
+      },
+    ]);
+  });
+
   it('should stream tool deltas', async () => {
     server.responseChunks = [
       `data: {"id":"chatcmpl-e7f8e220-656c-4455-a132-dacfc1370798","object":"chat.completion.chunk","created":1711357598,"model":"gemma2-9b-it",` +
@@ -828,10 +892,6 @@ describe('doStream', () => {
         modelId: 'meta/llama-3.1-8b-instruct:fp8',
         timestamp: new Date('2024-12-02T17:57:21.000Z'),
       },
-      {
-        type: 'text-delta',
-        textDelta: '',
-      },
       {
         type: 'tool-call-delta',
         toolCallId: 'chatcmpl-tool-b3b307239370432d9910d4b79b4dbbaa',
diff --git a/packages/groq/src/groq-chat-language-model.ts b/packages/groq/src/groq-chat-language-model.ts
@@ -14,6 +14,7 @@ import {
   createJsonResponseHandler,
   generateId,
   isParsableJson,
+  parseProviderOptions,
   postJsonToApi,
 } from '@ai-sdk/provider-utils';
 import { z } from 'zod';
@@ -74,6 +75,7 @@ export class GroqChatLanguageModel implements LanguageModelV1 {
     responseFormat,
     seed,
     stream,
+    providerMetadata,
   }: Parameters<LanguageModelV1['doGenerate']>[0] & {
     stream: boolean;
   }) {
@@ -100,6 +102,14 @@ export class GroqChatLanguageModel implements LanguageModelV1 {
       });
     }
 
+    const groqOptions = parseProviderOptions({
+      provider: 'groq',
+      providerOptions: providerMetadata,
+      schema: z.object({
+        reasoningFormat: z.enum(['parsed', 'raw', 'hidden']).nullish(),
+      }),
+    });
+
     const baseArgs = {
       // model id:
       model: this.modelId,
@@ -124,6 +134,9 @@ export class GroqChatLanguageModel implements LanguageModelV1 {
           ? { type: 'json_object' }
           : undefined,
 
+      // provider options:
+      reasoning_format: groqOptions?.reasoningFormat,
+
       // messages:
       messages: convertToGroqChatMessages(prompt),
     };
@@ -214,6 +227,7 @@ export class GroqChatLanguageModel implements LanguageModelV1 {
 
     return {
       text: choice.message.content ?? undefined,
+      reasoning: choice.message.reasoning ?? undefined,
       toolCalls: choice.message.tool_calls?.map(toolCall => ({
         toolCallType: 'function',
         toolCallId: toolCall.id ?? generateId(),
@@ -332,7 +346,14 @@ export class GroqChatLanguageModel implements LanguageModelV1 {
 
             const delta = choice.delta;
 
-            if (delta.content != null) {
+            if (delta.reasoning != null && delta.reasoning.length > 0) {
+              controller.enqueue({
+                type: 'reasoning',
+                textDelta: delta.reasoning,
+              });
+            }
+
+            if (delta.content != null && delta.content.length > 0) {
               controller.enqueue({
                 type: 'text-delta',
                 textDelta: delta.content,
@@ -479,8 +500,8 @@ const groqChatResponseSchema = z.object({
   choices: z.array(
     z.object({
       message: z.object({
-        role: z.literal('assistant').nullish(),
         content: z.string().nullish(),
+        reasoning: z.string().nullish(),
         tool_calls: z
           .array(
             z.object({
@@ -517,8 +538,8 @@ const groqChatChunkSchema = z.union([
       z.object({
         delta: z
           .object({
-            role: z.enum(['assistant']).nullish(),
             content: z.string().nullish(),
+            reasoning: z.string().nullish(),
             tool_calls: z
               .array(
                 z.object({
diff --git a/packages/groq/src/groq-chat-settings.ts b/packages/groq/src/groq-chat-settings.ts
diff --git a/packages/provider-utils/src/index.ts b/packages/provider-utils/src/index.ts
diff --git a/packages/provider-utils/src/parse-provider-options.ts b/packages/provider-utils/src/parse-provider-options.ts

-Original file line number
+Diff line change
 // https://console.groq.com/docs/models
 -// production models
 export type GroqChatModelId =
 -  | 'deepseek-r1-distill-llama-70b'
 +  // production models
   | 'gemma2-9b-it'
 -  | 'gemma-7b-it'
   | 'llama-3.3-70b-versatile'
   | 'llama-3.1-8b-instant'
   | 'llama-guard-3-8b'
   | 'llama3-70b-8192'
   | 'llama3-8b-8192'
   | 'mixtral-8x7b-32768'
 +  // preview models (selection)
 +  | 'qwen-qwq-32b'
 +  | 'mistral-saba-24b'
 +  | 'qwen-2.5-32b'
 +  | 'deepseek-r1-distill-qwen-32b'
 +  | 'deepseek-r1-distill-llama-70b'
   | (string & {});
 export interface GroqChatSettings {
-Original file line number
+Diff line change
 export { loadSetting } from './load-setting';
 export * from './parse-json';
 export * from './post-to-api';
 -export * from './resolve';
 export * from './remove-undefined-entries';
 +export * from './resolve';
 export * from './response-handler';
 export * from './uint8-utils';
 export * from './validate-types';
 export * from './validator';
 export * from './without-trailing-slash';
 export type { IDGenerator } from './generate-id';
 +export { parseProviderOptions } from './parse-provider-options';
 export type { CoreToolCall, ToolCall } from './types/tool-call';
 export type { CoreToolResult, ToolResult } from './types/tool-result';
-Original file line number
+Diff line change
 +import { InvalidArgumentError } from '@ai-sdk/provider';
 +import { safeValidateTypes } from './validate-types';
 +import { z } from 'zod';
++
 +export function parseProviderOptions<T>({
 +  provider,
 +  providerOptions,
 +  schema,
 +}: {
 +  provider: string;
 +  providerOptions: Record<string, unknown> | undefined;
 +  schema: z.ZodSchema<T>;
 +}): T | undefined {
 +  if (providerOptions?.[provider] == null) {
 +    return undefined;
 +  }
++
 +  const parsedProviderOptions = safeValidateTypes({
 +    value: providerOptions[provider],
 +    schema,
 +  });
++
 +  if (!parsedProviderOptions.success) {
 +    throw new InvalidArgumentError({
 +      argument: 'providerOptions',
 +      message: `invalid ${provider} provider options`,
 +      cause: parsedProviderOptions.error,
 +    });
 +  }
++
 +  return parsedProviderOptions.value;
 +}