openai · Oct 1, 2024
diff --git a/‎.stats.yml
+1-1 b/‎.stats.yml
+1-1
diff --git a/‎src/openai/resources/beta/chat/completions.py
+16 b/‎src/openai/resources/beta/chat/completions.py
+16
diff --git a/‎src/openai/resources/chat/completions.py
+92-12 b/‎src/openai/resources/chat/completions.py
+92-12
diff --git a/‎src/openai/types/chat/completion_create_params.py
+17-1 b/‎src/openai/types/chat/completion_create_params.py
+17-1
diff --git a/‎src/openai/types/chat_model.py
+1 b/‎src/openai/types/chat_model.py
+1
diff --git a/‎src/openai/types/completion_usage.py
+15-1 b/‎src/openai/types/completion_usage.py
+15-1
diff --git a/‎tests/api_resources/chat/test_completions.py
+8 b/‎tests/api_resources/chat/test_completions.py
+8
diff --git a/‎tests/lib/chat/test_completions.py
+12-6 b/‎tests/lib/chat/test_completions.py
+12-6
diff --git a/‎tests/lib/chat/test_completions_streaming.py
+2-1 b/‎tests/lib/chat/test_completions_streaming.py
+2-1
@@ -1,2 +1,2 @@
 configured_endpoints: 68
-openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/openai-8ad878332083dd506a478a293db78dc9e7b1b2124f2682e1d991225bc5bbcc3b.yml
+openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/openai-52b934aee6468039ec7f4ce046a282b5fbce114afc708e70f17121df654f71da.yml
@@ -69,12 +69,14 @@ def parse(
         logprobs: Optional[bool] | NotGiven = NOT_GIVEN,
         max_completion_tokens: Optional[int] | NotGiven = NOT_GIVEN,
         max_tokens: Optional[int] | NotGiven = NOT_GIVEN,
+        metadata: Optional[Dict[str, str]] | NotGiven = NOT_GIVEN,
         n: Optional[int] | NotGiven = NOT_GIVEN,
         parallel_tool_calls: bool | NotGiven = NOT_GIVEN,
         presence_penalty: Optional[float] | NotGiven = NOT_GIVEN,
         seed: Optional[int] | NotGiven = NOT_GIVEN,
         service_tier: Optional[Literal["auto", "default"]] | NotGiven = NOT_GIVEN,
         stop: Union[Optional[str], List[str]] | NotGiven = NOT_GIVEN,
+        store: Optional[bool] | NotGiven = NOT_GIVEN,
         stream_options: Optional[ChatCompletionStreamOptionsParam] | NotGiven = NOT_GIVEN,
         temperature: Optional[float] | NotGiven = NOT_GIVEN,
         tool_choice: ChatCompletionToolChoiceOptionParam | NotGiven = NOT_GIVEN,
@@ -158,13 +160,15 @@ def parser(raw_completion: ChatCompletion) -> ParsedChatCompletion[ResponseForma
                     "logprobs": logprobs,
                     "max_completion_tokens": max_completion_tokens,
                     "max_tokens": max_tokens,
+                    "metadata": metadata,
                     "n": n,
                     "parallel_tool_calls": parallel_tool_calls,
                     "presence_penalty": presence_penalty,
                     "response_format": _type_to_response_format(response_format),
                     "seed": seed,
                     "service_tier": service_tier,
                     "stop": stop,
+                    "store": store,
                     "stream": False,
                     "stream_options": stream_options,
                     "temperature": temperature,
@@ -202,12 +206,14 @@ def stream(
         logprobs: Optional[bool] | NotGiven = NOT_GIVEN,
         max_completion_tokens: Optional[int] | NotGiven = NOT_GIVEN,
         max_tokens: Optional[int] | NotGiven = NOT_GIVEN,
+        metadata: Optional[Dict[str, str]] | NotGiven = NOT_GIVEN,
         n: Optional[int] | NotGiven = NOT_GIVEN,
         parallel_tool_calls: bool | NotGiven = NOT_GIVEN,
         presence_penalty: Optional[float] | NotGiven = NOT_GIVEN,
         seed: Optional[int] | NotGiven = NOT_GIVEN,
         service_tier: Optional[Literal["auto", "default"]] | NotGiven = NOT_GIVEN,
         stop: Union[Optional[str], List[str]] | NotGiven = NOT_GIVEN,
+        store: Optional[bool] | NotGiven = NOT_GIVEN,
         stream_options: Optional[ChatCompletionStreamOptionsParam] | NotGiven = NOT_GIVEN,
         temperature: Optional[float] | NotGiven = NOT_GIVEN,
         tool_choice: ChatCompletionToolChoiceOptionParam | NotGiven = NOT_GIVEN,
@@ -262,11 +268,13 @@ def stream(
             logprobs=logprobs,
             max_completion_tokens=max_completion_tokens,
             max_tokens=max_tokens,
+            metadata=metadata,
             n=n,
             parallel_tool_calls=parallel_tool_calls,
             presence_penalty=presence_penalty,
             seed=seed,
             service_tier=service_tier,
+            store=store,
             stop=stop,
             stream_options=stream_options,
             temperature=temperature,
@@ -320,12 +328,14 @@ async def parse(
         logprobs: Optional[bool] | NotGiven = NOT_GIVEN,
         max_completion_tokens: Optional[int] | NotGiven = NOT_GIVEN,
         max_tokens: Optional[int] | NotGiven = NOT_GIVEN,
+        metadata: Optional[Dict[str, str]] | NotGiven = NOT_GIVEN,
         n: Optional[int] | NotGiven = NOT_GIVEN,
         parallel_tool_calls: bool | NotGiven = NOT_GIVEN,
         presence_penalty: Optional[float] | NotGiven = NOT_GIVEN,
         seed: Optional[int] | NotGiven = NOT_GIVEN,
         service_tier: Optional[Literal["auto", "default"]] | NotGiven = NOT_GIVEN,
         stop: Union[Optional[str], List[str]] | NotGiven = NOT_GIVEN,
+        store: Optional[bool] | NotGiven = NOT_GIVEN,
         stream_options: Optional[ChatCompletionStreamOptionsParam] | NotGiven = NOT_GIVEN,
         temperature: Optional[float] | NotGiven = NOT_GIVEN,
         tool_choice: ChatCompletionToolChoiceOptionParam | NotGiven = NOT_GIVEN,
@@ -409,12 +419,14 @@ def parser(raw_completion: ChatCompletion) -> ParsedChatCompletion[ResponseForma
                     "logprobs": logprobs,
                     "max_completion_tokens": max_completion_tokens,
                     "max_tokens": max_tokens,
+                    "metadata": metadata,
                     "n": n,
                     "parallel_tool_calls": parallel_tool_calls,
                     "presence_penalty": presence_penalty,
                     "response_format": _type_to_response_format(response_format),
                     "seed": seed,
                     "service_tier": service_tier,
+                    "store": store,
                     "stop": stop,
                     "stream": False,
                     "stream_options": stream_options,
@@ -453,12 +465,14 @@ def stream(
         logprobs: Optional[bool] | NotGiven = NOT_GIVEN,
         max_completion_tokens: Optional[int] | NotGiven = NOT_GIVEN,
         max_tokens: Optional[int] | NotGiven = NOT_GIVEN,
+        metadata: Optional[Dict[str, str]] | NotGiven = NOT_GIVEN,
         n: Optional[int] | NotGiven = NOT_GIVEN,
         parallel_tool_calls: bool | NotGiven = NOT_GIVEN,
         presence_penalty: Optional[float] | NotGiven = NOT_GIVEN,
         seed: Optional[int] | NotGiven = NOT_GIVEN,
         service_tier: Optional[Literal["auto", "default"]] | NotGiven = NOT_GIVEN,
         stop: Union[Optional[str], List[str]] | NotGiven = NOT_GIVEN,
+        store: Optional[bool] | NotGiven = NOT_GIVEN,
         stream_options: Optional[ChatCompletionStreamOptionsParam] | NotGiven = NOT_GIVEN,
         temperature: Optional[float] | NotGiven = NOT_GIVEN,
         tool_choice: ChatCompletionToolChoiceOptionParam | NotGiven = NOT_GIVEN,
@@ -514,12 +528,14 @@ def stream(
             logprobs=logprobs,
             max_completion_tokens=max_completion_tokens,
             max_tokens=max_tokens,
+            metadata=metadata,
             n=n,
             parallel_tool_calls=parallel_tool_calls,
             presence_penalty=presence_penalty,
             seed=seed,
             service_tier=service_tier,
             stop=stop,
+            store=store,
             stream_options=stream_options,
             temperature=temperature,
             tool_choice=tool_choice,
 
@@ -30,7 +30,11 @@ class CompletionCreateParamsBase(TypedDict, total=False):
     messages: Required[Iterable[ChatCompletionMessageParam]]
     """A list of messages comprising the conversation so far.
 
-    [Example Python code](https://cookbook.openai.com/examples/how_to_format_inputs_to_chatgpt_models).
+    Depending on the [model](https://platform.openai.com/docs/models) you use,
+    different message types (modalities) are supported, like
+    [text](https://platform.openai.com/docs/guides/text-generation),
+    [images](https://platform.openai.com/docs/guides/vision), and
+    [audio](https://platform.openai.com/docs/guides/audio).
     """
 
     model: Required[Union[str, ChatModel]]
@@ -105,6 +109,12 @@ class CompletionCreateParamsBase(TypedDict, total=False):
     [o1 series models](https://platform.openai.com/docs/guides/reasoning).
     """
 
+    metadata: Optional[Dict[str, str]]
+    """
+    Developer-defined tags and values used for filtering completions in the
+    [dashboard](https://platform.openai.com/completions).
+    """
+
     n: Optional[int]
     """How many chat completion choices to generate for each input message.
 
@@ -183,6 +193,12 @@ class CompletionCreateParamsBase(TypedDict, total=False):
     stop: Union[Optional[str], List[str]]
     """Up to 4 sequences where the API will stop generating further tokens."""
 
+    store: Optional[bool]
+    """
+    Whether or not to store the output of this completion request for traffic
+    logging in the [dashboard](https://platform.openai.com/completions).
+    """
+
     stream_options: Optional[ChatCompletionStreamOptionsParam]
     """Options for streaming response. Only set this when you set `stream: true`."""
 
 
@@ -12,6 +12,7 @@
     "gpt-4o",
     "gpt-4o-2024-08-06",
     "gpt-4o-2024-05-13",
+    "gpt-4o-realtime-preview-2024-10-01",
     "chatgpt-4o-latest",
     "gpt-4o-mini",
     "gpt-4o-mini-2024-07-18",
 
@@ -4,14 +4,25 @@
 
 from .._models import BaseModel
 
-__all__ = ["CompletionUsage", "CompletionTokensDetails"]
+__all__ = ["CompletionUsage", "CompletionTokensDetails", "PromptTokensDetails"]
 
 
 class CompletionTokensDetails(BaseModel):
+    audio_tokens: Optional[int] = None
+    """Audio input tokens generated by the model."""
+
     reasoning_tokens: Optional[int] = None
     """Tokens generated by the model for reasoning."""
 
 
+class PromptTokensDetails(BaseModel):
+    audio_tokens: Optional[int] = None
+    """Audio input tokens present in the prompt."""
+
+    cached_tokens: Optional[int] = None
+    """Cached tokens present in the prompt."""
+
+
 class CompletionUsage(BaseModel):
     completion_tokens: int
     """Number of tokens in the generated completion."""
@@ -24,3 +35,6 @@ class CompletionUsage(BaseModel):
 
     completion_tokens_details: Optional[CompletionTokensDetails] = None
     """Breakdown of tokens used in a completion."""
+
+    prompt_tokens_details: Optional[PromptTokensDetails] = None
+    """Breakdown of tokens used in the prompt."""
@@ -57,13 +57,15 @@ def test_method_create_with_all_params_overload_1(self, client: OpenAI) -> None:
             logprobs=True,
             max_completion_tokens=0,
             max_tokens=0,
+            metadata={"foo": "string"},
             n=1,
             parallel_tool_calls=True,
             presence_penalty=-2,
             response_format={"type": "text"},
             seed=-9007199254740991,
             service_tier="auto",
             stop="string",
+            store=True,
             stream=False,
             stream_options={"include_usage": True},
             temperature=1,
@@ -178,13 +180,15 @@ def test_method_create_with_all_params_overload_2(self, client: OpenAI) -> None:
             logprobs=True,
             max_completion_tokens=0,
             max_tokens=0,
+            metadata={"foo": "string"},
             n=1,
             parallel_tool_calls=True,
             presence_penalty=-2,
             response_format={"type": "text"},
             seed=-9007199254740991,
             service_tier="auto",
             stop="string",
+            store=True,
             stream_options={"include_usage": True},
             temperature=1,
             tool_choice="none",
@@ -318,13 +322,15 @@ async def test_method_create_with_all_params_overload_1(self, async_client: Asyn
             logprobs=True,
             max_completion_tokens=0,
             max_tokens=0,
+            metadata={"foo": "string"},
             n=1,
             parallel_tool_calls=True,
             presence_penalty=-2,
             response_format={"type": "text"},
             seed=-9007199254740991,
             service_tier="auto",
             stop="string",
+            store=True,
             stream=False,
             stream_options={"include_usage": True},
             temperature=1,
@@ -439,13 +445,15 @@ async def test_method_create_with_all_params_overload_2(self, async_client: Asyn
             logprobs=True,
             max_completion_tokens=0,
             max_tokens=0,
+            metadata={"foo": "string"},
             n=1,
             parallel_tool_calls=True,
             presence_penalty=-2,
             response_format={"type": "text"},
             seed=-9007199254740991,
             service_tier="auto",
             stop="string",
+            store=True,
             stream_options={"include_usage": True},
             temperature=1,
             tool_choice="none",
 
@@ -76,8 +76,9 @@ def test_parse_nothing(client: OpenAI, respx_mock: MockRouter, monkeypatch: pyte
     system_fingerprint='fp_b40fb1c6fb',
     usage=CompletionUsage(
         completion_tokens=37,
-        completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),
+        completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),
         prompt_tokens=14,
+        prompt_tokens_details=None,
         total_tokens=51
     )
 )
@@ -136,8 +137,9 @@ class Location(BaseModel):
     system_fingerprint='fp_5050236cbd',
     usage=CompletionUsage(
         completion_tokens=14,
-        completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),
+        completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),
         prompt_tokens=79,
+        prompt_tokens_details=None,
         total_tokens=93
     )
 )
@@ -198,8 +200,9 @@ class Location(BaseModel):
     system_fingerprint='fp_b40fb1c6fb',
     usage=CompletionUsage(
         completion_tokens=14,
-        completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),
+        completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),
         prompt_tokens=88,
+        prompt_tokens_details=None,
         total_tokens=102
     )
 )
@@ -385,8 +388,9 @@ class CalendarEvent:
     system_fingerprint='fp_7568d46099',
     usage=CompletionUsage(
         completion_tokens=17,
-        completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),
+        completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),
         prompt_tokens=92,
+        prompt_tokens_details=None,
         total_tokens=109
     )
 )
@@ -829,8 +833,9 @@ class Location(BaseModel):
     system_fingerprint='fp_5050236cbd',
     usage=CompletionUsage(
         completion_tokens=14,
-        completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),
+        completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),
         prompt_tokens=79,
+        prompt_tokens_details=None,
         total_tokens=93
     )
 )
@@ -897,8 +902,9 @@ class Location(BaseModel):
     system_fingerprint='fp_5050236cbd',
     usage=CompletionUsage(
         completion_tokens=14,
-        completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),
+        completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),
         prompt_tokens=79,
+        prompt_tokens_details=None,
         total_tokens=93
     )
 )
 
@@ -155,8 +155,9 @@ def on_event(stream: ChatCompletionStream[Location], event: ChatCompletionStream
     system_fingerprint='fp_5050236cbd',
     usage=CompletionUsage(
         completion_tokens=14,
-        completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),
+        completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),
         prompt_tokens=79,
+        prompt_tokens_details=None,
         total_tokens=93
     )
 )
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`	`1`	`configured_endpoints: 68`
`2`		`-openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/openai-8ad878332083dd506a478a293db78dc9e7b1b2124f2682e1d991225bc5bbcc3b.yml`
	`2`	`+openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/openai-52b934aee6468039ec7f4ce046a282b5fbce114afc708e70f17121df654f71da.yml`
Original file line number	Diff line number	Diff line change
`@@ -76,8 +76,9 @@ def test_parse_nothing(client: OpenAI, respx_mock: MockRouter, monkeypatch: pyte`
`76`	`76`	`system_fingerprint='fp_b40fb1c6fb',`
`77`	`77`	`usage=CompletionUsage(`
`78`	`78`	`completion_tokens=37,`
`79`		`- completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),`
	`79`	`+ completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),`
`80`	`80`	`prompt_tokens=14,`
	`81`	`+ prompt_tokens_details=None,`
`81`	`82`	`total_tokens=51`
`82`	`83`	`)`
`83`	`84`	`)`
`@@ -136,8 +137,9 @@ class Location(BaseModel):`
`136`	`137`	`system_fingerprint='fp_5050236cbd',`
`137`	`138`	`usage=CompletionUsage(`
`138`	`139`	`completion_tokens=14,`
`139`		`- completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),`
	`140`	`+ completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),`
`140`	`141`	`prompt_tokens=79,`
	`142`	`+ prompt_tokens_details=None,`
`141`	`143`	`total_tokens=93`
`142`	`144`	`)`
`143`	`145`	`)`
`@@ -198,8 +200,9 @@ class Location(BaseModel):`
`198`	`200`	`system_fingerprint='fp_b40fb1c6fb',`
`199`	`201`	`usage=CompletionUsage(`
`200`	`202`	`completion_tokens=14,`
`201`		`- completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),`
	`203`	`+ completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),`
`202`	`204`	`prompt_tokens=88,`
	`205`	`+ prompt_tokens_details=None,`
`203`	`206`	`total_tokens=102`
`204`	`207`	`)`
`205`	`208`	`)`
`@@ -385,8 +388,9 @@ class CalendarEvent:`
`385`	`388`	`system_fingerprint='fp_7568d46099',`
`386`	`389`	`usage=CompletionUsage(`
`387`	`390`	`completion_tokens=17,`
`388`		`- completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),`
	`391`	`+ completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),`
`389`	`392`	`prompt_tokens=92,`
	`393`	`+ prompt_tokens_details=None,`
`390`	`394`	`total_tokens=109`
`391`	`395`	`)`
`392`	`396`	`)`
`@@ -829,8 +833,9 @@ class Location(BaseModel):`
`829`	`833`	`system_fingerprint='fp_5050236cbd',`
`830`	`834`	`usage=CompletionUsage(`
`831`	`835`	`completion_tokens=14,`
`832`		`- completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),`
	`836`	`+ completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),`
`833`	`837`	`prompt_tokens=79,`
	`838`	`+ prompt_tokens_details=None,`
`834`	`839`	`total_tokens=93`
`835`	`840`	`)`
`836`	`841`	`)`
`@@ -897,8 +902,9 @@ class Location(BaseModel):`
`897`	`902`	`system_fingerprint='fp_5050236cbd',`
`898`	`903`	`usage=CompletionUsage(`
`899`	`904`	`completion_tokens=14,`
`900`		`- completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),`
	`905`	`+ completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),`
`901`	`906`	`prompt_tokens=79,`
	`907`	`+ prompt_tokens_details=None,`
`902`	`908`	`total_tokens=93`
`903`	`909`	`)`
`904`	`910`	`)`
Original file line number	Diff line number	Diff line change
`@@ -155,8 +155,9 @@ def on_event(stream: ChatCompletionStream[Location], event: ChatCompletionStream`
`155`	`155`	`system_fingerprint='fp_5050236cbd',`
`156`	`156`	`usage=CompletionUsage(`
`157`	`157`	`completion_tokens=14,`
`158`		`- completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0),`
	`158`	`+ completion_tokens_details=CompletionTokensDetails(audio_tokens=None, reasoning_tokens=0),`
`159`	`159`	`prompt_tokens=79,`
	`160`	`+ prompt_tokens_details=None,`
`160`	`161`	`total_tokens=93`
`161`	`162`	`)`
`162`	`163`	`)`