digitalocean
diff --git a/‎.stats.yml‎
Lines changed: 3 additions & 3 deletions b/‎.stats.yml‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎src/gradient/resources/agents/chat/completions.py‎
Lines changed: 34 additions & 2 deletions b/‎src/gradient/resources/agents/chat/completions.py‎
Lines changed: 34 additions & 2 deletions
diff --git a/‎src/gradient/resources/chat/completions.py‎
Lines changed: 34 additions & 2 deletions b/‎src/gradient/resources/chat/completions.py‎
Lines changed: 34 additions & 2 deletions
diff --git a/‎src/gradient/resources/images.py‎
Lines changed: 6 additions & 2 deletions b/‎src/gradient/resources/images.py‎
Lines changed: 6 additions & 2 deletions
@@ -1,4 +1,4 @@
 configured_endpoints: 193
-openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/digitalocean%2Fgradient-2344b44246a44d39ad5b74d3077bd2958745aad67feb15970756532fa0b3f9d6.yml
-openapi_spec_hash: a1913979235ce152a8dc380fabe5362e
-config_hash: 13e570f98198e8fd1dfcb7ca59d73e0d
+openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/digitalocean%2Fgradient-93df5cb3d61c1bbcab2a4bbf3f0775454bd185a400bc140c61dbf36e108dbf89.yml
+openapi_spec_hash: 0126adf782c5feac3d8e682e466c3cf7
+config_hash: 3f968a57adb20643373c134efc9af01a
@@ -64,6 +64,7 @@ def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
@@ -129,6 +130,9 @@ def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -193,6 +197,7 @@ def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -260,6 +265,9 @@ def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -321,6 +329,7 @@ def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -388,6 +397,9 @@ def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -448,6 +460,7 @@ def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Literal[True] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
@@ -465,7 +478,9 @@ def create(
         timeout: float | httpx.Timeout | None | NotGiven = not_given,
     ) -> CompletionCreateResponse | Stream[ChatCompletionChunk]:
         return self._post(
-            "/chat/completions?agent=true",
+            "/chat/completions?agent=true"
+            if self._client._base_url_overridden
+            else f"{self._client.agent_endpoint}/api/v1/chat/completions?agent=true",
             body=maybe_transform(
                 {
                     "messages": messages,
@@ -478,6 +493,7 @@ def create(
                     "metadata": metadata,
                     "n": n,
                     "presence_penalty": presence_penalty,
+                    "reasoning_effort": reasoning_effort,
                     "stop": stop,
                     "stream": stream,
                     "stream_options": stream_options,
@@ -539,6 +555,7 @@ async def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
@@ -604,6 +621,9 @@ async def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -668,6 +688,7 @@ async def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -735,6 +756,9 @@ async def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -796,6 +820,7 @@ async def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -863,6 +888,9 @@ async def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -923,6 +951,7 @@ async def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Literal[True] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
@@ -940,7 +969,9 @@ async def create(
         timeout: float | httpx.Timeout | None | NotGiven = not_given,
     ) -> CompletionCreateResponse | AsyncStream[ChatCompletionChunk]:
         return await self._post(
-            "/chat/completions?agent=true",
+            "/chat/completions?agent=true"
+            if self._client._base_url_overridden
+            else f"{self._client.agent_endpoint}/api/v1/chat/completions?agent=true",
             body=await async_maybe_transform(
                 {
                     "messages": messages,
@@ -953,6 +984,7 @@ async def create(
                     "metadata": metadata,
                     "n": n,
                     "presence_penalty": presence_penalty,
+                    "reasoning_effort": reasoning_effort,
                     "stop": stop,
                     "stream": stream,
                     "stream_options": stream_options,
 
@@ -64,6 +64,7 @@ def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
@@ -129,6 +130,9 @@ def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -193,6 +197,7 @@ def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -260,6 +265,9 @@ def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -321,6 +329,7 @@ def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -388,6 +397,9 @@ def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -448,6 +460,7 @@ def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Literal[True] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
@@ -465,7 +478,9 @@ def create(
         timeout: float | httpx.Timeout | None | NotGiven = not_given,
     ) -> CompletionCreateResponse | Stream[ChatCompletionChunk]:
         return self._post(
-            "/chat/completions",
+            "/chat/completions"
+            if self._client._base_url_overridden
+            else f"{self._client.inference_endpoint}/v1/chat/completions",
             body=maybe_transform(
                 {
                     "messages": messages,
@@ -478,6 +493,7 @@ def create(
                     "metadata": metadata,
                     "n": n,
                     "presence_penalty": presence_penalty,
+                    "reasoning_effort": reasoning_effort,
                     "stop": stop,
                     "stream": stream,
                     "stream_options": stream_options,
@@ -539,6 +555,7 @@ async def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
@@ -604,6 +621,9 @@ async def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -668,6 +688,7 @@ async def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -735,6 +756,9 @@ async def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -796,6 +820,7 @@ async def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
         temperature: Optional[float] | Omit = omit,
@@ -863,6 +888,9 @@ async def create(
               whether they appear in the text so far, increasing the model's likelihood to
               talk about new topics.
 
+          reasoning_effort: Constrains effort on reasoning for reasoning models. Reducing reasoning effort
+              can result in faster responses and fewer tokens used on reasoning in a response.
+
           stop: Up to 4 sequences where the API will stop generating further tokens. The
               returned text will not contain the stop sequence.
 
@@ -923,6 +951,7 @@ async def create(
         metadata: Optional[Dict[str, str]] | Omit = omit,
         n: Optional[int] | Omit = omit,
         presence_penalty: Optional[float] | Omit = omit,
+        reasoning_effort: Optional[Literal["none", "minimal", "low", "medium", "high", "xhigh"]] | Omit = omit,
         stop: Union[Optional[str], SequenceNotStr[str], None] | Omit = omit,
         stream: Optional[Literal[False]] | Literal[True] | Omit = omit,
         stream_options: Optional[completion_create_params.StreamOptions] | Omit = omit,
@@ -940,7 +969,9 @@ async def create(
         timeout: float | httpx.Timeout | None | NotGiven = not_given,
     ) -> CompletionCreateResponse | AsyncStream[ChatCompletionChunk]:
         return await self._post(
-            "/chat/completions",
+            "/chat/completions"
+            if self._client._base_url_overridden
+            else f"{self._client.inference_endpoint}/v1/chat/completions",
             body=await async_maybe_transform(
                 {
                     "messages": messages,
@@ -953,6 +984,7 @@ async def create(
                     "metadata": metadata,
                     "n": n,
                     "presence_penalty": presence_penalty,
+                    "reasoning_effort": reasoning_effort,
                     "stop": stop,
                     "stream": stream,
                     "stream_options": stream_options,
 
@@ -309,7 +309,9 @@ def generate(
         timeout: float | httpx.Timeout | None | NotGiven = not_given,
     ) -> ImageGenerateResponse | Stream[ImageGenStreamEvent]:
         return self._post(
-            "/images/generations",
+            "/images/generations"
+            if self._client._base_url_overridden
+            else f"{self._client.inference_endpoint}/v1/images/generations",
             body=maybe_transform(
                 {
                     "prompt": prompt,
@@ -621,7 +623,9 @@ async def generate(
         timeout: float | httpx.Timeout | None | NotGiven = not_given,
     ) -> ImageGenerateResponse | AsyncStream[ImageGenStreamEvent]:
         return await self._post(
-            "/images/generations",
+            "/images/generations"
+            if self._client._base_url_overridden
+            else f"{self._client.inference_endpoint}/v1/images/generations",
             body=await async_maybe_transform(
                 {
                     "prompt": prompt,