Тарифы FAQ Примеры использования Войти в кабинет
Данные в России · Qwen 3 30B Instruct · OpenAI API

OpenAI-совместимый LLM API для ботов, агентов и CRM в России.

Подключение без VPN, оплата картами РФ через СБП. После регистрации 100 000 токенов бесплатно

50 ₽
Профи 1M токенов
100K
токенов в подарок
~100
токенов/сек
💡 Входящие и исходящие токены по единой цене — без сюрпризов в счёте
🔒 Главное преимущество

Данные остаются
в России

Сервер физически находится в Калининграде. Ваши запросы не передаются в OpenAI, Google или другим иностранным провайдерам — всё обрабатывается локально, на российском железе.

🏢

Сервер в Калининграде

Физический выделенный сервер в российской юрисдикции. Никаких зарубежных облаков.

🚫

Без OpenAI и Google

Ваши данные не отправляются иностранным провайдерам — обработка только на нашем оборудовании.

⚖️

Российское право

Соответствие требованиям законодательства РФ. Подходит для корпоративных и государственных задач.

Всё что нужно для работы

Никаких прокси и обходов — прямой доступ из России к Qwen 3 30B Instruct для чатов, ботов и интеграций.

Высокая скорость

Qwen 3 30B Instruct на выделенном GPU 32GB + vLLM. Быстрые ответы для чатов, ботов и интеграций в реальном времени. ~ 100 токенов / сек.

🔌

OpenAI-совместимый

Меняете base_url — и ваш существующий код работает без изменений. Поддерживаются chat/completions.

🤖

AI-агенты и tool use

Поддержка function calling (tool_choice: auto) — агент сам решает когда вызвать инструмент. Совместимо с LangChain, AutoGPT, CrewAI. Многошаговые сценарии: поддержка, квалификация лидов, анализ документов.

🌐

Стриминг ответов

Поддержка Server-Sent Events (SSE) — ответ появляется по мере генерации, как в ChatGPT. Пользователь видит текст сразу, не ждёт полного ответа.

🔒

Без автосписаний

Платите только когда сами решите. Никаких скрытых списаний — полный контроль расходов.

💰

Единая цена токенов

Входящие и исходящие токены считаются по одной ставке — никаких коэффициентов. Вы знаете стоимость заранее.

🧠

Контекст до 16K

Qwen 3 30B Instruct запущена с окном контекста 16 384 токена. Длинные диалоги и документы в рамках этого лимита.

📊

Статистика использования

Смотрите расход токенов в личном кабинете в реальном времени. Полный контроль над потреблением.

🎁

100 000 токенов бесплатно

После регистрации и подтверждения email — 100 000 токенов зачисляются на счёт автоматически. Без карты, без условий.

Кому подходит

Qwen 3 30B Instruct — мощная модель для прикладных задач. Но у неё есть чёткие границы, и лучше знать о них заранее.

🤖

AI-агенты

Подключайте агентов с памятью контекста. Идеально для AutoGPT, LangChain и CrewAI — меняете только base_url.

CRM и внутренние инструменты

Классификация заявок, суммаризация обращений, генерация ответов по шаблонам, разбор входящих писем.

AI-функции в SaaS и админках

Автодополнение, краткое изложение, простая генерация текста — там, где нужен быстрый и дешёвый вызов модели.

⚠️

Для каких задач мы идеальны

Сложный reasoning, топовый code generation, глубокий анализ — здесь 30B-модель уступает premium GPT и Claude. Для таких задач лучше выбрать другого провайдера.

Честно: мы не пытаемся конкурировать с GPT-4o или Claude Opus. LLMCOD — это быстрый и дешёвый API для прикладных задач, где 30B-модели хватает за глаза. Если вам нужен максимум интеллекта — берите premium-провайдера. Если нужна рабочая интеграция за разумные деньги — вы по адресу.

Подключение за 2 минуты

Если вы уже используете OpenAI SDK — просто замените base_url и ключ. Имя модели - Qwen/Qwen3-30B-A3B-Instruct

<!-- Вставьте этот код перед </body> на вашей странице -->
<script
 src="/widget.js"
 data-token="ваш_ключ_из_кабинета" // Ваш уникальный токен
 data-name="Ассистент llmcod.ru"
 data-color="#22c55e" // Цвет акцентов виджета
 data-avatar="https://llmcod.ru/logo.png" // Аватар ассистента
 data-system="Отвечай кратко. При неопределённости — направляй на почту" // Ваши указания поведения...
></script>
       
# Ключ берётся из личного кабинета — без префикса sk-
curl https://llmcod.ru/v1/chat/completions \
  -H "Authorization: Bearer ваш_ключ_из_кабинета" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "Qwen/Qwen3-30B-A3B-Instruct",
    "messages": [
      {"role": "user", "content": "Привет! Как дела?"}
    ]
  }'
from openai import OpenAI

client = OpenAI(
    api_key="ваш_ключ_из_кабинета",  # без sk-
    base_url="https://llmcod.ru/v1"
)

response = client.chat.completions.create(
    model="Qwen/Qwen3-30B-A3B-Instruct",
    messages=[
        {"role": "user", "content": "Привет! Как дела?"}
    ]
)

print(response.choices[0].message.content)
from openai import OpenAI

client = OpenAI(
    api_key="ваш_ключ_из_кабинета",  # без sk-
    base_url="https://llmcod.ru/v1"
)

# История диалога — агент помнит весь контекст
history = [
    {"role": "system", "content": "Ты агент поддержки. Квалифицируй лид: узнай имя, задачу и бюджет."}
]

def agent_step(user_message):
    history.append({"role": "user", "content": user_message})
    resp = client.chat.completions.create(
        model="Qwen/Qwen3-30B-A3B-Instruct",
        messages=history
    )
    answer = resp.choices[0].message.content
    history.append({"role": "assistant", "content": answer})
    return answer

# Шаг 1 — первый контакт
print(agent_step("Хочу автоматизировать обработку заявок"))

# Шаг 2 — агент помнит предыдущий ответ
print(agent_step("Меня зовут Алексей, бюджет ~50 000 ₽"))

# Шаг 3 — итог квалификации
print(agent_step("Сколько заявок в день нужно обрабатывать?"))
from openai import OpenAI
import json

client = OpenAI(
    api_key="ваш_ключ_из_кабинета",  # без sk-
    base_url="https://llmcod.ru/v1"
)

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "Получить текущую погоду в городе",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string", "description": "Название города"}
            },
            "required": ["city"]
        }
    }
}]

resp = client.chat.completions.create(
    model="Qwen/Qwen3-30B-A3B-Instruct",
    messages=[{"role": "user", "content": "Какая погода в Москве?"}],
    tools=tools,
    tool_choice="auto"
)

tool_call = resp.choices[0].message.tool_calls[0]
print(tool_call.function.name)       # get_weather
print(tool_call.function.arguments)  # {"city": "Москва"}

Попробуйте прямо сейчас

Без регистрации — отправьте запрос и убедитесь в скорости.

Привет! Я Qwen 3 30B. Задайте любой вопрос.
Осталось тестовых запросов: 5

Готовы начать?

Зарегистрируйтесь, получите API-ключ и подключайте модель к своему проекту.

Создать аккаунт