OpenAI-совместимый LLM API для ботов, агентов и CRM в России.
Подключение без VPN, оплата картами РФ через СБП. После регистрации 100 000 токенов бесплатно
Всё что нужно для работы
Никаких прокси и обходов — прямой доступ из России к Qwen 3 30B Instruct для чатов, ботов и интеграций.
Высокая скорость
Qwen 3 30B Instruct на выделенном GPU 32GB + vLLM. Быстрые ответы для чатов, ботов и интеграций в реальном времени. ~ 100 токенов / сек.
OpenAI-совместимый
Меняете base_url — и ваш существующий код работает без изменений. Поддерживаются chat/completions.
AI-агенты и tool use
Поддержка function calling (tool_choice: auto) — агент сам решает когда вызвать инструмент. Совместимо с LangChain, AutoGPT, CrewAI. Многошаговые сценарии: поддержка, квалификация лидов, анализ документов.
Стриминг ответов
Поддержка Server-Sent Events (SSE) — ответ появляется по мере генерации, как в ChatGPT. Пользователь видит текст сразу, не ждёт полного ответа.
Без автосписаний
Платите только когда сами решите. Никаких скрытых списаний — полный контроль расходов.
Единая цена токенов
Входящие и исходящие токены считаются по одной ставке — никаких коэффициентов. Вы знаете стоимость заранее.
Контекст до 16K
Qwen 3 30B Instruct запущена с окном контекста 16 384 токена. Длинные диалоги и документы в рамках этого лимита.
Статистика использования
Смотрите расход токенов в личном кабинете в реальном времени. Полный контроль над потреблением.
100 000 токенов бесплатно
После регистрации и подтверждения email — 100 000 токенов зачисляются на счёт автоматически. Без карты, без условий.
Кому подходит
Qwen 3 30B Instruct — мощная модель для прикладных задач. Но у неё есть чёткие границы, и лучше знать о них заранее.
AI-агенты
Подключайте агентов с памятью контекста. Идеально для AutoGPT, LangChain и CrewAI — меняете только base_url.
CRM и внутренние инструменты
Классификация заявок, суммаризация обращений, генерация ответов по шаблонам, разбор входящих писем.
AI-функции в SaaS и админках
Автодополнение, краткое изложение, простая генерация текста — там, где нужен быстрый и дешёвый вызов модели.
Для каких задач мы идеальны
Сложный reasoning, топовый code generation, глубокий анализ — здесь 30B-модель уступает premium GPT и Claude. Для таких задач лучше выбрать другого провайдера.
Подключение за 2 минуты
Если вы уже используете OpenAI SDK — просто замените base_url и ключ. Имя модели - Qwen/Qwen3-30B-A3B-Instruct
<!-- Вставьте этот код перед </body> на вашей странице --> <script src="/widget.js" data-token="ваш_ключ_из_кабинета" // Ваш уникальный токен data-name="Ассистент llmcod.ru" data-color="#22c55e" // Цвет акцентов виджета data-avatar="https://llmcod.ru/logo.png" // Аватар ассистента data-system="Отвечай кратко. При неопределённости — направляй на почту" // Ваши указания поведения... ></script>
# Ключ берётся из личного кабинета — без префикса sk- curl https://llmcod.ru/v1/chat/completions \ -H "Authorization: Bearer ваш_ключ_из_кабинета" \ -H "Content-Type: application/json" \ -d '{ "model": "Qwen/Qwen3-30B-A3B-Instruct", "messages": [ {"role": "user", "content": "Привет! Как дела?"} ] }'
from openai import OpenAI client = OpenAI( api_key="ваш_ключ_из_кабинета", # без sk- base_url="https://llmcod.ru/v1" ) response = client.chat.completions.create( model="Qwen/Qwen3-30B-A3B-Instruct", messages=[ {"role": "user", "content": "Привет! Как дела?"} ] ) print(response.choices[0].message.content)
from openai import OpenAI client = OpenAI( api_key="ваш_ключ_из_кабинета", # без sk- base_url="https://llmcod.ru/v1" ) # История диалога — агент помнит весь контекст history = [ {"role": "system", "content": "Ты агент поддержки. Квалифицируй лид: узнай имя, задачу и бюджет."} ] def agent_step(user_message): history.append({"role": "user", "content": user_message}) resp = client.chat.completions.create( model="Qwen/Qwen3-30B-A3B-Instruct", messages=history ) answer = resp.choices[0].message.content history.append({"role": "assistant", "content": answer}) return answer # Шаг 1 — первый контакт print(agent_step("Хочу автоматизировать обработку заявок")) # Шаг 2 — агент помнит предыдущий ответ print(agent_step("Меня зовут Алексей, бюджет ~50 000 ₽")) # Шаг 3 — итог квалификации print(agent_step("Сколько заявок в день нужно обрабатывать?"))
from openai import OpenAI import json client = OpenAI( api_key="ваш_ключ_из_кабинета", # без sk- base_url="https://llmcod.ru/v1" ) tools = [{ "type": "function", "function": { "name": "get_weather", "description": "Получить текущую погоду в городе", "parameters": { "type": "object", "properties": { "city": {"type": "string", "description": "Название города"} }, "required": ["city"] } } }] resp = client.chat.completions.create( model="Qwen/Qwen3-30B-A3B-Instruct", messages=[{"role": "user", "content": "Какая погода в Москве?"}], tools=tools, tool_choice="auto" ) tool_call = resp.choices[0].message.tool_calls[0] print(tool_call.function.name) # get_weather print(tool_call.function.arguments) # {"city": "Москва"}
Попробуйте прямо сейчас
Без регистрации — отправьте запрос и убедитесь в скорости.
Готовы начать?
Зарегистрируйтесь, получите API-ключ и подключайте модель к своему проекту.
Создать аккаунт