Как начать использовать API LLMCOD?

Зарегистрируйтесь, выберите тариф, оплатите через ЮKassa, создайте ключ, замените base_url.

Нет. Сервер в России.

💬 Частые вопросы

Всё что нужно знать
об API LLMCOD

Подключение, модель Llama 3.1 8B, тарифы, оплата и безопасность.

🇷🇺 Данные остаются в России. Сервер в Калининграде — запросы не передаются в OpenAI, Google или другим иностранным провайдерам.

🚀 Начало работы

Как начать использовать API?

Зарегистрируйтесь на llmcod.ru
Выберите тариф и оплатите через ЮKassa
Создайте API-ключ в личном кабинете
Замените base_url на https://llmcod.ru/v1 в своём коде

Если вы уже используете OpenAI SDK — больше ничего менять не нужно.

Нужен ли VPN для работы с API?

Нет. Сервер находится в России — запросы проходят напрямую без VPN и прокси. Никаких блокировок и зарубежных задержек.

Как подключиться через Python / cURL?

Python (OpenAI SDK):

from openai import OpenAI

client = OpenAI(
    api_key="sk-ваш_ключ",
    base_url="https://llmcod.ru/v1"
)

response = client.chat.completions.create(
    model="meta-llama/Llama-3.1-8B-Instruct",
    messages=[{"role": "user", "content": "Привет!"}]
)
print(response.choices[0].message.content)

cURL:

curl https://llmcod.ru/v1/chat/completions \
  -H "Authorization: Bearer sk-ваш_ключ" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "meta-llama/Llama-3.1-8B-Instruct",
    "messages": [{"role": "user", "content": "Привет!"}]
  }'

🤖 Модель Llama 3.1 8B

Что такое Llama 3.1 8B?

Llama 3.1 8B — открытая языковая модель от Meta с 8 миллиардами параметров.

Параметры: 8 миллиардов
Контекстное окно: 8 192 токена (~6 страниц)
Знания до: начало 2024
Архитектура: Transformer, GQA + RoPE
Дообучение: SFT + RLHF

русскийанглийскийнемецкийфранцузскийиспанский+8 языков

Что умеет эта модель?

💬 Чат-боты и диалоговые ассистенты
✍️ Генерация и редактирование текста
💻 Написание и объяснение кода
📄 Суммаризация документов (до 8K токенов)
🔍 Классификация текста и анализ тональности
🌐 Перевод между 8 языками
🛠️ Tool calling / function calling
🤖 Генерация синтетических данных

Модель не работает с изображениями — только текст.

Насколько хорошо модель понимает русский язык?

Модель понимает русский на достаточном уровне для чатов, генерации текста и перевода. Наилучшее качество — на английском. Для критически важных задач рекомендуется тестировать перед продакшном.

Что такое «контекстное окно 8K токенов»?

Контекстное окно — максимальный объём текста за один запрос: промпт + история + ответ.

8 192 токена ≈

~6 000 слов на русском
~6 страниц документа
~15 минут транскрипта разговора

Подходит для чатов, генерации кода, небольших документов и суммаризации.

В каком формате работает модель — FP16 или квантование?

Модель работает в формате FP16 (полная точность, без квантования). Это обеспечивает максимальное качество ответов по сравнению с квантованными версиями INT4 и INT8.

Многие сервисы используют квантование для экономии памяти GPU — это снижает точность вычислений. У нас модель запускается на 32 ГБ Tesla V100 в полной точности, без компромиссов по качеству.

🔌 API и интеграция

Совместим ли API с OpenAI SDK?

Да, полностью. Поддерживается /v1/chat/completions, стриминг, системные промпты и параметры temperature, max_tokens, top_p. Меняете только api_key и base_url.

Поддерживается ли стриминг (streaming)?

Да. Передайте "stream": true — модель отдаёт ответ по токену в режиме SSE. Идеально для чат-интерфейсов с живым печатанием.

Как управлять несколькими проектами?

Создайте в личном кабинете отдельный API-ключ для каждого проекта:

Раздельный учёт расхода токенов
Отзыв ключа одного проекта без влияния на остальные
Безопасная передача ключа команде

💳 Тарифы и оплата

Какие способы оплаты доступны?

Оплата через ЮKassa в рублях: СБП, Visa, МИР, Mastercard, SberPay. Иностранные карты и криптовалюта не поддерживаются.

Есть ли автоматические списания?

Нет. Никаких автосписаний. Платите только когда сами решаете пополнить баланс.

Есть ли бесплатные токены при регистрации?

Да — каждый новый пользователь получает 100 000 токенов бесплатно автоматически.

Как получить:

Зарегистрируйтесь на llmcod.ru
Подтвердите email — перейдите по ссылке из письма
100 000 токенов зачислятся на счёт автоматически

Без карты, без заявок, без ожидания. Токены можно сразу использовать через API.

Как считаются токены? Входящие и исходящие по-разному?

Входящие (промпт) и исходящие (ответ) токены считаются по единой цене — никаких коэффициентов.

Ориентир: 1 токен ≈ 4 символа на английском, ≈ 2–3 символа на русском.

У пакетов токенов есть срок действия?

Разовые пакеты не сгорают — расходуются по мере использования. Месячные подписки дают суточный лимит в течение оплаченного периода.

Как оплатить через мессенджер МАХ?

Вы можете купить токены через нашего бота в мессенджере МАХ — LLM API. Бот принимает оплату в рублях через ЮKassa прямо в чате.

Важно знать:

После покупки через МАХ личный кабинет на сайте недоступен
Отслеживать остаток токенов и баланс через кабинет не получится — информация о расходе доступна только через ответы API (usage в каждом ответе)
Если вам нужен личный кабинет с историей и аналитикой — зарегистрируйтесь на llmcod.ru и оплатите там

⚡ Производительность и инфраструктура

На каком железе работает сервис?

GPU: NVIDIA Tesla V100 32GB
Инференс: vLLM — движок с непрерывным батчингом запросов
Uptime: 99.9%

Tesla V100 32GB полностью вмещает Llama 3.1 8B в VRAM — быстрый отклик без оффлоадинга на CPU.

Где физически находятся серверы?

Сервер физически расположен в Калининграде — на собственном выделенном оборудовании:

Запросы не покидают российскую юрисдикцию
Данные не передаются в OpenAI, Google или другим иностранным провайдерам
Нет санкционных рисков — инфраструктура полностью российская
Минимальная задержка для России и СНГ
Оплата в рублях без конвертации

🇷🇺 Это принципиальное отличие от aitunnel, OpenRouter и других агрегаторов, которые проксируют запросы через серверы в США, ЕС и других странах.

Мои данные передаются иностранным компаниям?

Нет. LLMCOD запускает модель Llama 3.1 8B локально на собственном сервере в Калининграде. Ваши запросы обрабатываются напрямую — без проксирования через OpenAI, Google, Anthropic или любые другие зарубежные сервисы.

Это важно для:

Корпоративных клиентов — можно передавать внутренние данные, не нарушая NDA и ИБ-политики
Государственных задач — соответствие требованиям о локализации данных
Работы с персональными данными — данные остаются в российской юрисдикции

🔐 Безопасность и конфиденциальность

Мои запросы используются для обучения модели?

Нет. Запросы не используются для дообучения модели. Подробнее — в Политике конфиденциальности.

Как защитить API-ключ?

Не публикуйте ключ в открытом коде (GitHub и т.д.)
Храните в переменных окружения (.env)
Отдельный ключ на каждый проект
При утечке — немедленно отзовите ключ в личном кабинете

📈 AI-прогноз цен

Что такое AI-прогноз цен?

Инструмент на базе модели Amazon Chronos — специализированной нейросети для временных рядов. Она анализирует историческую динамику цен акций или криптовалюты и строит вероятностный прогноз на 7, 14 или 30 дней вперёд с доверительным интервалом 10–90%.

Открыть прогноз →

Какие рынки и тикеры поддерживаются?

MOEX — российские акции и ETF: SBER, GAZP, YNDX, LKOH и другие
Binance — криптовалюты: BTCUSDT, ETHUSDT, SOLUSDT и тысячи пар
Tinkoff Invest — все инструменты T-Банка (требует Bearer-токен из личного кабинета Tinkoff)

Для работы нужен действующий API-ключ llmcod.ru.

Сколько стоит один прогноз?

Каждый запрос прогноза списывает 10 000 токенов с баланса вашего API-ключа. Токены общие с LLM API — отдельно покупать ничего не нужно.

Новые пользователи получают 100 000 бесплатных токенов при регистрации — этого хватит на 10 пробных прогнозов.

Насколько точен прогноз?

Прогноз носит информационный характер и не является инвестиционной рекомендацией. Chronos обучена на миллионах временных рядов и показывает хорошую точность на горизонте 7–14 дней, однако рынки непредсказуемы. Используйте прогноз как один из инструментов анализа, а не как основу для торговых решений.

Остались вопросы?

Напишите нам в мессенджере МАХ — ответим быстро.

Написать в МАХ

Всё что нужно знатьоб API LLMCOD

Остались вопросы?

Всё что нужно знать
об API LLMCOD