💬 Частые вопросы
Всё что нужно знать
об API LLMCOD
Подключение, модель Llama 3.1 8B, тарифы, оплата и безопасность.
🇷🇺
Данные остаются в России. Сервер в Калининграде — запросы не передаются в OpenAI, Google или другим иностранным провайдерам.
🚀 Начало работы
- Зарегистрируйтесь на llmcod.ru
- Выберите тариф и оплатите через ЮKassa
- Создайте API-ключ в личном кабинете
- Замените
base_urlнаhttps://llmcod.ru/v1в своём коде
Нет. Сервер находится в России — запросы проходят напрямую без VPN и прокси. Никаких блокировок и зарубежных задержек.
Python (OpenAI SDK):
from openai import OpenAI
client = OpenAI(
api_key="sk-ваш_ключ",
base_url="https://llmcod.ru/v1"
)
response = client.chat.completions.create(
model="meta-llama/Llama-3.1-8B-Instruct",
messages=[{"role": "user", "content": "Привет!"}]
)
print(response.choices[0].message.content)
cURL:
curl https://llmcod.ru/v1/chat/completions \
-H "Authorization: Bearer sk-ваш_ключ" \
-H "Content-Type: application/json" \
-d '{
"model": "meta-llama/Llama-3.1-8B-Instruct",
"messages": [{"role": "user", "content": "Привет!"}]
}'
🤖 Модель Llama 3.1 8B
Llama 3.1 8B — открытая языковая модель от Meta с 8 миллиардами параметров.
- Параметры: 8 миллиардов
- Контекстное окно: 8 192 токена (~6 страниц)
- Знания до: начало 2024
- Архитектура: Transformer, GQA + RoPE
- Дообучение: SFT + RLHF
русскийанглийскийнемецкийфранцузскийиспанский+8 языков
- 💬 Чат-боты и диалоговые ассистенты
- ✍️ Генерация и редактирование текста
- 💻 Написание и объяснение кода
- 📄 Суммаризация документов (до 8K токенов)
- 🔍 Классификация текста и анализ тональности
- 🌐 Перевод между 8 языками
- 🛠️ Tool calling / function calling
- 🤖 Генерация синтетических данных
Модель понимает русский на достаточном уровне для чатов, генерации текста и перевода. Наилучшее качество — на английском. Для критически важных задач рекомендуется тестировать перед продакшном.
Контекстное окно — максимальный объём текста за один запрос: промпт + история + ответ.
8 192 токена ≈
8 192 токена ≈
- ~6 000 слов на русском
- ~6 страниц документа
- ~15 минут транскрипта разговора
Модель работает в формате FP16 (полная точность, без квантования). Это обеспечивает максимальное качество ответов по сравнению с квантованными версиями INT4 и INT8.
Многие сервисы используют квантование для экономии памяти GPU — это снижает точность вычислений. У нас модель запускается на 32 ГБ Tesla V100 в полной точности, без компромиссов по качеству.
Многие сервисы используют квантование для экономии памяти GPU — это снижает точность вычислений. У нас модель запускается на 32 ГБ Tesla V100 в полной точности, без компромиссов по качеству.
🔌 API и интеграция
Да, полностью. Поддерживается
/v1/chat/completions, стриминг, системные промпты и параметры temperature, max_tokens, top_p. Меняете только api_key и base_url.
Да. Передайте
"stream": true — модель отдаёт ответ по токену в режиме SSE. Идеально для чат-интерфейсов с живым печатанием.
Создайте в личном кабинете отдельный API-ключ для каждого проекта:
- Раздельный учёт расхода токенов
- Отзыв ключа одного проекта без влияния на остальные
- Безопасная передача ключа команде
💳 Тарифы и оплата
Оплата через ЮKassa в рублях: СБП, Visa, МИР, Mastercard, SberPay. Иностранные карты и криптовалюта не поддерживаются.
Нет. Никаких автосписаний. Платите только когда сами решаете пополнить баланс.
Да — каждый новый пользователь получает 100 000 токенов бесплатно автоматически.
Как получить:
Как получить:
- Зарегистрируйтесь на llmcod.ru
- Подтвердите email — перейдите по ссылке из письма
- 100 000 токенов зачислятся на счёт автоматически
Без карты, без заявок, без ожидания. Токены можно сразу использовать через API.
Входящие (промпт) и исходящие (ответ) токены считаются по единой цене — никаких коэффициентов.
Ориентир: 1 токен ≈ 4 символа на английском, ≈ 2–3 символа на русском.
Ориентир: 1 токен ≈ 4 символа на английском, ≈ 2–3 символа на русском.
Разовые пакеты не сгорают — расходуются по мере использования. Месячные подписки дают суточный лимит в течение оплаченного периода.
Вы можете купить токены через нашего бота в мессенджере МАХ — LLM API. Бот принимает оплату в рублях через ЮKassa прямо в чате.
Важно знать:
Важно знать:
- После покупки через МАХ личный кабинет на сайте недоступен
- Отслеживать остаток токенов и баланс через кабинет не получится — информация о расходе доступна только через ответы API (
usageв каждом ответе) - Если вам нужен личный кабинет с историей и аналитикой — зарегистрируйтесь на llmcod.ru и оплатите там
⚡ Производительность и инфраструктура
- GPU: NVIDIA Tesla V100 32GB
- Инференс: vLLM — движок с непрерывным батчингом запросов
- Uptime: 99.9%
Сервер физически расположен в Калининграде — на собственном выделенном оборудовании:
- Запросы не покидают российскую юрисдикцию
- Данные не передаются в OpenAI, Google или другим иностранным провайдерам
- Нет санкционных рисков — инфраструктура полностью российская
- Минимальная задержка для России и СНГ
- Оплата в рублях без конвертации
🇷🇺 Это принципиальное отличие от aitunnel, OpenRouter и других агрегаторов, которые проксируют запросы через серверы в США, ЕС и других странах.
Нет. LLMCOD запускает модель Llama 3.1 8B локально на собственном сервере в Калининграде. Ваши запросы обрабатываются напрямую — без проксирования через OpenAI, Google, Anthropic или любые другие зарубежные сервисы.
Это важно для:
Это важно для:
- Корпоративных клиентов — можно передавать внутренние данные, не нарушая NDA и ИБ-политики
- Государственных задач — соответствие требованиям о локализации данных
- Работы с персональными данными — данные остаются в российской юрисдикции
🔐 Безопасность и конфиденциальность
Нет. Запросы не используются для дообучения модели. Подробнее — в Политике конфиденциальности.
- Не публикуйте ключ в открытом коде (GitHub и т.д.)
- Храните в переменных окружения (
.env) - Отдельный ключ на каждый проект
- При утечке — немедленно отзовите ключ в личном кабинете
📈 AI-прогноз цен
Инструмент на базе модели Amazon Chronos — специализированной нейросети для временных рядов. Она анализирует историческую динамику цен акций или криптовалюты и строит вероятностный прогноз на 7, 14 или 30 дней вперёд с доверительным интервалом 10–90%.
Открыть прогноз →
Открыть прогноз →
- MOEX — российские акции и ETF: SBER, GAZP, YNDX, LKOH и другие
- Binance — криптовалюты: BTCUSDT, ETHUSDT, SOLUSDT и тысячи пар
- Tinkoff Invest — все инструменты T-Банка (требует Bearer-токен из личного кабинета Tinkoff)
Каждый запрос прогноза списывает 10 000 токенов с баланса вашего API-ключа. Токены общие с LLM API — отдельно покупать ничего не нужно.
Новые пользователи получают 100 000 бесплатных токенов при регистрации — этого хватит на 10 пробных прогнозов.
Новые пользователи получают 100 000 бесплатных токенов при регистрации — этого хватит на 10 пробных прогнозов.
Прогноз носит информационный характер и не является инвестиционной рекомендацией. Chronos обучена на миллионах временных рядов и показывает хорошую точность на горизонте 7–14 дней, однако рынки непредсказуемы. Используйте прогноз как один из инструментов анализа, а не как основу для торговых решений.