👨‍💻 Обо мне 📚 IT-Дайджест 🏆 Рейтинг 🚀 Проекты 💼 Компетенции 📬 Контакты 💝 Поддержка

[Перевод] GPU-автоскейлинг на Kubernetes с KEDA: создание внешнего скейлера

📅 Дата: 11.06.2026
👤 Автор: levashove (VK Tech)
📚 Источник: Habr
🏷️ Категория: KUBERNETES

📌 Краткое содержание

Если вы запускаете GPU-нагрузки (графические ускорители) на Kubernetes — vLLM, Triton, обучающие задачи или более новые стеки агентного инференса, — вы наверняка сталкивались со знакомой проблемой: стандартный автоскейлинг по-прежнему мыслит в категориях CPU и памяти, а GPU, который реально делает работу, остается невидимым. Из-за этого простаивает...

📖 Читать полностью

👉 Оригинал статьи на Habr

Автоматическая публикация