[Перевод] GPU-автоскейлинг на Kubernetes с KEDA: создание внешнего скейлера

📅 Дата: 11.06.2026
👤 Автор: levashove (VK Tech)
📚 Источник: Habr
🏷️ Категория: KUBERNETES

📌 Краткое содержание

Если вы запускаете GPU-нагрузки (графические ускорители) на Kubernetes — vLLM, Triton, обучающие задачи или более новые стеки агентного инференса, — вы наверняка сталкивались со знакомой проблемой: стандартный автоскейлинг по-прежнему мыслит в категориях CPU и памяти, а GPU, который реально делает работу, остается невидимым. Из-за этого простаивает...

📖 Читать полностью

👉 Оригинал статьи на Habr


Автоматическая публикация