Описание
Ищем MLOps-инженера в команду 🚀
Мы строим AI-продукты с реальной нагрузкой — LLM в проде, GPU-кластер, агенты. Нужен человек, который умеет всё это держать в живом состоянии.
Что предстоит делать:
— деплоить и обслуживать LLM (vLLM, Triton Inference Server)
— управлять GPU-кластером на H200/L4/L40s: ресурсы, VRAM, CUDA MPS
— строить CI/CD для AI-сервисов (GitLab CI)
— автоматизировать деплой: версионирование, rollback, A/B
— Kubernetes, Docker
— мониторинг GPU метрик и качества агентов (latency p50/p95/p99, throughput, деградация)
— работа с реляционными и векторными БД
Плюсом будет опыт с Alembic и настройкой алертов.
Если это про тебя — пиши в личку или отмечай тех, кому может быть интересно 👇
[linkedin]
Контакты работодателя (email/phone/telegram) скрыты из публичного превью —
отправьте резюме, чтобы мы связали вас напрямую.