Требования:
Стек OS: Linux (systemd, cgroups, networking, low-level tuning) IaC: Ansible, Terraform Containers / orchestration: Docker, Kubernetes Databases: MySQL, Redis (репликация, performance tuning) Monitoring: Prometheus, Grafana, ELK / Loki CI/CD: GitHub Actions, GitLab CI. 5+ лет опыта в DevOps / SRE / Platform Engineering. Опыт с highload системами сильный Linux troubleshooting: вы можете дойти до причины проблемы, а не только перезапустить сервис уверенная работа с Docker / Kubernetes / Terraform / Ansible. Опыт настройки и развития observability: метрики, логи, алерты, диагностика понимание SRE-подхода: SLI / SLO, incident management, баланс между скоростью и надёжностью. Опыт с bare metal, а не только с managed cloud-средами умение находить баланс между качеством инфраструктуры и стоимостью ресурсов важен подход человека, который умеет работать в среде, где многое уже живое, но многое ещё нужно дособрать и усилить. Будет плюсом: опыт работы с GPU infrastructure (Nvidia, CUDA) опыт в MLOps: деплой и мониторинг ML-моделей Python / Bash scripting для сложной автоматизации опыт в стартапах или product-командах, где нужно было не “поддерживать готовое”, а строить, упрощать и усиливать систему на ходу.
Локация:📍Удалённо. Part-time.
Контакт для отклика:Показать контакты Про карьеру, рост и ценность себя: @jobstobeloved
Будьте осторожны: если работодатель просит войти в их систему, используя iCloud/Google, прислать код/пароль, запустить код/ПО, не делайте этого - это мошенники. Обязательно жмите "Пожаловаться" или пишите в поддержку. Подробнее в гайде →
Текст вакансии взят без изменений
Источник - Telegram канал. Название доступно после авторизации