Локация: Удалённо в РФ
Компания: Zvuk ЗП: обсуждается на собеседовании Занятость: Полная
Задачи:
Автоматизация и технологическое развитие: внедрение и развитие SRE практик - бюджет ошибок, покрытие сервисов SLA/SLO/SLI; внедрение и развитие инструментов трейсинга, скейлинга, логирования; разработка и внедрение автоматизированных решений; оптимизация процессов и инструментов; поддержание актуальности и безопасности; разработка, актуализация DR планов, проведение учений.
Развитие команды: обучение и повышение квалификации; регулярные встречи и обсуждения; мотивация и поощрение инициативы; набор и подбор квалифицированных специалистов; проведение собеседований и оценка кандидатов; наставничество и адаптация новых сотрудников.
Стратегическое планирование: разработка долгосрочной стратегии развития направления надежности.; определение ключевых показателей эффективности (KPI); участие в формировании ИТ стратегии компании.
Взаимодействие с другими командами: координация работы с разработчиками, DevOps и Monitoring; участие в совещаниях и обсуждениях; согласование технических решений.
Техническая экспертиза: консультации и участие в решении сложных вопросов; оценка технологий и инструментов; контроль качества кода и документации.
Работа с инцидентами: организация реагирования; анализ и составление отчетов; устранение причин инцидентов.
Кризисное управление: планы аварийного восстановления; руководство действиями в условиях инцидента (кризиса); минимизация последствий.
Стек:
Kubernetes
Python
Terraform
Обязательные требования:
Работа SRE/DevOps от 3 лет;
Опыт руководителя от 1 года;
Управление командой от 6 человек;
Опыт реализации инфраструктуры в облачных сервисах, понимание принципов работы и знание инструментов.
Высшее техническое образование.