Сегодня будем разбираться в ролях DevOps и SRE и как они связаны с системным администрированием.

Ну вот, есть такой чувак, называется SRE (Site Reliability Engineer) - это типа DevOps, но с некоторыми отличиями. В больших тачках могут быть отдельные команды DevOps и SRE, или даже целые отделы. Важно понимать разницу между ними.

SRE - это такой топ-разработчик, который рубит и в кодинге, и в DevOps. Легенда гласит, что эту роль первым ввел сам Гугл. В 2016 они выпустили книжку, где рассказали, кто такие SRE и зачем они нужны.

Короче, в те времена, когда DevOps только начинал набирать обороты, весь мир подсел на цифру. Чуваки стали гонять кучу запросов в интернет-приложения, и компаниям пришлось как-то с этим справляться. Первый вариант - апгрейдить железяки в датацентрах, ставить новые проки, диски и все такое. Но Гугл врубился, что это слишком дорого.

Они решили, что проще взять кучу обычных серверов и объединить их в кластер. Так можно масштабировать мощности гораздо дешевле. Но обычные админы с таким не справлялись - они привыкли к 30 серверам, которые могут чекать вручную. А тут миллион! Нужны прогеры, которые напишут код для управления этими кластерами. Так и появились SRE.

Задача SRE - свести к минимуму работу прогеров в системном администрировании. Но вы спросите, а как SRE отличается от DevOps? Да все просто - DevOps автоматизируют инфраструктуру для продуктов компании, а SRE - для ОГРОМНЫХ инфраструктур. Разница в масштабах, короче.

На западе эти роли четче разделены, а у нас пока можно встретить разные гибриды. Хотя все чаще сейчас прослеживается тенденция выделенных SRE в Росси, аминь🙏

Продолжение следует…