Кодеру и не обязательно знать дальше тех абстракций, что предоставляют ему интерфейсы систем. Так же, как и заниматься решением за пределами поставленной задачи.
Не, это дело коммуникации архитектора и бизнеса. С учетом кучи параметров, так как и стоимость данных - не константа во времени и стоимость инвестиций тоже меняется. Потому для проекта на начальной стадии вариант "купить недешевый СХД" может работать в варианте "купить через пять лет при таком-то плане роста, а пока - на скриптах". И это нормальное совместно решение архитектора вместе с бизнесом.
Может. Но для начала хоть какие то цифры посчитайте, дорогой бизнес! А то как ни спросишь - вот это терять нельзя, простой недопустим, это суперкритично.
Это сразу довольно бессмысленный разговор выходит. Лучше вместо "терять нельзя, простой недопустим" начать обсуждать, сколько готовы заплатить за "страховку", выдавать статистику инцидентов и т.п.
Да вообще все за последние пару десятилетий. За инфраструктуру отвечал далеко не во всех, конечно. Впрочем, тех, где риски стоили покупки СХД или VmWare для прода - ни одного.
Зависит от задачи. Для бизнеса всегда приоритетнее продуктовые фичи, чем оптимизация кода/выбор тех. стека/прокачка разрабов. Имхо, о качестве кода и компонент должны думать другие люди (архитектор, тех лид, SRE). Иначе классный кодер может зарыться в полировке кода, когда это никому и не нужно.
Ну, вообще правильное поведение при сбоях - это продуктовая фича. И с бизнесом нет проблем договориться в этих вещах. И о качестве кода, конечно, должен думать разработчик, а не SRE (который вообще странная концепция, нужная только гуглу). Архитектор (вернее QA Lead) должен кодеру выдать требования к качеству.
В моём нынешнем понимании, SRE — это как раз лицо/команда, которые решают проблемы оптимизации, скейлинга, соответствия SLO через требования к софту, а не инфраструктуре. К примеру, впилить raft прямо в софт вместо метрокластера с кворумом.
Хм, странное понимание. Это, скорее, часть задач платформенный команды, при чем тут SRE. Классическое SRE - это когда проще нанять кучу дорогих универсальных специалистов, нежели выстроить процессы работы с НФТ. Для Гугла - решение. Для кого другого - скорее проблема.