В этом докладе я планирую осветить следующие проблемы: - Почему стандартных механизмов балансировки бывает недостаточно. - Как выбирать фундамент для решения, и какие принципы проектирования использовались. - Как формировались требования для решения, которое работает сейчас в продакшне и пропускает через себя ощутимое количество. Расскажу, как без помощи сторонних сессионных хранилищ и довольно за дёшево организовать "sticky balancing", и как это работает с точки зрения науки. Покажу пример отказоустойчивой геораспределённой системы, расскажу, что мониторить и как правильно это делать при помощи специального расширения для nginx и не только. Расскажу о том, как было организовано нагрузочное и функциональное тестирование конечного продукта. Также расскажу про полный жизненный цикл этого весьма критичного для инфраструктуры приложения. Поскольку мы живём в публичных облаках, я по ходу доклада расскажу, как мы тестировали и сравнивали AWS и GCP, а также про некоторые сугубо практические особенности организации in-house балансировки внутри публичного облака.