Решил я рассказать небольшую страшилку, поскольку знаю что здесь на форуме обитает
большое количество сисадминов - как опытных так и начинающих.
Многие знают что по работе я занимаюсь серверами в компании Тринити.
Принесли мне 9 декабря знакомые ребята сервер, на котором в основном хостился сайт usedcars.ru.
Кто не знает - это сайт с посещением порядка 50000 человек в сутки с объявлениями о продаже подержаных авто, в общем крупный коммерческий ресурс.
Ситуация классическая, многошаговая:
1. на сервере (гарантийном!) был собран RAID5 (отказоустойчив к выходу уз строя 1 HDD) вышел из строя 1 диск.
В принципе ничего страшного в этом нет, рядовая ситуация, однако системный администратор, в силу огромного количества причин, не мог целый месяц добраться до сервера чтобы поменять винт.
2. добравшись до ещё рабочего сервера админ резонно решил что пора бы сделать бакап, и начал сливать данные на внешний USB HDD
3. возросшая нагрузка на рейд привела к отвалу и умиранию ещё одного hdd и следовательно потере всей информации (13 лет работы сайта!)
В таком состоянии сервер попал ко мне в руки.
Большия счастьем я считаю что ребятам из Q-lab удалось на время реанимировать умерший последним диск.
Казалось бы - вот оно счастье...
начинаем копировать данные - рядовая операция, ну на пару часов максимум. Это уже было под конец дня 8 дек.
Было решено оставить копирование данных на ночь чтобы с утра сохраненные данные перелить обратно на рейд из новых винтов.
С утра счастья не наступило - весь диск назначения был забит мусором из одного каталога который из за сбоя на реанимированном винте замкнулся рекурсивно сам на себя и при попытке его скопировать многократно вложенно дублировался.
Пришлось начинать всю процедуру заного с правилами исключения, к слову сказать одно только удаление этой рекурсии заняло почти час.
Ну да ладно, перепрыгнули рекурсию и снова грабли - в самом важном месте сайта есть католог, в который складывались картинки машин из объявлений... 13 лет подряд в один и тот же каталог...
В общем линукс сильно поднялся в моих глазах когда он смог переварить 1млн. 300тыс. файлов в одном каталоге ! (прграммера расстрелять за такое )
Пережевывался этот каталог 4 часа!
Надеюсь к завтрешнему обеду сайт снова заработает.
Прямых убытков тысяч примерно на 10р , что было бы если не удалось поднять винт последний умерший, просто страшно представить.
Выводы делайте сами, товарищи опытные и начинающие Админы ...