Технический форум по робототехнике.
setar » 23 мар 2009, 00:45
на серваке форума начала по всей видимости дохнуть мама.
отключился второй процессор.
возможны сбои (я перегружаю его пытаясь решить/диагностировать
) и тормоза.
лишний повод форсировать переезд на кластерную платформу...
Добавлено спустя 42 секунды:
в пятницу вечером умер в рейде один диск
стремно, неприятно - заменили
через 6 часов умер другой, из второй рейд группы - вообще жопа, меняю , ставлю срочный бакап
увеличившаяся нагрузка на дисковую окончательно добивает сервак - мрет сразу 3 диска
сейчас работаем на темповом серваке
setar » 23 мар 2009, 09:47
то что вика лежит я в курсе, восстанавливаю
setar » 25 мар 2009, 00:26
Вика приведена в норму, проверяйте плиз
=DeaD= » 25 мар 2009, 10:17
По страницам Open Robotics вроде всё живо.
![Clapping :Bravo:](http://roboforum.ru/images/smilies/clapping.gif)
Digit » 25 мар 2009, 10:29
Супер!
![Good :good:](http://roboforum.ru/images/smilies/good.gif)
Пробежался по вике - вроде все хорошо. Учетная запись (моя, по крайней мере) цела.
MiBBiM » 04 май 2009, 14:34
а в начале мая таки что произошло?
setar » 04 май 2009, 15:06
Вытаптываю все грабли что есть, уже весь лоб в шишках.
Примерно так:
- 24 апреля ~19ч двойной сбой по причине переполнения подсистемы хранения (место в домашней директории + исчерпано максимальное кол-во блоков данных на кластерной системе хранения) Пофиксено
- 28 апреля ~20ч сбой сервера бд по причине ухода часов на сутки назад (грабли со стороны win домена
) Пофиксено - 2 мая ~15-18ч система не поднялась после аварийного отключения электроэнергии (не настроены оповещения от ИБП) Предстоит решить
Так же пока ещё mysql хоть физически находится на кластерном железе продолжает работать в одиночном режиме (на одном сервере работает, на другом в случае надобности запускается руками
![Embarassed :oops:](http://roboforum.ru/images/smilies/blush.gif)
)
Предстоит решитьРезюме: с железом все хорошо, но конфигурация кластерная находится в состоянии донастройки. Возможны кратковременные перебои в работе. Потерь данных быть не должно (мнгновенные снимки файловой системы + бакапы).
setar » 06 май 2009, 14:00
продолжаю собирать грабли.
- 6 мая 13:09 электрики решили составить схему сети - дергали все предохранители... оказалось что некоторые сетевые коммутаторы висят не на UPS
(сегодня буду пинать ногами ИТ директора)
Vooon » 06 май 2009, 16:31
Одень боты потяжелее
![Smile :)](http://roboforum.ru/images/smilies/smile.gif)
setar » 07 май 2009, 09:51
![Embarassed :oops:](http://roboforum.ru/images/smilies/blush.gif)
вчера в ночи сплит брейн случился.
Каждый из двух серваков кластера считал что в сети он один, передрались из за ресурсов в итоге один базу поднял другой ip взял по которому база должна была отвечать. Конечно же по нужному ip база не отвечала - её там не было.
ошибка в конфиге кластера,
Пофиксено
setar » 08 май 2009, 17:04
в предверии выходных решил подготовиться - перенес коммутаторы на UPS
соответственно несколько минут не был доступен форум и сессии сбросились (для верности перегружал mysql)
rig » 08 май 2009, 17:06
ты телефон оставь, мытобыстро оповестим, нам же ночи спать не дают!
setar » 08 май 2009, 17:13
rig писал(а):ты телефон оставь, мытобыстро оповестим, нам же ночи спать не дают!
![Smile :)](http://roboforum.ru/images/smilies/smile.gif)
телефон в контактах аси
rig » 08 май 2009, 19:21
по нажатиню на ник перебрасывает в форму ответа та что внизу , ни каких контактов нету
![Sad :(](http://roboforum.ru/images/smilies/sad.gif)
=DeaD= » 08 май 2009, 19:52
контактах аси
![Smile :)](http://roboforum.ru/images/smilies/smile.gif)