Сервер перестал отвечать ровно в тот момент, когда бухгалтер нажала «сформировать годовой отчёт». Экран завис, кулер заорал, а в офисе повисла тишина, как будто кто-то выключил само время. Похожий коллапс случается в каждой третьей российской компании раз в два года: железо устаёт, пыль забивает каналы, конденсат из кондиционера капает прямо на материнскую плату. Главное — не метаться и не звонить первому попавшемуся «мастеру компьютеров», который заменит блок питания за цену нового сервера. Системный ремонт серверов начинается с холодной головы и чёткого алгоритма.

Почему серверы ломаются чаще, чем хочется
Сервер — это не просто большой компьютер, а круглосуточный трудяга, который дышит пылью офиса и перегревается от соседства с батареями. Статистика сервисных центров неумолима: 42 % поломок случаются из-та перегрева, 28 % — из-за скачков напряжения, остальное делят между собой ошибки персонала, устаревшее ПО и обычная усталость металла. Причём первый звонок — не гул вентилятора и не красная лампочка, а странные тормоза в базе данных: запрос, который раньше бежал секунду, теперь думает пять. Именно этот момент идеален для диагностики, потому что аппарат ещё жив, но уже кашляет.
Первые признаки, которые нельзя игнорировать
- Скрип кулера, похожий на вздыхающую старую кофемолку — подшипнику осталось жить недели две.
- Запах горячего пластика утром в серверной — изоляция на кабелях начинает плавиться.
- RAID-массив переваливает за 55 °C уже в простое, а зимой кондиционер выключен «для экономии».
- В журнале событий Windows появляются записи «Disk 1, predictive failure» — жёсткий диск готов уйти в закат.
Диагностика без дыма и оракулов
Перед тем как вызывать инженера, администратор может провести быструю проверку, которая займёт меньше получаса и не требует отвёртки. Достаточно зайти в iDRAC или IPMI, посмотреть температурные датчики и считать SMART-таблицу дисков. Если температура процессора стабильно выше 80 °C, а диски набирают по два-три realloc-сектора в неделю, железу осталось жить считанные дни. Следующий шаг — загрузить фирменный Live-CD с утилитами производителя: Dell даёт Dell Diagnostics, HP — Smart Storage Administrator. Эти инструменты за пятнадцать минут выдают отчёт, который инженер потом пробегает глазами быстрее, чем чашку кофе.
Что входит в классический ремонтный сценарий
- Бесперебойное отключение сервера через команду shutdown /s /t 0, а не кнопкой Power.
- Фотосъёмка внутреннего устройства до того, как кто-нибудь выдернет кабели «на память».
- Визуальный осмотр: вздутые конденсаторы, чёрные дорожки на плате, пластиковые расплавы рядом с БП.
- Замена термопасты и прочистка радиаторов пылесосом с антистатическим насадком.
- Проверка блока питания осциллографом: пульсации не должны превышать 5 % от номинала.
- Тест новых дисков в стенде перед тем, как вернуть их в RAID-группу.
- Постепенный запуск системы: сначала без нагрузки, потом с тестовой виртуальной машиной, в конце — рабочий контур.
Сколько стоит минимальный ремонт и где грань между ремонтом и апгрейдом
Замена двух вентиляторов в корпусе 2U обходится в среднем в 4 500 рублей с учётом запчастей и работы, но если дело дошло до материнской платы, цена прыгает до 35 000 — и это ещё без стоимости самой платы, которую производитель продаёт по курсу «золотого» доллара. Поэтому инженеры советуют: если серверу больше семи лет, а новая плата стоит шестую часть цены свежей конфигурации, разумнее переложить данные на временный массив и заказать новый шасси. Старый аппарат тогда превращается в тестовую площадку: его ставят в изоляцию и гоняют нагрузочные тесты, прежде чем выбросить.
Список расходников, которые всегда должны быть на складе
- Термопаста Arctic MX-4 — 4 грамма хватает на пять серверов.
- Вентиляторы формата 80×80 мм на 12 В с тахосигналом — берут сразу партию в десять штук.
- Конденсаторы 1000 мкФ × 16 В — самые частые «жертвы» скачков напряжения.
- Блок питания на 550 Вт с 80 PLUS Gold — запасной, чтобы не ждать поставок три недели.
- Кабели SAS 1 м — рвутся, когда администратор спешит и дергает за жгут.
Профилактика, которая продлевает жизнь вдвое
После ремонта серверу нужен режим «спа»: температура в серверной не выше 24 °C, влажность 45–55 %, кондиционер с автоматическим дренажом. Раз в квартал проводят чистку фильтров и перепрошивку всех микрокодов: новые версии BIOS и RAID-контроллера закрывают уязвимости и учатся вентилировать память лучше.

















