|
|
|
|
|
Аудит "здоровья" сети своими силамиВыявление скрытых проблем сети
|
|
Если явных проблем не выявлено, а пользователи продолжают жаловаться на плохую работу бизнес-приложений, то это означает одно из двух. Либо вам не удалось выявить все явные проблемы, либо в сети есть скрытые проблемы. Скрытая проблема - это то, что вызывает сбои или замедление работы бизнес-приложений, но при этом не сопровождается появлением прогнозируемых ошибок. Локализовать скрытую проблему означает найти компонент ИТ-Инфраструктуры (коммутатор, дисковый контроллер, драйвер сетевой карты и т.п.), который негативно влияет на производительность или доступность сети.
|
|
|
Найти можно только то, что можно увидеть. Поскольку скрытые проблемы не оставляют "обычных следов", необходимо найти другие способы определения их наличия. Признаками наличия скрытых проблем обычно считаются низкие значения скорости выполнения сетевых операций и/или большое число повторных передач на транспортном уровне сети (TCP). Признаки первого типа обычно используются в активных (генерирующих трафик) системах мониторинга. Признаки второго типа - в анализаторах сетевых протоколов. Пакет QuTester Plus относится к категории активных систем мониторинга.
|
|
|
Измерение скорости выполнения сетевых операций является очень эффективным способом определить наличие скрытой проблемы. Например, если коммутатор "глотает" сетевые пакеты, то это обязательно скажется на скорости выполнения файловых операций. Если "тормозит" дисковая система сервера, то это обязательно скажется на скорости выполнения SQL-запросов или хранимых процедур. Если периодически "зависает" из-за перегрева маршрутизатор, то это обязательно скажется на доступности всех приложений, трафик которых проходит через этот маршрутизатор. Поэтому для выявления скрытых проблем достаточно иметь средство, позволяющее измерять скорость выполнения различных сетевых операций. Такими средствами являются, например, активные оценочные тесты, представленные в таблице 2. Эти тесты мы называем активными, т.к. они сами измеряют значения метрик, характеризующих "здоровье" сети.
Таблица 2.
|
Измеряемые метрики |
|
Рекомендуемые ProLAN: Тесты |
|
Скорость и доступность сети при выполнении файловых операций. |
|
Базовый тест оценки производительности файлового сервиса сети. Тест оценки производительности файлового сервиса для программ 1С. |
|
Скорость и доступность сети при выполнении SQL-запросов и/или хранимых процедур. |
|
Базовый SQL-тест |
|
|
|
|
Технологию выявления скрытых проблем продемонстрируем на примере использования теста оценки производительности файлового сервиса (см. Рисунок 3). Установите QuTester Plus на выделенный компьютер и подключите его к тому коммутатору, к которому подключены компьютеры пользователей сети, часто жалующиеся на плохую работу бизнес-приложения. Запустите тест оценки файлового сервиса сети и настройте его на выполнение файловых операций с сервером, где установлено плохо работающее бизнес-приложение. Укажите UNC путь до сервера, тип сети, тип ОС на сервере, стартуйте тест. Тест начнет автоматически выполнять файловые операции и измерять скорость их выполнения (скорость чтения, скорость записи, доступность). Каждую минуту тест будет выполнять операции чтения/записи блоков данных размером 2 KB из файла размером 16 KB; 50% составляют операции чтения, 50%-операции записи.
|
|
|
Интенсивность выполнения файловых операций составляет ~ 50 Кбайт/с, что соответствует ~ 0.2% дополнительной утилизации сети Fast Ethernet FD. Размер файла полностью попадает в кэш память сервера, поэтому скорость выполнения файловых операций будет зависеть в основном от качества канала передачи данных между компьютером и сервером (производительность дисковой системы сервера на скорость практически не влияет).
|
|
|
Если какой-то коммутатор, расположенный в канале передачи данных между компьютером и сервером, перегревшись, начинает "глотать" сетевые пакеты, то в те моменты времени, когда это происходит, скорость выполнения сетевых операций значительно снижается. Поскольку файловые операции выполняются непрерывно, неадекватная работа сети может быть быстро обнаружена. Если в канале передачи данных расположено несколько коммутаторов, то чтобы локализовать "злоумышленника", достаточно запустить тест на компьютере, подключенном к другому коммутатору (который ближе к серверу). Если в этом случае скорость будет нормальной, то виноват первый коммутатор. Если нет, то второй коммутатор или сетевая система сервера. Таким образом, перемещая тест по сети, вы сможете быстро локализовать все дефектные компоненты ИТ-Инфраструктуры или убедиться в их отсутствии.
|
|
|
При анализе результатов активных тестов нужно понимать, что при отсутствии явных проблем скорость выполнения сетевых операций может снижаться не только из-за наличия скрытых проблем, но и вследствие повышения загруженности сети. Поэтому активные сетевые тесты рекомендуется выполнять одновременно с пассивными тестами, используемыми для выявления явных проблем. Чтобы избежать влияния пассивных тестов на работу активных тестов, желательно, чтобы активные и пассивные тесты выполнялись на разных компьютерах сети.
|
|
|
Поскольку скорость выполнения файловых операций автоматически оценивается по пятибалльной шкале, то, настроив систему оповещения, вы будете автоматически получать электронные письма всякий раз, когда скорость выполнения файловых операций или доступность файлового сервиса будут ниже установленного порога. В письмах будет содержаться информация о том, какой светофор изменил свой цвет, когда это произошло, какие метрики при этом изменились и насколько. Множество этих электронных писем будем называть логом низкой производительности сети.
|
|
наверх
|
|