|
|
|
|
|
Аудит "здоровья" сети своими силамиДокументирование "здоровья" сети
|
|
Прежде чем документировать результаты аудита и приступить к выработке рекомендаций, нужно убедиться в полноте собранных данных и правильности их оценки. Сделать это можно следующим образом. Сопоставьте лог явных проблем и лог низкой производительности сети со значениями метрики СОКС. Если время появления красных значений светофоров в логах совпадает по времени с нулевыми значениями СОКС, то данные полны и оценены правильно. Это будет означать, что установлено соответствие между жалобами пользователей бизнес-приложений и "здоровьем" сети. Если полного соответствия не будет, то результаты недостоверны. Степень достоверности легко оценить в процентах.
|
|
|
В ходе аудита собирается множество данных, характеризующих "здоровье" сети. Чтобы превратить эти данные в информацию, их нужно статистически обработать и представить в удобном для анализа виде. Таким видом является Базовая Линия. Обычно используют три вида Базовых Линий. Простейшей Базовой Линией является среднее арифметическое значение метрики за все время аудита. Как и средняя температура по больнице, такая оценка мало информативна. Вторым видом Базовой Линии является диапазон наиболее вероятных значений метрики за все время аудита. В данном случае вычисляется не среднее арифметическое значение, а перцентиль, например, перцентиль 75 (диапазон наиболее вероятных значений с вероятностью 75%). Этот показатель более информативен и мы рекомендуем его использовать для не очень значимых метрик.
|
|
|
Наибольший интерес для анализа представляет Базовая Линия, которая называется: "Типовой Рабочий День". Она представляет собой множество наиболее вероятных значений метрики в каждый момент времени (минуту ,15 минут и т.д.) в течение рабочего дня. Используя Типовой Рабочий День, можно легко выявить причинно-следственные связи в работе ИТ-Инфраструктуры, оценить "запас устойчивости" сети и многое другое. Кроме этого, Типовой Рабочий День используется в качестве параметра ProLAN-тестов, предназначенных для обнаружения аномалий в работе сети, например, в тесте обнаружения аномалий в работе коммутируемой сети. Обычно Типовой Рабочий День рассчитывают для наиболее значимых метрик, например, утилизации сервера, утилизации магистрального канала связи и т.п.
|
|
|
Чтобы построить Типовой Рабочий День, данные, полученные в понедельник, нужно "статистически наложить" на данные вторника, среды и т.д. В результате будут получены два графика, "перцентиль >" и "перцентиль <", образующих "вероятностную трубу", характеризующую наиболее вероятные значения метрики в каждый момент времени в течение дня. К сожалению, статистическая обработка данных требует наличия специального инструментария, который не входит в состав бесплатного продукта QuTester Plus.
|
|
|
Для макроанализа "здоровья" сети очень удобно иметь одну интегральную оценку "здоровья" сети. Такую оценку мы называем индексом "здоровья" сети и рассчитываем следующим образом. Это доля времени, выраженная в процентах, в течение которого в логе явных проблем и логе низкой производительности сети не фиксировались красные значения светофоров. При этом важно, чтобы данные, на основе которых вычисляется индекс "здоровья" сети были полны и достоверны (в соответствии с описанным выше алгоритмом). Например, если в течение рабочего дня (10 часов или 600 минут) было зафиксировано 90 красных светофоров, то индекс "здоровья" сети составит: 100% - 90/600*100% = 85%. Индекс "здоровья" сети удобно использовать не только для оценки текущего "здоровья" сети, но и для оценки эффективности проведенной модернизации сети. Например, сравнив значения индекса "здоровья" сети до и после замены сервера, можно легко оценить эффективность сделанной замены.
|
|
наверх
|
|