Тестирование показало...
Как обычно, на первом этапе тестирования мы проводили тест "FTest by steps" в режиме калибровки, когда все станции работают с сервером, не влияя друг на друга. Уже на этом этапе у нас возникло подозрение о том, что на одной из станций (PC14) имеется дефект. На рисунке 2 представлены результаты этого теста.
Обращает на себя внимание сильное различие в скоростях записи и чтения, а также низкая производительность, достигнутая станцией PC14. Обычно такие результаты бывают обусловлены неоптимальными настройками драйвера сетевой карты или тем, что драйвер сетевой карты не оптимизирован для работы с конкретной сетевой картой. На этой станции была установлена NE-2000 совместимая сетевая карта "no name".
Однако дальнейшее тестирование показало, что неисправность нужно искать в самом сетевом адаптере. Это выявилось при выполнении теста "FTest all stations" с нагрузкой только на сеть. Некоторые результаты этого теста приведены на рисунке 3. На данном рисунке видно, что поведение рабочей станции PC14, которая привлекла наше внимание еще в тесте калибровки, сильно выбивается из общей картины. Значение ее пропускной способности значительно ниже, чем у остальных рабочих станций с близким по значению индексом производительности. Тот же эффект наблюдается и для скоростных характеристик (скорость чтения, скорость записи). С увеличением интенсивности сетевого трафика скоростные и нагрузочные характеристики данной станции падают практически до нуля уже при утилизации сети ~30%. Такое поведение станции свидетельствует о явном дефекте сетевого адаптера. Не осуществляя более детальную диагностику сетевого адаптера, можно лишь предположить, что данный дефект связан с некорректной отработкой адаптером алгоритма CSMA/CD (алгоритм доступа к каналу связи в Ethernet).
Вследствие данного дефекта, при одновременной работе станции с дефектным сетевым адаптером и нормальных станций, последние "забивают" дефектную станцию, практически не позволяя передавать данные в сеть. На скорость работы остальных станций данный дефект вроде бы сказываться не должен, однако ... .
Однако, если на дефектной рабочей выполняется сетевое приложение, в котором несколько рабочих станций обращаются к совместно используемым данным на сервере, то такая дефектная сетевая карта может замедлять работу всех остальных станций сети. Это и происходило в диагностируемой сети.
Чтобы промоделировать эту ситуацию, мы провели тест "FTest all stations" с нагрузкой только на сеть, и при этом установив в параметрах теста опцию "Разделяемый файл". То есть все станции в ходе теста должны были работать с одним общим для всех файлом (а не с индивидуальными файлами). Этот режим тестирования эмулирует работу пользователей с одной базой данных. Некоторые результаты теста приведены на рисунке 4.
Вы видите суммарную производительность всех рабочих станций (синяя линия) и производительность рабочей станции PC14 (красная линия), полученные в процессе этого теста. Каждый график приведен в своем масштабе, соответствующие шкалы приведены слева и справа от графика. Левая шкала соответствует значениям суммарной производительности всех станций в сети, правая шкала - значениям производительности рабочей станции PC14. Это сделано для большей наглядности представления данных. В таком масштабе отчетливо видно, что на восьмом шаге теста, рабочей станции PC14 удалось провести несколько операций чтения и записи о чем свидетельствует небольшое (всего на 1КБ/с) увеличение производительности этой рабочей станции. Но так как скорость операций чтения и записи у нее значительно ниже, чем у всех остальных станций в сети, это привело к длительной по времени блокировке некоторой части общего тестового файла. Именно этим и обусловлено снижение производительности у большинства рабочих станций в сети. Суммарная производительность в сети на данном шаге снизилась почти на 150 КБ/с!
Таким образом, программа RS-Balance в глазах администратора сети и все пользователей была реабилитирована.
|