Внедрив в Windows комплексный Монитор ресурсов (Resource Monitor), разработчики Microsoft предоставили администраторам великолепный инструмент, позволяющий быстро получать всю необходимую информацию о состоянии критически важных серверов. В цикле статей о Мониторе ресурсов я расскажу о четырех ключевых аспектах этого средства мониторинга: ЦП, память, диск и сеть. В этой статье речь пойдет о различных показателях, касающихся состояния дисковой подсистемы. Я расскажу о назначении графиков, представленных в Мониторе ресурсов на вкладке «Диск» (Disk), и вкратце объясню, как пользоваться полученными сведениями. Для удобства рассмотрения мы будем использовать скриншот Монитора ресурсов (рис. A), запущенного на производственном сервере под управлением Windows Server 2008 R2. На этом сервере установлен Exchange Server 2010 со всеми ролями, поэтому он нуждается в большой дисковой подсистеме с приемлемой производительностью. (Примечание: как и все другие наши серверы, этот работает в виртуальной машине на базе VMware vSphere 4.1.) Рисунок A. Монитор ресурсов в Windows Server 2008 R2 (нажмите на изображении для увеличения). Начнем с общего обзора консоли. Большую часть окна занимают статистические показатели, о которых я подробно расскажу ниже. Справа расположены графики, каждый из которых представляет один из важных показателей производительности дисковой подсистемы. Ниже я подробно рассмотрю каждый показатель. Я не буду повторяться: если показатель присутствует в нескольких местах, я упомяну его только в первый раз. Процессы с дисковой активностью В разделе «Процессы с дисковой активностью» (Processes With Disk Activity) перечислены все запущенные процессы, использующие ресурсы хранения. В списке показано имя исполняемого файла и ряд связанных с ним статистических показателей. • «Образ» (Image) – имя исполняемого файла. Это имя процесса, активно использующего диск. Информация, которая приводится в этом разделе, не особенно актуальна для диагностики – она лишь позволяет выяснить, какие процессы потребляют больше всего ресурсов диска. На рис. A, например, можно заметить, что больше всего операций чтения с диска выполняет процесс с именем «DPMRA.exe». Работа диска В разделе «Работа диска» (Disk Activity) собраны более полезные для диагностики сведения. Самый ценный показатель – пожалуй, время ответа, поскольку его можно оценить, даже не зная исходной конфигурации дисковой подсистемы. Справа от названия раздела расположены два небольших индикатора. Зеленый показывает текущий дисковый ввод/вывод (Disk I/O), то есть, количество передаваемых в данный момент данных), а синий – максимум активного времени дисковой подсистемы (Highest Active Time). • «Файл» (File) – имя файла, используемого процессом. Здесь указывается полный путь к файлу, чтобы его легче было найти. Запоминающие устройства В разделе «Запоминающие устройства» (Storage) содержатся следующие сведения: • «Логический диск» (Logical Disk) – буква диска. • «Свободно (МБ)» (Available Space (MB)) – количество свободного пространства в текущем томе диска. • «Всего (МБ)» (Total Space (MB)) – общий объем тома. • «Длина очереди диска» (Disk Queue Length) Уровень RAID и размер страйпа тоже влияют на длину очереди, что дополнительно усложняет задачу. Однако если компьютер оснащен всего одним диском, а длина очереди постоянно превышает 2, система нуждается в дополнительных ресурсах хранения. Длина очереди более 5 свидетельствует о наличии серьезных проблем. Если вам известно, из скольких дисков состоит базовый том, умножьте количество дисков на 2, чтобы очень грубо, приблизительно, прикинуть максимально допустимую длину очереди. К примеру, если в системе десять дисков, а длина очереди равна 18, значит, все в порядке. Графики Графики – очень полезный инструмент. В верхнем графике показана скорость обмена данными между диском и операционной системой за последнюю минуту. Зеленая кривая показывает текущий суммарный ввод/вывод, а синяя – активное время диска за этот период. На остальных графиках показана длина очереди для каждого диска в системе. На сервере Exchange, который показан в моем примере, используется четыре диска (тома SAN). С учетом структуры базовых томов SAN в этом массиве, никаких проблем, связанных с длиной очереди, не возникает. До встречи во второй части Во второй статье цикла я расскажу о показателях производительности ЦП в Мониторе ресурсов. Автор: Scott Lowe Оцените статью: |
Внедрив в Windows комплексный Монитор ресурсов (Resource Monitor), разработчики Microsoft предоставили администраторам великолепный инструмент, позволяющий быстро получать всю необходимую информацию о состоянии критически важных серверов. В цикле статей о Мониторе ресурсов я расскажу о четырех ключевых аспектах этого средства мониторинга: ЦП, память, диск и сеть. В этой статье речь пойдет о различных показателях, касающихся состояния дисковой подсистемы. Я расскажу о назначении графиков, представленных в Мониторе ресурсов на вкладке «Диск» (Disk), и вкратце объясню, как пользоваться полученными сведениями. |
Для удобства рассмотрения мы будем использовать скриншот Монитора ресурсов (рис. A), запущенного на производственном сервере под управлением Windows Server 2008 R2. На этом сервере установлен Exchange Server 2010 со всеми ролями, поэтому он нуждается в большой дисковой подсистеме с приемлемой производительностью. (Примечание: как и все другие наши серверы, этот работает в виртуальной машине на базе VMware vSphere 4.1.)
Начнем с общего обзора консоли. Большую часть окна занимают статистические показатели, о которых я подробно расскажу ниже. Справа расположены графики, каждый из которых представляет один из важных показателей производительности дисковой подсистемы.
Ниже я подробно рассмотрю каждый показатель. Я не буду повторяться: если показатель присутствует в нескольких местах, я упомяну его только в первый раз.
Процессы с дисковой активностью
В разделе «Процессы с дисковой активностью» (Processes With Disk Activity) перечислены все запущенные процессы, использующие ресурсы хранения. В списке показано имя исполняемого файла и ряд связанных с ним статистических показателей.
• «Образ» (Image) – имя исполняемого файла. Это имя процесса, активно использующего диск.
• «ИД процесса» (PID) – идентификатор процесса. Может пригодиться для управления процессами с использованием других утилит или для поиска процессов в Диспетчере задач (Task Manager).
• «Чтение (байт/с)» (Read (B/sec)) – среднее количество прочитанных процессом байтов в секунду за последнюю минуту.
• «Запись (байт/с)» (Write (B/sec)) – среднее количество записанных процессом байтов в секунду за последнюю минуту.
• «Всего (байт/с)» (Total (B/sec)) – среднее количество использованных байтов в секунду за последнюю минуту.
Информация, которая приводится в этом разделе, не особенно актуальна для диагностики – она лишь позволяет выяснить, какие процессы потребляют больше всего ресурсов диска. На рис. A, например, можно заметить, что больше всего операций чтения с диска выполняет процесс с именем «DPMRA.exe».
Работа диска
В разделе «Работа диска» (Disk Activity) собраны более полезные для диагностики сведения. Самый ценный показатель – пожалуй, время ответа, поскольку его можно оценить, даже не зная исходной конфигурации дисковой подсистемы.
Справа от названия раздела расположены два небольших индикатора. Зеленый показывает текущий дисковый ввод/вывод (Disk I/O), то есть, количество передаваемых в данный момент данных), а синий – максимум активного времени дисковой подсистемы (Highest Active Time).
• «Файл» (File) – имя файла, используемого процессом. Здесь указывается полный путь к файлу, чтобы его легче было найти.
• «Приоритет ввода/вывода» (I/O Priority) – приоритет операций ввода/вывода.
• «Время ответа (мс)» (Response Time (ms)) – время отклика диска в миллисекундах. Как правило, чем ниже этот показатель, тем лучше. В целом, время ответа менее 10 мс свидетельствует о хорошей производительности. Не страшно, если этот показатель время от времени превышает отметку в 10 мс, но если системе постоянно приходится дожидаться ответа дисковой подсистемы более 20 мс, это может свидетельствовать о наличии проблем, а конечные пользователи в таком случае заметят ощутимое снижение быстродействия. Если время ответа достигает 50 мс и выше, значит, проблема действительно серьезная. На рис. A, как видите, время ответа составляет 5-6 мс, так что дисковая подсистема функционирует исправно, если судить по этому показателю.
Запоминающие устройства
В разделе «Запоминающие устройства» (Storage) содержатся следующие сведения:
• «Логический диск» (Logical Disk) – буква диска.
• «Физический диск» (Physical disk) – выбранный для мониторинга физический диск.
• «Активное время (%)» (Active Time (%)) – сколько времени диск проводит, активно обслуживая запросы, в противовес времени простоя. Если активность диска постоянно очень высока (скажем, более 80%), это может указывать на наличие потенциальных проблем, связанных с ресурсами хранения. Если пользователи жалуются на низкое быстродействие, а активное время постоянно составляет 100%, возможно, необходимо увеличить объем дисковой подсистемы или установить более производительные накопители.
• «Свободно (МБ)» (Available Space (MB)) – количество свободного пространства в текущем томе диска.
• «Всего (МБ)» (Total Space (MB)) – общий объем тома.
• «Длина очереди диска» (Disk Queue Length) – средняя длина очереди диска. Длина очереди показывает количество ожидающих выполнения запросов (на чтение и запись) в любой момент времени. Если этот показатель довольно высок, это может свидетельствовать о том, что скорость вращения диска недостаточна для удовлетворения запросов приложений или что дисковая подсистема имеет слишком низкую производительность и не справляется с запросами. Однако чтобы оценить, насколько высок показатель, необходимо хорошо понимать, как создается базовый том в SAN. Каждый диск, из которых складывается базовый том, предоставляет дополнительные ресурсы, которые учитываются при расчете длины очереди (проще говоря, чем больше дисков, тем выше будет длина очереди).
Уровень RAID и размер страйпа тоже влияют на длину очереди, что дополнительно усложняет задачу. Однако если компьютер оснащен всего одним диском, а длина очереди постоянно превышает 2, система нуждается в дополнительных ресурсах хранения. Длина очереди более 5 свидетельствует о наличии серьезных проблем. Если вам известно, из скольких дисков состоит базовый том, умножьте количество дисков на 2, чтобы очень грубо, приблизительно, прикинуть максимально допустимую длину очереди. К примеру, если в системе десять дисков, а длина очереди равна 18, значит, все в порядке.
Графики
Графики – очень полезный инструмент. В верхнем графике показана скорость обмена данными между диском и операционной системой за последнюю минуту. Зеленая кривая показывает текущий суммарный ввод/вывод, а синяя – активное время диска за этот период. На остальных графиках показана длина очереди для каждого диска в системе.
На сервере Exchange, который показан в моем примере, используется четыре диска (тома SAN). С учетом структуры базовых томов SAN в этом массиве, никаких проблем, связанных с длиной очереди, не возникает.
Использование Монитора ресурсов (Resource Monitor): центральный процессор
Для удобства рассмотрения мы будем использовать скриншот Монитора ресурсов (рис. A), запущенного на производственном сервере под управлением Windows Server 2008 R2. На этом сервере установлен Exchange Server 2010 со всеми ролями. Как и все другие наши серверы, этот работает в виртуальной машине на базе VMware vSphere 4.1 и располагает четырьмя виртуальными процессорами. Этот скриншот был сделан в тот период, когда нагрузка на сервер была совсем не высока.
Начнем с общего обзора консоли. Большую часть окна занимают статистические показатели, о которых я подробно расскажу ниже. Я не буду повторяться: если показатель присутствует в нескольких местах, я упомяну его только в первый раз.
Процессы
В разделе «Процессы» (Processes) перечислены все запущенные процессы, использующие ресурсы центрального процессора. В списке показано имя исполняемого файла и ряд связанных с ним статистических показателей.
• «Образ» (Image) – имя исполняемого файла. Это имя процесса, использующего ресурсы ЦП.
• «ИД процесса» (PID) – идентификатор процесса. Может пригодиться для управления процессами с использованием других утилит или для поиска процессов в Диспетчере задач (Task Manager).
• «Описание» (Description) – короткое описание, объясняющее назначение процесса.
• «Состояние» (Status) – состояние выполнения процесса: чаще всего «Выполняется» (Running), иногда – «Прерван» (Terminated), если процесс больше не выполняется.
• «Потоки» (Threads) – количество активных потоков. Поток – это единица обработки.
• «ЦП» (CPU) – текущий процент загрузки ЦП процессом, другими словами, сколько ресурсов процессора выделено данному процессу.
• «Среднее для ЦП» (Average CPU) – среднее потребление ресурсов ЦП процессом за последние 60 секунд. Этот показатель позволяет оценить состояние системы за последнюю минуту и в данный момент.
Раздел «Процессы» очень полезен для диагностики – он позволяет быстро оценить текущее состояние системы. Еще один вариант применения – нажать на зависшем процессе правой кнопкой мыши и выбрать опцию «Анализ цепочки ожидания» (Analyze Wait Chain, рис. B). По результатам анализа выводится отчет (рис. C).
Службы
В разделе «Службы» (Services) перечислены все запущенные службы. На рис. A, как можно заметить, перечислены только службы, связанные с двумя выделенными процессами. Это позволяет отследить взаимосвязи процессов и служб, что может пригодиться при диагностике. Кроме того, на любой службе можно нажать правой кнопкой мыши для остановки или перезапуска.
• «Группа» (Group) – группа, к которой принадлежит служба. Некоторые службы работают вместе в группах.
Связанные дескрипторы
Возникала ли у вас хоть раз потребность выяснить, каким процессом открыт файл? Раздел Монитора ресурсов «Связанные дескрипторы» (Associated Handles) предназначен как раз для этого. Дескрипторы – это указатели, которые ссылаются на файлы, ключи реестра, каталоги и т. д.
В поле «Поиск дескриптора» (Search Handles) введите имя файла или путь – и получите список процессов, его использующих. Это особенно удобно при работе со службами, использующими множество файлов, например, svchost. На рис. E показано, как данная функция помогает проредить массу процессов svchost. В этой таблице можно нажать правой кнопкой мыши на любом файле svchost и завершить данный конкретный процесс.
• «Тип» (Type) – тип дескриптора. О типах дескрипторов подробно рассказывается в статье Марка Руссиновича (Mark Russinovich) на сайте TechNet.
• «Имя дескриптора» (Handle Name) – имя дескриптора, связанного с выбранным процессом. Имя можно использовать для поиска связанных файлов или ключей реестра.
Связанные модули
Модули – это вспомогательные файлы или программы, например, библиотеки DLL, используемые процессами для выполнения своих задач. Информация из раздела «Связанные модули» (Associated modules) может пригодиться для более глубокого анализа потенциальных проблем, связанных со снижением производительности.
• «Имя модуля» (Module name) – имя модуля, загруженного выбранными процессами.
• «Версия» (Version) – версия файла для соответствующего модуля.
• «Полный путь» (Full Path) – полный путь к используемому модулю.
Графики
В правой части окна расположены графики, представляющие различные показатели производительности центрального процессора.
• «ЦП – Всего» (CPU – Total) – отображает два показателя, представленные синими прямыми и зеленой кривой. Синяя прямая показывает общую вычислительную мощность процессора (частоту ЦП), доступную системе, а зеленая кривая – текущее использование этих ресурсов. Монитор ресурсов доступен в разных версиях Windows, и многие современные компьютеры оснащаются процессорами, которые способны снижать собственную частоту для экономии энергии и уменьшения температуры. При таком снижении частоты ЦП синяя прямая опускается, а зеленая кривая корректируется в соответствии с новыми условиями.
• «Использование ЦП службами» (Service CPU usage) – показывает, сколько ресурсов ЦП выделено фоновым службам и процессам.
• «ЦП 0 – ЦП 3» (CPU 0 – CPU 3) – показывает, сколько ресурсов каждого ядра процессора используется. Некоторые ЦП обозначены как припаркованные (Parked) – это значит, что они временно отключены, поскольку для них пока нет работы. Скриншоты для этой статьи были сделаны в нерабочее время на каникулах, так что наш Exchange к тому моменту пару месяцев простаивал.
В заключение
Вкладка «ЦП» в Мониторе ресурсов предоставляет массу полезной информации о ключевых показателях производительности центрального процессора.
Длина очереди диска в мониторе ресурсов
Использование Монитора ресурсов: дисковая подсистема, процессор
Использование Монитора ресурсов: дисковая подсистема
Внедрив в Windows комплексный Монитор ресурсов (Resource Monitor), разработчики Microsoft предоставили администраторам великолепный инструмент, позволяющий быстро получать всю необходимую информацию о состоянии критически важных серверов. В цикле статей о Мониторе ресурсов я расскажу о четырех ключевых аспектах этого средства мониторинга: ЦП, память, диск и сеть. В этой статье речь пойдет о различных показателях, касающихся состояния дисковой подсистемы. Я расскажу о назначении графиков, представленных в Мониторе ресурсов на вкладке «Диск» (Disk), и вкратце объясню, как пользоваться полученными сведениями.
Начнем с общего обзора консоли. Большую часть окна занимают статистические показатели, о которых я подробно расскажу ниже. Справа расположены графики, каждый из которых представляет один из важных показателей производительности дисковой подсистемы.
Ниже я подробно рассмотрю каждый показатель. Я не буду повторяться: если показатель присутствует в нескольких местах, я упомяну его только в первый раз.
Процессы с дисковой активностью
В разделе «Процессы с дисковой активностью» (Processes With Disk Activity) перечислены все запущенные процессы, использующие ресурсы хранения. В списке показано имя исполняемого файла и ряд связанных с ним статистических показателей.
• «Образ» (Image) – имя исполняемого файла. Это имя процесса, активно использующего диск.
• «ИД процесса» (PID) – идентификатор процесса. Может пригодиться для управления процессами с использованием других утилит или для поиска процессов в Диспетчере задач (Task Manager).
• «Запись (байт/с)» (Write (B/sec)) – среднее количество записанных процессом байтов в секунду за последнюю минуту.
• «Всего (байт/с)» (Total (B/sec)) – среднее количество использованных байтов в секунду за последнюю минуту.
Информация, которая приводится в этом разделе, не особенно актуальна для диагностики – она лишь позволяет выяснить, какие процессы потребляют больше всего ресурсов диска. На рис. A, например, можно заметить, что больше всего операций чтения с диска выполняет процесс с именем «DPMRA.exe».
Работа диска
В разделе «Работа диска» (Disk Activity) собраны более полезные для диагностики сведения. Самый ценный показатель – пожалуй, время ответа, поскольку его можно оценить, даже не зная исходной конфигурации дисковой подсистемы.
Справа от названия раздела расположены два небольших индикатора. Зеленый показывает текущий дисковый ввод/вывод (Disk I/O), то есть, количество передаваемых в данный момент данных), а синий – максимум активного времени дисковой подсистемы (Highest Active Time).
• «Файл» (File) – имя файла, используемого процессом. Здесь указывается полный путь к файлу, чтобы его легче было найти.
• «Приоритет ввода/вывода» (I/O Priority) – приоритет операций ввода/вывода.
• «Время ответа (мс)» (Response Time (ms)) – время отклика диска в миллисекундах. Как правило, чем ниже этот показатель, тем лучше. В целом, время ответа менее 10 мс свидетельствует о хорошей производительности. Не страшно, если этот показатель время от времени превышает отметку в 10 мс, но если системе постоянно приходится дожидаться ответа дисковой подсистемы более 20 мс, это может свидетельствовать о наличии проблем, а конечные пользователи в таком случае заметят ощутимое снижение быстродействия. Если время ответа достигает 50 мс и выше, значит, проблема действительно серьезная. На рис. A, как видите, время ответа составляет 5-6 мс, так что дисковая подсистема функционирует исправно, если судить по этому показателю.
Запоминающие устройства
В разделе «Запоминающие устройства» (Storage) содержатся следующие сведения:
• «Логический диск» (Logical Disk) – буква диска.
• «Физический диск» (Physical disk) – выбранный для мониторинга физический диск.
• «Активное время (%)» (Active Time (%)) – сколько времени диск проводит, активно обслуживая запросы, в противовес времени простоя. Если активность диска постоянно очень высока (скажем, более 80%), это может указывать на наличие потенциальных проблем, связанных с ресурсами хранения. Если пользователи жалуются на низкое быстродействие, а активное время постоянно составляет 100%, возможно, необходимо увеличить объем дисковой подсистемы или установить более производительные накопители.
• «Свободно (МБ)» (Available Space (MB)) – количество свободного пространства в текущем томе диска.
• «Всего (МБ)» (Total Space (MB)) – общий объем тома.
• «Длина очереди диска» (Disk Queue Length) – средняя длина очереди диска. Длина очереди показывает количество ожидающих выполнения запросов (на чтение и запись) в любой момент времени. Если этот показатель довольно высок, это может свидетельствовать о том, что скорость вращения диска недостаточна для удовлетворения запросов приложений или что дисковая подсистема имеет слишком низкую производительность и не справляется с запросами. Однако чтобы оценить, насколько высок показатель, необходимо хорошо понимать, как создается базовый том в SAN. Каждый диск, из которых складывается базовый том, предоставляет дополнительные ресурсы, которые учитываются при расчете длины очереди (проще говоря, чем больше дисков, тем выше будет длина очереди).
Уровень RAID и размер страйпа тоже влияют на длину очереди, что дополнительно усложняет задачу. Однако если компьютер оснащен всего одним диском, а длина очереди постоянно превышает 2, система нуждается в дополнительных ресурсах хранения. Длина очереди более 5 свидетельствует о наличии серьезных проблем. Если вам известно, из скольких дисков состоит базовый том, умножьте количество дисков на 2, чтобы очень грубо, приблизительно, прикинуть максимально допустимую длину очереди. К примеру, если в системе десять дисков, а длина очереди равна 18, значит, все в порядке.
Графики
Графики – очень полезный инструмент. В верхнем графике показана скорость обмена данными между диском и операционной системой за последнюю минуту. Зеленая кривая показывает текущий суммарный ввод/вывод, а синяя – активное время диска за этот период. На остальных графиках показана длина очереди для каждого диска в системе.
На сервере Exchange, который показан в моем примере, используется четыре диска (тома SAN). С учетом структуры базовых томов SAN в этом массиве, никаких проблем, связанных с длиной очереди, не возникает.
Использование Монитора ресурсов (Resource Monitor): центральный процессор
Для удобства рассмотрения мы будем использовать скриншот Монитора ресурсов (рис. A), запущенного на производственном сервере под управлением Windows Server 2008 R2. На этом сервере установлен Exchange Server 2010 со всеми ролями. Как и все другие наши серверы, этот работает в виртуальной машине на базе VMware vSphere 4.1 и располагает четырьмя виртуальными процессорами. Этот скриншот был сделан в тот период, когда нагрузка на сервер была совсем не высока.
Начнем с общего обзора консоли. Большую часть окна занимают статистические показатели, о которых я подробно расскажу ниже. Я не буду повторяться: если показатель присутствует в нескольких местах, я упомяну его только в первый раз.
Процессы
В разделе «Процессы» (Processes) перечислены все запущенные процессы, использующие ресурсы центрального процессора. В списке показано имя исполняемого файла и ряд связанных с ним статистических показателей.
• «Образ» (Image) – имя исполняемого файла. Это имя процесса, использующего ресурсы ЦП.
• «ИД процесса» (PID) – идентификатор процесса. Может пригодиться для управления процессами с использованием других утилит или для поиска процессов в Диспетчере задач (Task Manager).
• «Описание» (Description) – короткое описание, объясняющее назначение процесса.
• «Состояние» (Status) – состояние выполнения процесса: чаще всего «Выполняется» (Running), иногда – «Прерван» (Terminated), если процесс больше не выполняется.
• «Потоки» (Threads) – количество активных потоков. Поток – это единица обработки.
• «ЦП» (CPU) – текущий процент загрузки ЦП процессом, другими словами, сколько ресурсов процессора выделено данному процессу.
• «Среднее для ЦП» (Average CPU) – среднее потребление ресурсов ЦП процессом за последние 60 секунд. Этот показатель позволяет оценить состояние системы за последнюю минуту и в данный момент.
Раздел «Процессы» очень полезен для диагностики – он позволяет быстро оценить текущее состояние системы. Еще один вариант применения – нажать на зависшем процессе правой кнопкой мыши и выбрать опцию «Анализ цепочки ожидания» (Analyze Wait Chain, рис. B). По результатам анализа выводится отчет (рис. C).
Службы
В разделе «Службы» (Services) перечислены все запущенные службы. На рис. A, как можно заметить, перечислены только службы, связанные с двумя выделенными процессами. Это позволяет отследить взаимосвязи процессов и служб, что может пригодиться при диагностике. Кроме того, на любой службе можно нажать правой кнопкой мыши для остановки или перезапуска.
• «Группа» (Group) – группа, к которой принадлежит служба. Некоторые службы работают вместе в группах.
Связанные дескрипторы
Возникала ли у вас хоть раз потребность выяснить, каким процессом открыт файл? Раздел Монитора ресурсов «Связанные дескрипторы» (Associated Handles) предназначен как раз для этого. Дескрипторы – это указатели, которые ссылаются на файлы, ключи реестра, каталоги и т. д.
В поле «Поиск дескриптора» (Search Handles) введите имя файла или путь – и получите список процессов, его использующих. Это особенно удобно при работе со службами, использующими множество файлов, например, svchost. На рис. E показано, как данная функция помогает проредить массу процессов svchost. В этой таблице можно нажать правой кнопкой мыши на любом файле svchost и завершить данный конкретный процесс.
• «Тип» (Type) – тип дескриптора. О типах дескрипторов подробно рассказывается в статье Марка Руссиновича (Mark Russinovich) на сайте TechNet.
• «Имя дескриптора» (Handle Name) – имя дескриптора, связанного с выбранным процессом. Имя можно использовать для поиска связанных файлов или ключей реестра.
Связанные модули
Модули – это вспомогательные файлы или программы, например, библиотеки DLL, используемые процессами для выполнения своих задач. Информация из раздела «Связанные модули» (Associated modules) может пригодиться для более глубокого анализа потенциальных проблем, связанных со снижением производительности.
• «Имя модуля» (Module name) – имя модуля, загруженного выбранными процессами.
• «Версия» (Version) – версия файла для соответствующего модуля.
• «Полный путь» (Full Path) – полный путь к используемому модулю.
Графики
В правой части окна расположены графики, представляющие различные показатели производительности центрального процессора.
• «ЦП – Всего» (CPU – Total) – отображает два показателя, представленные синими прямыми и зеленой кривой. Синяя прямая показывает общую вычислительную мощность процессора (частоту ЦП), доступную системе, а зеленая кривая – текущее использование этих ресурсов. Монитор ресурсов доступен в разных версиях Windows, и многие современные компьютеры оснащаются процессорами, которые способны снижать собственную частоту для экономии энергии и уменьшения температуры. При таком снижении частоты ЦП синяя прямая опускается, а зеленая кривая корректируется в соответствии с новыми условиями.
• «Использование ЦП службами» (Service CPU usage) – показывает, сколько ресурсов ЦП выделено фоновым службам и процессам.
• «ЦП 0 – ЦП 3» (CPU 0 – CPU 3) – показывает, сколько ресурсов каждого ядра процессора используется. Некоторые ЦП обозначены как припаркованные (Parked) – это значит, что они временно отключены, поскольку для них пока нет работы. Скриншоты для этой статьи были сделаны в нерабочее время на каникулах, так что наш Exchange к тому моменту пару месяцев простаивал.
В заключение
Вкладка «ЦП» в Мониторе ресурсов предоставляет массу полезной информации о ключевых показателях производительности центрального процессора.
Обсуждение завершено Выявление процессов, поглощающих ресурсы жесткого диска
Время использования жесткого диска и очередь процессов
По мнению большинства ИТ-специалистов, главная причина замедления быстродействия системы — повреждение жесткого диска или нехватка свободного пространства на нем. Однако время использования жесткого диска является не менее важным показателем. Под этим понимается время работы винчестера в процентном отношении к времени работы системы. Если жесткий диск используется, скажем, 80 % времени, производительность системы резко сокращается.
Другой фактор, который также следует учитывать, — это среднестатистическая длина очереди процессов, ожидающих возможности обратиться к жесткому диску. Этот показатель в сочетании с предыдущим не только свидетельствует о том, насколько интенсивно используется винчестер, но и сигнализирует о потенциальных проблемах.
К примеру, если диск используется 40 % времени, а коэффициент средней длины очереди составляет 2 или меньше, значит, винчестер справляется с возложенными на него задачами. Но если и время использования, и длина очереди очень высоки (80 % и 2 или более), значит, процессам приходится долго ждать возможности воспользоваться жестким диском, а это неизбежно приводит к ощутимому снижению быстродействия.
Оценка производительности жесткого диска
Чтобы оценить состояние жесткого диска, необходимо вычислить время его использования и среднюю длину очереди.
Для начала стоит осуществить дефрагментацию всех разделов диска, чтобы обеспечить непрерывность файлов и ускорить процессы чтения и записи. Утилиту «Дефрагментация диска» (Disk Defragmenter) можно запустить из меню «Пуск | Все программы | Стандартные | Служебные» (Start | All Programs | Accessories | System Tools).
После дефрагментации запустите Монитор производительности (Performance Monitor) из раздела «Администрирование» в Панели управления (Control Panel | Administrative Tools).
Совет: когда откроется окно Монитора производительности, выделите все ранее запущенные счетчики и нажмите [Delete]. Каждый запущенный счетчик влияет на быстродействие системы, пусть даже незначительно, поэтому для получения максимально точного результата большинство счетчиков следует отключить.
В окне Монитора производительности проделайте следующие действия:
1. Нажмите значок «Плюс». Откроется диалоговое окно «Создание счетчика» (Add Counters).
2. Выберите опцию «PhysicalDisk» из выпадающего списка «Объект быстродействия» (Performance Object). Откроется список счетчиков производительности физического диска.
3. Выберите счетчик «%Disk Time» и нажмите кнопку «Все экземпляры» (All Instances), чтобы измерить производительность всех жестких дисков.
4. Нажмите кнопку «Создать» (Add), чтобы добавить счетчик в Монитор производительности.
5. Выберите счетчик «Avg. Disk Queue Length», нажмите кнопку «Все экземпляры», кнопку «Создать», а затем закройте окно.
После этого Монитор производительности начнет анализ использования диска (рис. A).
Рисунок A. Цифры под графиком указывают на время использования Диска 0 в процентах.
Линии графика соответствуют выбранным счетчикам. К примеру, на рис. A преобладает розовая линия, соответствующая средней длине очереди для разделов «C:» и «D:» Диска 0. Чтобы получить конкретные показатели, нужно просто выделить соответствующий счетчик. Всегда лучше ориентироваться на цифры, а не на график — он может оказаться обманчивым, особенно если шкала выбрана неправильно.
Сужаем круг поиска
Теперь давайте попытаемся выяснить, какой процесс поглощает ресурсы жесткого диска. Одновременно нажмите [Ctrl]+[Alt]+[Delete], чтобы вызвать диалоговое окно «Безопасность Windows» (Windows Security), и выберите опцию «Диспетчер задач» (Task Manager). Диспетчер задач показывает, сколько ресурсов оттягивает на себя каждый запущенный процесс.
По умолчанию сведения об использовании жесткого диска в Диспетчере задач не представлены, но его можно настроить соответствующим образом. Для этого откройте вкладку «Процессы» (Processes), чтобы увидеть список запущенных процессов. Затем выберите опцию «Настроить поля» (Select Columns) в меню «Вид» (View). Откроется список ресурсов, за использованием которых можно наблюдать с помощью Диспетчера задач.
Я бы посоветовал снять флажки со всех полей, кроме «Ввод/Вывод — Чтение (байт)» (I/O Read Bytes) и «Ввод/Вывод — Запись (байт)» (I/O Write Bytes). Нажмите «OK». Теперь Диспетчер задач будет показывать, какой объем данных в байтах прочитывает и записывает каждый процесс (рис. B).
Внимание нужно обращать на процессы, показатели чтения и записи для которых очень быстро меняются. Периодически показатели изменяются для каждого процесса, но если изменения наблюдаются постоянно, значит, именно этот процесс поглощает ресурсы жесткого диска.
Рисунок B. Чтобы «убить» процесс, поглощающий системные ресурсы, выделите его и нажмите кнопку «Завершить процесс» (End Process).
Если проблемный процесс принадлежит операционной системе Windows, скорее всего, чрезмерное использование ресурсов жесткого диска связано с пробуксовкой.
Подкачка и пробуксовка
Подкачкой называется процесс перемещения блоков памяти между физической и виртуальной памятью. Это не самое удачное решение проблемы нехватки памяти, но в среде Windows оно широко практикуется и ничего ненормального в этом нет. Если коротко, всякий раз, когда системе необходимо прочитать данные из виртуальной памяти, соответствующий блок перемещается в физическую память системы. Если это происходит слишком часто и в больших объемах, возникает эффект пробуксовки.
Если ресурсы жесткого диска поглощает процесс, не принадлежащий операционной системе, скорее всего, это связано с функционированием отдельной службы.
Будьте осторожны: при завершении процесса, поглощающего ресурсы жесткого диска, это сказывается на показателях времени процессора и памяти.
Обычный круг подозреваемых
Теперь вы знаете, как высокие показатели времени использования диска связаны со снижением быстродействия и как можно вычислить процесс, поглощающий системные ресурсы. Данные Монитора производительности позволяют выяснить, связано ли снижение производительности с состоянием жесткого диска, а Диспетчер задач помогает найти виновника.
Длина очереди диска в мониторе ресурсов
Имеем Windows Server 2003 R2 как файловый сервер на HP Proliant DL380 G4, подключенный к СХД HP MSA2000 по SAS.
На СХД создан массив RAID-5 из 5 HDD SATA.
Есть проблема: пользователи жалуются на на периодические непродолжительное «подтупливание» при работе с сетевым ресурсом (расшаренными папками).
В связи с этим, есть подозрение на узкое место в дисковой подсистеме. Подскажите, какие счетчики производительности можно использовать для мониторинга? Какие пределы при этом показывают нормальный результат?
- Помечено в качестве ответа rublin 13 сентября 2012 г. 12:22
- Помечено в качестве ответа rublin 13 сентября 2012 г. 12:22
Все ответы
по идее файлсервер дает достаточно невысокую нагрузку, но все зависит от объема данных количества пользователей и их активности
Счетчик — «средняя длина очереди диска» объекта физический диск.
В норме его значение не должно превышать количества процессоров (или ядер — для многоядерных процессоров)
Счетчик — «средняя длина очереди диска» объекта физический диск.
В норме его значение не должно превышать количества процессоров (или ядер — для многоядерных процессоров)
Добавил счетчик. Результат — 80-400. На сколько я понял, результат должен не превышать 1,5-2 количества дисков. По отношению процессоров не встречал зависимостей. На всякий случай, процессор один двухъядерный.
Да, очередь равная единице это плохой показатель, говорящий о длине обращений очереди диска. Вопрос — на отрытие офисных файлов жалуются из сетевого ресурса?
Да, очередь равная единице это плохой показатель, говорящий о длине обращений очереди диска. Вопрос — на отрытие офисных файлов жалуются из сетевого ресурса?
счётчик очереди в вашем случае пока ещё ни о чём напрямую не говорит. добавьте время доступа к логическим дискам — на чтение и на запись раздельно. только по ним можно судить напрямую о тормозах, а уже после этого принимать в расчёт очередь.
В моем случае средняя очередь находится в районе 160.
При этом, количество дисков равно 5. Таким образом, очередь до 1000 можно считать нормальной? Я правильно понимаю?
На данный момент жалоб нет. Жалобы были неделю-две назад:
- тормоза при переходе по папкам
- тормоза при при открытии файлов (в том числе и офисных)
- тормоза при сохранении файлов
После этого несколько раз перезагружали сервер и отключали VSS на диске.
Сейчас же задача настроить счетчики, чтобы при повторении проблем можно было узнать причины.
В моем случае средняя очередь находится в районе 160.
Сейчас же задача настроить счетчики, чтобы при повторении проблем можно было узнать причины.
Так, стоп. По дискам. Начинаем сначала. Если у вас RAID не программный средствами ОС — не смотрите в Physical disks, там точно те же данные что и в Logical, но в последнем сгруппированы они удобнее.
По каждому из логических дисков ставьте сбор трёх показателей: это Avg. Disk sec/Read, Avg. Disk sec/Write и Avg. Disk Queue Length (можете взять не средние, а текущие — или всё вместе, ибо объём данных невелик). Интервал — не чаще раза в минуту, если ставите сбор на несколько дней — лучше раз в 5 минут, не чаще. и потом будем смотреть уже ваш .blg-файл, полученный на выходе — когда поймаете проблему.
Использование монитора производительности для определения узких мест аппаратных средств, на которых запущен SQL Server
Список контрольных вопросов аудита производительности
Введите ваши результаты в таблицу, приведенную выше.
Использование монитора производительности (Performance Monutor) для идентификации узких места аппаратных средств SQL Server
Лучше всего начать аудит производительности SQL Server с монитора производительности (System Monitor). Мониторинг нескольких основных счетчиков за период 24 часов позволит вам получить довольно хорошее представление о любых главных аппаратных проблемах, которые сказываются на производительности SQL Server.
В идеале Вы должны использовать монитор производительности для создания файла регистрации (журнала) показаний ключевых счетчиков сроком на 24 часа. Вам предстоит выбрать «типичный» 24-часовой период для создания файла регистрации. Например, выберите типичный рабочий день, не конец недели или праздник.
Как только Вы зафиксировали данные монитора производительности за 24 часа в файле регистрации, отобразите рекомендованные счетчики в режиме Graph монитора производительности, и затем запишите среднее, минимальное и максимальное значения в вышеприведенную таблицу. Как только Вы сделали это, сравните ваши результаты с результатами приведенного ниже анализа. Это сравнение даст вам возможность определить любые потенциальные узкие места аппаратных средств, которые влияют на ваш SQL Server.
Как интерпретировать ключевые счетчики монитора производительности
Ниже обсуждаются некоторые основные счетчики монитора производительности, их рекомендованные значения и некоторые опции, которые должны помочь идентифицировать и разрешить аппаратные проблемы. Следует отметить, что я ограничил число рассматриваемых счетчиков монитора производительности. Сделано это потому, что целью данной статьи является обнаружение простых и очевидных проблем потери производительности. Обсуждение многих других счетчиков монитора производительности можно найти в другом месте на этом вебсайте.
Память: Страницы/секунды
Этот счетчик измеряет число страниц в секунду, которые сбрасываются из оперативной памяти на диск, или считываются в оперативную память с диска. Чем более интенсивно происходит обмен страницами, тем большую нагрузку на операциях ввода/вывода испытывает ваш сервер, что, в свою очередь, может отрицательно сказаться на производительности SQL Server. Ваша цель заключается в том, чтобы постараться свести обмен страницами к минимуму, не устраняя его.
В предположении, что SQL Server является единственным главным приложением, выполняющимся на вашем сервере, это число должно в идеале находиться в интервале между нулем и 20. Весьма вероятно, что Вы будете наблюдать выбросы, значительно превышающие 20, что вполне нормалью. Основным здесь является поддержание среднего значения обмена страницами в секунду менее 20.
Если ваш сервер показывает в среднем больше чем 20 страниц в секунду, одной из наиболее вероятных причин этого является нехватка необходимой оперативной памяти. Вообще говоря, чем больше оперативной памяти имеется, тем меньше должно выполняться операций по обмену страницами.
В большинстве случаев, на физическом сервере, специализированном под SQL Server, с адекватным количеством оперативной памяти, среднее значение обмена страницами будет меньше чем 20. Адекватное количество оперативной памяти для SQL Server можно определить по следующему критерию: сервер должен иметь коэффициент удачного обращения в кэш буфера (Buffer Hit Cache Ratio) 99 % и выше. Данный счетчик описан ниже в этой статье. Если Вы имеете SQL Server, у которого этот коэффициент имеет значение 99 % или выше в течение 24 часов, но Вы получаете среднее значение обмена страницами более 20 в течение того же самого периода времени, это может указывать на то, что у Вас выполняются и другие приложения на физическом сервере помимо SQL Server. Если дело обстоит именно так, Вы должны в идеальном случае удалить эти приложения, позволив SQL Server быть единственным главным приложением на физическом сервере.
Если ваш Сервер SQL не выполняет никакие другие приложения, и обмен страницами превышает 20 в среднем в течение 24 часов, это может означать, что Вы изменили параметры настройки памяти SQL Server. SQL Server должен быть конфигурирован так, чтобы была установлена опция «Dynamically configure SQL Server memory» (Динамически конфигурировать память SQL Server), а установка «Maximum Memory» должна находиться в наибольшем значении. Для оптимальной работы, SQL Server нужно позволить взять столько оперативной памяти, сколько ему требуется для собственных нужд, не испытывая необходимости конкурировать за оперативную память с другими приложениями.
Память: Доступное пространство
Другой способ выяснить, имеет ли ваш SQL Server достаточно физической оперативной памяти, состоит в том, чтобы проверить счетчик Memory Object: Available Bytes. Его значение должно быть более 5 МБ. В противном случае, ваш Сервер SQL нуждается в большем количестве физической оперативной памяти. На сервере, специализированном под SQL Server, последний пытается удерживать от 4-10MB свободной физической памяти. Оставшаяся физическая оперативная память используется операционной системой и SQL Server. Когда объем доступной памяти близко к 5 МБ или ниже, наиболее вероятно, что SQL Server испытывает перегрузку из-за нехватки памяти. Если это имеет место, Вы должны увеличить количество физической оперативной памяти в сервере, уменьшить нагрузку на сервер или изменить параметры настройки конфигурации памяти вашего SQL Server соответственно.
Физический диск: Время работы диска %
Этот счетчик показывает, насколько занят физический дисковый массив (не логический раздел или отдельный диск в массиве). Он обеспечивает хорошую относительную меру того, насколько заняты ваши дисковые массивы.
Как эмпирическое правило, счетчик времени диска должен показывать менее 55 %. Если показания счетчика превышают 55 % в течение непрерывных периодов (свыше 10 минут в течение ваших 24 часов мониторинга), то ваш SQL Server может испытывать проблемы с операциями ввода/вывода. Если Вы наблюдаете это поведение лишь изредка в течение ваших 24 часов мониторинга, я бы не волновался слишком сильно, но если бы это случалось часто (скажем, несколько раз час), то я начал бы искать способы увеличить производительность операций ввода/вывода на сервере или уменьшить загрузку сервера. Некоторые способы увеличивать дисковый ввод/вывод состоят в добавлении новых дисков в массив (если это возможно), замены дисков на более быстрые, добавлении кэш-памяти на плате контроллера (если это возможно), использования различных версий RAID или установки более быстрого контроллера.
Перед использованием этого счетчика под NT 4.0, нужно вручную включить его, введя в Command Prompt следующее: «diskperf-y». После этого нужно будет перезагрузить ваш сервер. Таким образом, требуется сразу включать дисковые счетчики под Windows NT 4.0. Если Вы работаете под Windows 2000, этот счетчик включен по умолчанию.
Физический диск: Средняя длина очереди диска
Помимо наблюдения за значением счетчика «Физический Диск: Время работы диска», желательно также отслеживать значения счетчика средней длины очереди диска (Avg. Disk Queue Length). Если это значение превышает значение 2 для непрерывных периодов (свыше 10 минут в течение вашего 24 часового мониторинга) для каждого дисковода в массиве, то этот массив может оказаться узким местом производительности системы. Подобно счетчику времени работы диска, если это происходит изредка в течение 24 часов периода мониторинга, я не сильно бы волновался, но если это происходит часто, тогда я бы начал искать способы увеличить производительность системы ввода/вывода сервера, как это описано выше.
Вам придется вычислить этот показатель, поскольку Performance Monitor не знает, сколько физических дисков находится в вашем массиве. Например, если у вас имеется массив из 6 физических дисков, и средняя длина очереди равна 10 для этого массива, тогда фактическое среднее значение дисковой очереди для каждого диска составляет 1.66 (10/6=1.66), что хорошо укладывается в рекомендованный показатель 2 на один физический диск.
Перед использованием этого счетчика под NT 4.0, не забудьте вручную включить его, набрав на приглашение к вводу команд NT (Command Prompt) следующее: «diskperf-y» с последующей перезагрузка вашего сервера. Поэтому требуется включать дисковые счетчики сразу после установки Windows NT 4.0. Если Вы используете Windows 2000, то этот счетчик будет включен по умолчанию.
Используйте оба описанных выше счетчика, чтобы точно выяснить, испытывает ли ваш сервер проблемы с системой ввода/вывода. Например, если Вы видите много периодов времени, в течение которых время работы диска более 55 %, и когда среднее значение длины очереди диска составляет более 2 на один физический диск, Вы можете быть уверенными, что сервер имеет проблемы с системой ввода — вывода.
Процессор: Процессорное время %
Счетчик Processor Object: % Processor Time имеется для каждого центрального процессора и оценивает использование каждого отдельного центрального процессора. Аналогичный счетчик имеется также для всей совокупности центральных процессоров (общее количество). Это ключевой счетчик для слежения за использованием центрального процессора. Если общее время загрузки процессоров по этому счетчику превышает 80 % в течение непрерывных периодов (свыше 10 минут в течение 24 часового периода мониторинга), то Вы можете считать центральный процессор узким местом системы. Если эти периоды сильной загрузки происходят изредка, и Вы полагаете, что можете смириться с этим, то все в порядке. Но если они возникают часто, Вам следует рассмотреть такие варианты снижения загрузки сервера, как приобретение более быстрых центральных процессоров, установку большего количества центральных процессоров, или приобретение центральных процессоров, которые имеют больший встроенный кэш второго уровня (L2).
Система: Длина очереди процессора
Наряду со счетчиком процессорного времени, Вам следует также контролировать счетчик длины очереди процессора (Processor Queue Length). Если этот показатель превышает значение 2 на один центральный процессор в течение непрерывных периодов (свыше 10 минут в течение вашего 24 часового периода мониторинга), то вероятно это является узким звеном системы. Например, если на Вашем сервере имеется 4 центральных процессора, длина очереди процессора не должна превышать в общей сложности значение 8.
Если длина очереди процессора регулярно превышает рекомендованный максимум, но использование центрального процессора не настолько высоко (что является типичным случаем), то рассмотрите вариант уменьшения значения конфигурационного параметра SQL Server «max worker threads» (максимального числа нитей). Возможной причиной высокого значения длины очереди процессора является наличие избыточного числа рабочих нитей, дожидающихся своей очереди. Уменьшая их число, что Вы и делаете с помощью этого параметра, вынуждает задействовать пулинг нитей (если это еще не имеет место), или повысить его роль.
Используйте оба описанных счетчика совместно, чтобы точно определить, есть ли проблемы с центральным процессором. Если оба индикатора превышают рекомендованные значения в течение одних и тех же непрерывных периодов времени, Вы можете быть уверены, что центральный процессор является слабым местом системы.
Буфер SQL Server: Коэффициент удачного обращения в кэш буфера
Этот счетчик (SQL Server Buffer: Buffer Cache Hit Ratio) показывает, как часто SQL Server обращается к буферу, а не к жесткому диску, чтобы получить данные. В приложениях OLTP, этот коэффициент должен превышать 90 %, а в идеале быть выше 99 %. Если ваш коэффициент удачного обращения в буферный кэш ниже 90 %, Вам следует пойти и купить больше оперативной памяти уже сегодня. Если этот коэффициент лежит в диапазоне между 90 % и 99 %, то Вы должны серьезно рассмотреть вариант покупки дополнительной оперативной памяти, так как чем ближе Вы приближаетесь к 99 %, тем быстрее ваш SQL Server будет работать. В некоторых случаях, если ваша база данных является очень большой, Вам не удастся приблизиться к 99 %, даже если Вы поставите максимально допустимое количество оперативной памяти на вашем сервере. Тогда все, что Вы можете сделать, — это добавить память по максимуму и смириться с существующим положением вещей.
В приложениях OLAP, коэффициент может быть намного меньше из-за природы работы этого OLAP-приложения. В любом случае, увеличение оперативной памяти должно ускорить работу SQL Server.
SQL Server: Пользовательские подключения
Поскольку число пользователей Сервер SQL, влияет на его производительность, рекомендуется следить за счетчиком пользовательских подключений (SQL Server General Statistics Object: User Connections counter). Он показывает число пользовательских подключений, а не число пользователей, которые подключены к SQL Server в данный момент времени.
Если показания этого счетчика превышают 255, то Вам следует увеличить значение конфигурационного параметра «Maximum Worker Threads» (максимальное число рабочих нитей), значение по умолчанию которого равно 255. Если число подключений превышает имеющееся число рабочих нитей, то SQL Server начнет совместно использовать рабочие нити, что может отрицательно сказаться на производительности. Установка этого параметра должна быть выше, чем максимальное число подключений, которое может быть достигнуто на вашем сервере.
Что дальше
Хотя имеется значительно большее число счетчиков, чем те, которые мы рассмотрели, последние являются ключевыми для мониторинга, который выполняется в процессе аудита производительности. После завершения анализа монитора производительности, используйте приведенные рекомендации и далее в этой серии статей, чтобы внести необходимые изменения, которые заставят ваш SQL Server работать так, как он должен.
Почему тормозит Windows — решаем проблемы зависания без переустановки ОС
В данной статье мы расскажем, почему тормозит Windows и опишем популярные системы мониторинга, которые помогут выявить проблему. Данная информация будет полезна не только администраторам серверов на Windows, но и простым пользователям, которые работают с этой системой на своих ПК. Также материал будет полезен всем, кто использует виртуальный сервер на Windows и хочет добиться большей производительности.
Производительность сервера зависит от многих факторов. Условно все источники проблем можно разделить на несколько основных групп, а именно — процессор, оперативная память, жесткий диск, сеть и программное обеспечение. Если причина сбоев не очевидна, то в первую очередь нужно проверить состояние перечисленных компонентов. Для начала рассмотрим штатные инструменты для анализа производительности системы на примере Windows Server 2012 R2.
1. Диспетчер задач
Диспетчер задач позволяет выполнять различные операции с процессами, например назначать приоритет, “привязывать” процессы к определенному процессору, создавать новые процессы, но наиболее частое применение — быстрый просмотр текущей загруженности системы и принудительное завершение “проблемных” приложений.
Способы запуска Диспетчера задач:
- щелкнуть правой кнопкой мыши на панели задач и выбрать в меню “Диспетчер задач”
- ввести команду “taskmgr” в окне “Выполнить” или командной строке.
- нажать комбинацию клавиш “Ctrl+Alt+Del” и выбрать “Диспетчер задач”
- нажать комбинацию клавиш “Ctrl+Shift+Esc”
Диспетчер задач отображает в реальном времени для каждого работающего процесса объем потребляемой оперативной памяти и нагрузку на процессор. Наиболее полная информация представлена на вкладке “Подробности”. Если щелкнуть мышью по заголовку любого столбца, строки будут отсортированы по его значениям. Для принудительного завершения процесса нужно щелкнуть правой кнопкой мыши по соответствующей строке и выбрать “Снять задачу”. Кроме этого в контекстном меню доступны дополнительные действия.
Если на сервере работает одновременно несколько пользователей, будет полезна вкладка “Пользователи” на которой все процессы сгруппированы по пользователям. Щелчок правой кнопкой мыши по имени пользователя вызывает контекстное меню с доступными действиями. Администратор может отправить сообщение, отключить или полностью завершить сеанс выбранного пользователя.
Вкладка “Службы” отображает состояние служб, а через контекстное меню можно выполнить остановку, запуск или перезапуск службы. На вкладке “Процессы” выполнена группировка процессов по типу, а на вкладке “Производительность” текущая активность компонентов компьютера представлена в графическом виде.
Диспетчер задач предоставляет пользователю минимальный объем информации о загруженности системы, с помощью которого можно выполнить первоначальную диагностику.
2. Монитор ресурсов
Монитор ресурсов содержит более детальную информацию. Кроме загрузки процессора и оперативной памяти, для каждого процесса в реальном времени отображаются операции чтения и записи на диск, открытые файлы, связанные службы и библиотеки, сетевая активность.
Как запустить мониторинг ресурсов? Есть несколько способов:
- нажать кнопку “Открыть монитор ресурсов”, расположенную на вкладке “Производительность” диспетчера задач;
- ввести команду “resmon” в командной строке или окне “Выполнить”;
- выбрать “Монитор ресурсов” в меню “Средства” диспетчера серверов.
На каждой вкладке монитора ресурсов информация представлена в табличном и графическом виде. Для того, чтобы в таблицах изменить набор столбцов, нужно щелкнуть по заголовку любого столбца правой кнопкой мыши и нажать “Выбрать столбцы”. Если на любой из вкладок пометить нужные процессы флажком, информация в других таблицах будет автоматически отфильтрована по выбранным значениям.
Сведения об активности процессора, памяти, дисков и сети представле
Выявление процессов, поглощающих ресурсы жесткого диска
Время использования жесткого диска и очередь процессовПо мнению большинства ИТ-специалистов, главная причина замедления быстродействия системы — повреждение жесткого диска или нехватка свободного пространства на нем. Однако время использования жесткого диска является не менее важным показателем. Под этим понимается время работы винчестера в процентном отношении к времени работы системы. Если жесткий диск используется, скажем, 80 % времени, производительность системы резко сокращается.
Другой фактор, который также следует учитывать, — это среднестатистическая длина очереди процессов, ожидающих возможности обратиться к жесткому диску. Этот показатель в сочетании с предыдущим не только свидетельствует о том, насколько интенсивно используется винчестер, но и сигнализирует о потенциальных проблемах.
К примеру, если диск используется 40 % времени, а коэффициент средней длины очереди составляет 2 или меньше, значит, винчестер справляется с возложенными на него задачами. Но если и время использования, и длина очереди очень высоки (80 % и 2 или более), значит, процессам приходится долго ждать возможности воспользоваться жестким диском, а это неизбежно приводит к ощутимому снижению быстродействия.
Оценка производительности жесткого диска
Чтобы оценить состояние жесткого диска, необходимо вычислить время его использования и среднюю длину очереди.
Для начала стоит осуществить дефрагментацию всех разделов диска, чтобы обеспечить непрерывность файлов и ускорить процессы чтения и записи. Утилиту «Дефрагментация диска» (Disk Defragmenter) можно запустить из меню «Пуск | Все программы | Стандартные | Служебные» (Start | All Programs | Accessories | System Tools).
После дефрагментации запустите Монитор производительности (Performance Monitor) из раздела «Администрирование» в Панели управления (Control Panel | Administrative Tools).
Совет: когда откроется окно Монитора производительности, выделите все ранее запущенные счетчики и нажмите [Delete]. Каждый запущенный счетчик влияет на быстродействие системы, пусть даже незначительно, поэтому для получения максимально точного результата большинство счетчиков следует отключить.
В окне Монитора производительности проделайте следующие действия:
1. Нажмите значок «Плюс». Откроется диалоговое окно «Создание счетчика» (Add Counters).
2. Выберите опцию «PhysicalDisk» из выпадающего списка «Объект быстродействия» (Performance Object). Откроется список счетчиков производительности физического диска.
3. Выберите счетчик «%Disk Time» и нажмите кнопку «Все экземпляры» (All Instances), чтобы измерить производительность всех жестких дисков.
4. Нажмите кнопку «Создать» (Add), чтобы добавить счетчик в Монитор производительности.
5. Выберите счетчик «Avg. Disk Queue Length», нажмите кнопку «Все экземпляры», кнопку «Создать», а затем закройте окно.
После этого Монитор производительности начнет анализ использования диска (рис. A).
Рисунок A. Цифры под графиком указывают на время использования Диска 0 в процентах.
Линии графика соответствуют выбранным счетчикам. К примеру, на рис. A преобладает розовая линия, соответствующая средней длине очереди для разделов «C:» и «D:» Диска 0. Чтобы получить конкретные показатели, нужно просто выделить соответствующий счетчик. Всегда лучше ориентироваться на цифры, а не на график — он может оказаться обманчивым, особенно если шкала выбрана неправильно.
Оцените статью: Голосов 8
Использование Монитора ресурсов (Resource Monitor): центральный процессор
В первой из цикла статей о Использование Монитора ресурсов: дисковая подсистема я рассказывал, как использовать этот инструмент для оценки состояния критически важных серверов под управлением Windows. В этой статье речь пойдет о различных показателях, касающихся центрального процессора. Я расскажу о назначении графиков, представленных в Мониторе ресурсов на вкладке «ЦП» (CPU), и вкратце объясню, как пользоваться полученными сведениями.Для удобства рассмотрения мы будем использовать скриншот Монитора ресурсов (рис. A), запущенного на производственном сервере под управлением Windows Server 2008 R2. На этом сервере установлен Exchange Server 2010 со всеми ролями. Как и все другие наши серверы, этот работает в виртуальной машине на базе VMware vSphere 4.1 и располагает четырьмя виртуальными процессорами. Этот скриншот был сделан в тот период, когда нагрузка на сервер была совсем не высока.
Рисунок A. Монитор ресурсов в Windows Server 2008 R2, вкладка «ЦП» (нажмите на изображении для увеличения).
Начнем с общего обзора консоли. Большую часть окна занимают статистические показатели, о которых я подробно расскажу ниже. Я не буду повторяться: если показатель присутствует в нескольких местах, я упомяну его только в первый раз.
Процессы
В разделе «Процессы» (Processes) перечислены все запущенные процессы, использующие ресурсы центрального процессора. В списке показано имя исполняемого файла и ряд связанных с ним статистических показателей.
• «Образ» (Image) – имя исполняемого файла. Это имя процесса, использующего ресурсы ЦП.
• «ИД процесса» (PID) – идентификатор процесса. Может пригодиться для управления процессами с использованием других утилит или для поиска процессов в Диспетчере задач (Task Manager).
• «Описание» (Description) – короткое описание, объясняющее назначение процесса.
• «Состояние» (Status) – состояние выполнения процесса: чаще всего «Выполняется» (Running), иногда – «Прерван» (Terminated), если процесс больше не выполняется.
• «Потоки» (Threads) – количество активных потоков. Поток – это единица обработки.
• «ЦП» (CPU) – текущий процент загрузки ЦП процессом, другими словами, сколько ресурсов процессора выделено данному процессу.
• «Среднее для ЦП» (Average CPU) – среднее потребление ресурсов ЦП процессом за последние 60 секунд. Этот показатель позволяет оценить состояние системы за последнюю минуту и в данный момент.
Раздел «Процессы» очень полезен для диагностики – он позволяет быстро оценить текущее состояние системы. Еще один вариант применения – нажать на зависшем процессе правой кнопкой мыши и выбрать опцию «Анализ цепочки ожидания» (Analyze Wait Chain, рис. B). По результатам анализа выводится отчет (рис. C).
Рисунок B. Диагностика проблем, связанных с процессом.
Рисунок C. Результаты анализа (нажмите на изображении для увеличения).
Службы
В разделе «Службы» (Services) перечислены все запущенные службы. На рис. A, как можно заметить, перечислены только службы, связанные с двумя выделенными процессами. Это позволяет отследить взаимосвязи процессов и служб, что может пригодиться при диагностике. Кроме того, на любой службе можно нажать правой кнопкой мыши для остановки или перезапуска.
• «Группа» (Group) – группа, к которой принадлежит служба. Некоторые службы работают вместе в группах.
Рисунок D. Управление службами в Мониторе ресурсов.
Связанные дескрипторы
Возникала ли у вас хоть раз потребность выяснить, каким процессом открыт файл? Раздел Монитора ресурсов «Связанные дескрипторы» (Associated Handles) предназначен как раз для этого. Дескрипторы – это указатели, которые ссылаются на файлы, ключи реестра, каталоги и т. д.
В поле «Поиск дескриптора» (Search Handles) введите имя файла или путь – и получите список процессов, его использующих. Это особенно удобно при работе со службами, использующими множество файлов, например, svchost. На рис. E показано, как данная функция помогает проредить массу процессов svchost. В этой таблице можно нажать правой кнопкой мыши на любом файле svchost и завершить данный конкретный процесс.
• «Тип» (Type) – тип дескриптора. О типах дескрипторов подробно рассказывается в статье Марка Руссиновича (Mark Russinovich) на сайте TechNet.
• «Имя дескриптора» (Handle Name) – имя дескриптора, связанного с выбранным процессом. Имя можно использовать для поиска связанных файлов или ключей реестра.
Рисунок E. Список всех процессов (нажмите на изображении для увеличения).
Связанные модули
Модули – это вспомогательные файлы или программы, например, библиотеки DLL, используемые процессами для выполнения своих задач. Информация из раздела «Связанные модули» (Associated modules) может пригодиться для более глубокого анализа потенциальных проблем, связанных со снижением производительности.
• «Имя модуля» (Module name) – имя модуля, загруженного выбранными процессами.
• «Версия» (Version) – версия файла для соответствующего модуля.
• «Полный путь» (Full Path) – полный путь к используемому модулю.
Графики
В правой части окна расположены графики, представляющие различные показатели производительности центрального процессора.
• «ЦП – Всего» (CPU – Total) – отображает два показателя, представленные синими прямыми и зеленой кривой. Синяя прямая показывает общую вычислительную мощность процессора (частоту ЦП), доступную системе, а зеленая кривая – текущее использование этих ресурсов. Монитор ресурсов доступен в разных версиях Windows, и многие современные компьютеры оснащаются процессорами, которые способны снижать собственную частоту для экономии энергии и уменьшения температуры. При таком снижении частоты ЦП синяя прямая опускается, а зеленая кривая корректируется в соответствии с новыми условиями.
• «Использование ЦП службами» (Service CPU usage) – показывает, сколько ресурсов ЦП выделено фоновым службам и процессам.
• «ЦП 0 – ЦП 3» (CPU 0 – CPU 3) – показывает, сколько ресурсов каждого ядра процессора используется. Некоторые ЦП обозначены как припаркованные (Parked) – это значит, что они временно отключены, поскольку для них пока нет работы. Скриншоты для этой статьи были сделаны в нерабочее время на каникулах, так что наш Exchange к тому моменту пару месяцев простаивал.
В заключение
Вкладка «ЦП» в Мониторе ресурсов предоставляет массу полезной информации о ключевых показателях производительности центрального процессора.
Автор: Scott Lowe
Перевод SVET
Оцените статью: Голосов 3
Внедрив в Windows комплексный Монитор ресурсов (Resource Monitor), разработчики Microsoft предоставили администраторам великолепный инструмент, позволяющий быстро получать всю необходимую информацию о состоянии критически важных серверов. В цикле статей о Мониторе ресурсов я расскажу о четырех ключевых аспектах этого средства мониторинга: ЦП, память, диск и сеть. В этой статье речь пойдет о различных показателях, касающихся состояния дисковой подсистемы. Я расскажу о назначении графиков, представленных в Мониторе ресурсов на вкладке «Диск» (Disk), и вкратце объясню, как пользоваться полученными сведениями. |
Для удобства рассмотрения мы будем использовать скриншот Монитора ресурсов (рис. A), запущенного на производственном сервере под управлением Windows Server 2008 R2. На этом сервере установлен Exchange Server 2010 со всеми ролями, поэтому он нуждается в большой дисковой подсистеме с приемлемой производительностью. (Примечание: как и все другие наши серверы, этот работает в виртуальной машине на базе VMware vSphere 4.1.)
Начнем с общего обзора консоли. Большую часть окна занимают статистические показатели, о которых я подробно расскажу ниже. Справа расположены графики, каждый из которых представляет один из важных показателей производительности дисковой подсистемы.
Ниже я подробно рассмотрю каждый показатель. Я не буду повторяться: если показатель присутствует в нескольких местах, я упомяну его только в первый раз.
Процессы с дисковой активностью
В разделе «Процессы с дисковой активностью» (Processes With Disk Activity) перечислены все запущенные процессы, использующие ресурсы хранения. В списке показано имя исполняемого файла и ряд связанных с ним статистических показателей.
• «Образ» (Image) – имя исполняемого файла. Это имя процесса, активно использующего диск.
• «ИД процесса» (PID) – идентификатор процесса. Может пригодиться для управления процессами с использованием других утилит или для поиска процессов в Диспетчере задач (Task Manager).
• «Чтение (байт/с)» (Read (B/sec)) – среднее количество прочитанных процессом байтов в секунду за последнюю минуту.
• «Запись (байт/с)» (Write (B/sec)) – среднее количество записанных процессом байтов в секунду за последнюю минуту.
• «Всего (байт/с)» (Total (B/sec)) – среднее количество использованных байтов в секунду за последнюю минуту.
Информация, которая приводится в этом разделе, не особенно актуальна для диагностики – она лишь позволяет выяснить, какие процессы потребляют больше всего ресурсов диска. На рис. A, например, можно заметить, что больше всего операций чтения с диска выполняет процесс с именем «DPMRA.exe».
Работа диска
В разделе «Работа диска» (Disk Activity) собраны более полезные для диагностики сведения. Самый ценный показатель – пожалуй, время ответа, поскольку его можно оценить, даже не зная исходной конфигурации дисковой подсистемы.
Справа от названия раздела расположены два небольших индикатора. Зеленый показывает текущий дисковый ввод/вывод (Disk I/O), то есть, количество передаваемых в данный момент данных), а синий – максимум активного времени дисковой подсистемы (Highest Active Time).
• «Файл» (File) – имя файла, используемого процессом. Здесь указывается полный путь к файлу, чтобы его легче было найти.
• «Приоритет ввода/вывода» (I/O Priority) – приоритет операций ввода/вывода.
• «Время ответа (мс)» (Response Time (ms)) – время отклика диска в миллисекундах. Как правило, чем ниже этот показатель, тем лучше. В целом, время ответа менее 10 мс свидетельствует о хорошей производительности. Не страшно, если этот показатель время от времени превышает отметку в 10 мс, но если системе постоянно приходится дожидаться ответа дисковой подсистемы более 20 мс, это может свидетельствовать о наличии проблем, а конечные пользователи в таком случае заметят ощутимое снижение быстродействия. Если время ответа достигает 50 мс и выше, значит, проблема действительно серьезная. На рис. A, как видите, время ответа составляет 5-6 мс, так что дисковая подсистема функционирует исправно, если судить по этому показателю.
Запоминающие устройства
В разделе «Запоминающие устройства» (Storage) содержатся следующие сведения:
• «Логический диск» (Logical Disk) – буква диска.
• «Физический диск» (Physical disk) – выбранный для мониторинга физический диск.
• «Активное время (%)» (Active Time (%)) – сколько времени диск проводит, активно обслуживая запросы, в противовес времени простоя. Если активность диска постоянно очень высока (скажем, более 80%), это может указывать на наличие потенциальных проблем, связанных с ресурсами хранения. Если пользователи жалуются на низкое быстродействие, а активное время постоянно составляет 100%, возможно, необходимо увеличить объем дисковой подсистемы или установить более производительные накопители.
• «Свободно (МБ)» (Available Space (MB)) – количество свободного пространства в текущем томе диска.
• «Всего (МБ)» (Total Space (MB)) – общий объем тома.
• «Длина очереди диска» (Disk Queue Length) – средняя длина очереди диска. Длина очереди показывает количество ожидающих выполнения запросов (на чтение и запись) в любой момент времени. Если этот показатель довольно высок, это может свидетельствовать о том, что скорость вращения диска недостаточна для удовлетворения запросов приложений или что дисковая подсистема имеет слишком низкую производительность и не справляется с запросами. Однако чтобы оценить, насколько высок показатель, необходимо хорошо понимать, как создается базовый том в SAN. Каждый диск, из которых складывается базовый том, предоставляет дополнительные ресурсы, которые учитываются при расчете длины очереди (проще говоря, чем больше дисков, тем выше будет длина очереди).
Уровень RAID и размер страйпа тоже влияют на длину очереди, что дополнительно усложняет задачу. Однако если компьютер оснащен всего одним диском, а длина очереди постоянно превышает 2, система нуждается в дополнительных ресурсах хранения. Длина очереди более 5 свидетельствует о наличии серьезных проблем. Если вам известно, из скольких дисков состоит базовый том, умножьте количество дисков на 2, чтобы очень грубо, приблизительно, прикинуть максимально допустимую длину очереди. К примеру, если в системе десять дисков, а длина очереди равна 18, значит, все в порядке.
Графики
Графики – очень полезный инструмент. В верхнем графике показана скорость обмена данными между диском и операционной системой за последнюю минуту. Зеленая кривая показывает текущий суммарный ввод/вывод, а синяя – активное время диска за этот период. На остальных графиках показана длина очереди для каждого диска в системе.
На сервере Exchange, который показан в моем примере, используется четыре диска (тома SAN). С учетом структуры базовых томов SAN в этом массиве, никаких проблем, связанных с длиной очереди, не возникает.
Использование Монитора ресурсов (Resource Monitor): центральный процессор
Для удобства рассмотрения мы будем использовать скриншот Монитора ресурсов (рис. A), запущенного на производственном сервере под управлением Windows Server 2008 R2. На этом сервере установлен Exchange Server 2010 со всеми ролями. Как и все другие наши серверы, этот работает в виртуальной машине на базе VMware vSphere 4.1 и располагает четырьмя виртуальными процессорами. Этот скриншот был сделан в тот период, когда нагрузка на сервер была совсем не высока.
Начнем с общего обзора консоли. Большую часть окна занимают статистические показатели, о которых я подробно расскажу ниже. Я не буду повторяться: если показатель присутствует в нескольких местах, я упомяну его только в первый раз.
Процессы
В разделе «Процессы» (Processes) перечислены все запущенные процессы, использующие ресурсы центрального процессора. В списке показано имя исполняемого файла и ряд связанных с ним статистических показателей.
• «Образ» (Image) – имя исполняемого файла. Это имя процесса, использующего ресурсы ЦП.
• «ИД процесса» (PID) – идентификатор процесса. Может пригодиться для управления процессами с использованием других утилит или для поиска процессов в Диспетчере задач (Task Manager).
• «Описание» (Description) – короткое описание, объясняющее назначение процесса.
• «Состояние» (Status) – состояние выполнения процесса: чаще всего «Выполняется» (Running), иногда – «Прерван» (Terminated), если процесс больше не выполняется.
• «Потоки» (Threads) – количество активных потоков. Поток – это единица обработки.
• «ЦП» (CPU) – текущий процент загрузки ЦП процессом, другими словами, сколько ресурсов процессора выделено данному процессу.
• «Среднее для ЦП» (Average CPU) – среднее потребление ресурсов ЦП процессом за последние 60 секунд. Этот показатель позволяет оценить состояние системы за последнюю минуту и в данный момент.
Раздел «Процессы» очень полезен для диагностики – он позволяет быстро оценить текущее состояние системы. Еще один вариант применения – нажать на зависшем процессе правой кнопкой мыши и выбрать опцию «Анализ цепочки ожидания» (Analyze Wait Chain, рис. B). По результатам анализа выводится отчет (рис. C).
Службы
В разделе «Службы» (Services) перечислены все запущенные службы. На рис. A, как можно заметить, перечислены только службы, связанные с двумя выделенными процессами. Это позволяет отследить взаимосвязи процессов и служб, что может пригодиться при диагностике. Кроме того, на любой службе можно нажать правой кнопкой мыши для остановки или перезапуска.
• «Группа» (Group) – группа, к которой принадлежит служба. Некоторые службы работают вместе в группах.
Связанные дескрипторы
Возникала ли у вас хоть раз потребность выяснить, каким процессом открыт файл? Раздел Монитора ресурсов «Связанные дескрипторы» (Associated Handles) предназначен как раз для этого. Дескрипторы – это указатели, которые ссылаются на файлы, ключи реестра, каталоги и т. д.
В поле «Поиск дескриптора» (Search Handles) введите имя файла или путь – и получите список процессов, его использующих. Это особенно удобно при работе со службами, использующими множество файлов, например, svchost. На рис. E показано, как данная функция помогает проредить массу процессов svchost. В этой таблице можно нажать правой кнопкой мыши на любом файле svchost и завершить данный конкретный процесс.
• «Тип» (Type) – тип дескриптора. О типах дескрипторов подробно рассказывается в статье Марка Руссиновича (Mark Russinovich) на сайте TechNet.
• «Имя дескриптора» (Handle Name) – имя дескриптора, связанного с выбранным процессом. Имя можно использовать для поиска связанных файлов или ключей реестра.
Связанные модули
Модули – это вспомогательные файлы или программы, например, библиотеки DLL, используемые процессами для выполнения своих задач. Информация из раздела «Связанные модули» (Associated modules) может пригодиться для более глубокого анализа потенциальных проблем, связанных со снижением производительности.
• «Имя модуля» (Module name) – имя модуля, загруженного выбранными процессами.
• «Версия» (Version) – версия файла для соответствующего модуля.
• «Полный путь» (Full Path) – полный путь к используемому модулю.
Графики
В правой части окна расположены графики, представляющие различные показатели производительности центрального процессора.
• «ЦП – Всего» (CPU – Total) – отображает два показателя, представленные синими прямыми и зеленой кривой. Синяя прямая показывает общую вычислительную мощность процессора (частоту ЦП), доступную системе, а зеленая кривая – текущее использование этих ресурсов. Монитор ресурсов доступен в разных версиях Windows, и многие современные компьютеры оснащаются процессорами, которые способны снижать собственную частоту для экономии энергии и уменьшения температуры. При таком снижении частоты ЦП синяя прямая опускается, а зеленая кривая корректируется в соответствии с новыми условиями.
• «Использование ЦП службами» (Service CPU usage) – показывает, сколько ресурсов ЦП выделено фоновым службам и процессам.
• «ЦП 0 – ЦП 3» (CPU 0 – CPU 3) – показывает, сколько ресурсов каждого ядра процессора используется. Некоторые ЦП обозначены как припаркованные (Parked) – это значит, что они временно отключены, поскольку для них пока нет работы. Скриншоты для этой статьи были сделаны в нерабочее время на каникулах, так что наш Exchange к тому моменту пару месяцев простаивал.
В заключение
Вкладка «ЦП» в Мониторе ресурсов предоставляет массу полезной информации о ключевых показателях производительности центрального процессора.
Post Views: 3
Диск Текущая длина очереди диска
- 2 минуты на чтение
В этой статье
Сводка
На диске было постоянно высокое значение счетчика текущей длины очереди по нескольким последовательным выборкам.В результате задержка запросов ввода-вывода на этом диске, скорее всего, увеличится.
Текущая длина очереди диска — это количество запросов, ожидающих обработки на диске на момент сбора данных о производительности. Это означает, что диск не может обрабатывать запросы ввода-вывода так быстро, как они делаются.
Причины
Либо диск недавно испытал значительное увеличение активности, и этот всплеск привел к превышению порогового значения, либо использование диска неуклонно увеличивалось с течением времени и, наконец, достигло точки превышения порогового значения.
Другая возможность состоит в том, что некоторая часть базовых дисков или дисковой подсистемы неисправна или неправильно настроена, что снижает производительность диска.
Разрешения
Для дальнейшего изучения проблемы рассмотрите следующее:
- Просмотрите журнал системных событий в системе, чтобы узнать, нет ли ошибок, указывающих на проблемы с диском или подсистемой хранения.
- Просмотрите историю текущей длины очереди для этого диска, используя диаграмму показателей мониторинга в Azure Monitor или поиск в журнале Log Analytics.Это поможет определить, возникла ли проблема недавно или активность неуклонно растет в течение более длительного периода времени.
- Просмотрите другие счетчики производительности для диска, такие как байт диска в секунду, чтения с диска и записи на диск в секунду, чтобы понять, какие типы ввода-вывода влияют на общую загрузку диска.
- Просмотрите счетчики Process \ performance, такие как IO Data Operations / sec, чтобы определить, какие процессы вносят наибольший вклад в общий ввод-вывод в системе.После того, как основные процессы определены, счетчики операций чтения / записи операций ввода-вывода / сек и операций записи ввода-вывода / сек помогут в дальнейшем определить тип ввода-вывода, выполняемого процессом.
Основываясь на результатах дальнейшего расследования, решения могут отличаться и могут включать одно из следующих:
- Устраните любые проблемы или неправильные настройки подсистемы хранения.
- Уменьшите количество операций ввода-вывода, выполняемых в системе, или распределите рабочую нагрузку по большему количеству дисков.
- Обновите диски или подсистему хранения, чтобы справиться с возросшей нагрузкой.
- Если повышенная нагрузка допустима, пороговое значение монитора может быть изменено на менее ограничительное. Точно так же можно увеличить количество последовательных выборок, чтобы критерии работоспособности изменяли состояние только тогда, когда использование поддерживается в течение более длительных периодов времени.
Логический диск Длина текущей дисковой очереди
- 2 минуты на чтение
В этой статье
Сводка
На диске было постоянно высокое значение счетчика текущей длины очереди по нескольким последовательным выборкам.В результате задержка запросов ввода-вывода на этом диске, скорее всего, увеличится.
Текущая длина очереди диска — это количество запросов, ожидающих обработки на диске на момент сбора данных о производительности. Это означает, что диск не может обрабатывать запросы ввода-вывода так быстро, как они делаются.
Причины
Либо диск недавно испытал значительное увеличение активности, и этот всплеск привел к превышению порогового значения, либо использование диска неуклонно увеличивалось с течением времени и, наконец, достигло точки превышения порогового значения.
Другая возможность состоит в том, что некоторая часть базовых дисков или дисковой подсистемы неисправна или неправильно настроена, что снижает производительность диска.
Разрешения
Для дальнейшего изучения проблемы рассмотрите следующее:
- Просмотрите журнал системных событий в системе, чтобы узнать, нет ли ошибок, указывающих на проблемы с диском или подсистемой хранения.
- Настройте Azure Monitor или Log Analytics для сбора счетчика производительности — LogicalDisk \ Current Disk Queue Length для этого диска, а затем из диаграммы метрик мониторинга в Azure Monitor или поиска по журналу в Log Analytics, чтобы просмотреть выборочные данные.Это поможет определить, возникла ли проблема недавно или активность неуклонно растет в течение более длительного периода времени.
- Просмотрите другие счетчики производительности для диска, такие как байт диска в секунду, чтения с диска и записи на диск в секунду, чтобы понять, какие типы ввода-вывода влияют на общую загрузку диска.
- Просмотрите счетчики Process \ performance, такие как IO Data Operations / sec, чтобы определить, какие процессы вносят наибольший вклад в общий ввод-вывод в системе.После того, как основные процессы определены, счетчики операций чтения / записи операций ввода-вывода / сек и операций записи ввода-вывода / сек помогут в дальнейшем определить тип ввода-вывода, выполняемого процессом.
Основываясь на результатах дальнейшего расследования, решения могут отличаться и могут включать одно из следующих:
- Устраните любые проблемы или неправильные настройки подсистемы хранения.
- Уменьшите количество операций ввода-вывода, выполняемых в системе, или распределите рабочую нагрузку по большему количеству дисков.
- Обновите диски или подсистему хранения, чтобы справиться с возросшей нагрузкой.
- Если повышенная нагрузка приемлема, пороговое значение критерия работоспособности может быть изменено на менее ограничительное. Точно так же можно увеличить количество последовательных выборок, чтобы критерии работоспособности изменяли состояние только тогда, когда использование поддерживается в течение более длительных периодов времени.
Дополнительные сведения об архитектуре хранилища для виртуальных машин Azure см. В разделе «О дисковом хранилище для виртуальных машин Windows Azure».
.Подробное руководство по монитору ресурсов Windows
Операционная система Windows поставляется с множеством встроенных инструментов для анализа использования ресурсов. Наиболее заметным из них, вероятно, является Диспетчер задач Windows, поскольку он подчеркивает использование ресурсов отдельными процессами и дает администраторам и пользователям возможность уничтожить любые некорректные процессы.
Монитор производительности и Монитор ресурсов — это два дополнительных инструмента, которые администраторы и опытные пользователи Windows могут использовать для анализа проблем, связанных с производительностью или ресурсами на ПК с Windows.
Давайте начнем с того, что посмотрим, что такое монитор ресурсов и чем он отличается от диспетчера задач Windows и монитора производительности.
Что такое монитор ресурсов?
Microsoft добавила Resource Monitor в операционные системы Windows Vista и Windows Server 2008 и сделала его частью любой новой версии Windows, выпущенной с тех пор. Программа отображает информацию об аппаратных и программных ресурсах в режиме реального времени.
Диспетчер задач лучше всего можно описать как средство, работающее на поверхности.В нем перечислены процессы и службы, а также общее использование ресурсов.
Монитор ресурсов, с другой стороны, дает вам возможность заглянуть под поверхность, чтобы найти информацию, которую диспетчер задач не предоставляет.
Монитор ресурсов работает под управлением процесса монитора производительности.
Как запустить монитор ресурсов
.
Мониторинг использования диска — статьи TechNet — США (английский)
ПроизводительностьMicrosoft SQL Server сильно зависит от подсистемы ввода-вывода (IOS). Задержка в IOS может привести к множеству проблем с производительностью. Например, вы можете столкнуться с медленным временем отклика и проблемами, вызванными тайм-аутом задач. Очень важно, чтобы вы контролировать использование вашего диска.
Дисковые счетчики, которые можно отслеживать для определения активности диска, делятся на следующие две группы:
- Первичная
- Физический диск: средн.Диск сек / запись
- Физический диск: средн. Диск сек / чтение
- Вторичный
- Физический диск: средн. Длина очереди диска
- PhysicalDisk: Disk Bytes / sec
- PhysicalDisk: Disk Transfers / sec
Каждый диск следует контролировать индивидуально. Обратите внимание, что использование экземпляра (_Total) может ввести в заблуждение и замаскировать проблемные области. Это связано с тем, что экземпляр (_Total) суммирует и усредняет все диски вместе.
ПРИМЕЧАНИЕ : Если вы используете точки монтирования, мы рекомендуем использовать объект «Логический диск» вместо объекта «Физический диск». Логический диск отображает путь к точке монтирования вместо физического. номер привода.
В системном мониторе значение Avg. Диск сек / запись и Ср. Счетчики Disk sec / Read считаются «первичными». Эти счетчики должны быть проверены в первую очередь и не требуют дополнительной информации для оценки производительности привода. Эти счетчики определяют среднюю задержку запроса ввода-вывода.
Ср. Disk Sec / Read — это среднее время чтения данных с диска в секундах. В следующем списке показаны диапазоны возможных значений и их значения:
- Менее 10 мс — очень хорошо
- От 10 до 20 мс — нормально
- От 20 до 50 мс — медленно, требует внимания
- Более 50 мс — серьезное узкое место ввода / вывода
Ср. Disk Sec / Write — это среднее время записи данных на диск в секундах.Рекомендации по средн. Здесь применяются значения Disk Sec / Read.
ПРИМЕЧАНИЕ : Номера, перечисленные в этом разделе, предназначены для общей справки. Если у вас очень высокие требования к времени отклика приложения в загруженной системе, соответствие времени отклика диска с этими числами может оказаться недостаточным.
Если все или большинство дисков сообщают о высокой задержке, узкое место, вероятно, связано с коммуникационной средой (такой как SAN HBA, коммутаторы, оптоволокно, процессоры адаптеров внешнего интерфейса и кэш).Если только один диск или несколько избранных сообщают о задержке, узкое место обычно быть в JBOD (количество дисков). Для дальнейшего изучения этого просмотрите вторичные счетчики для дисков, сообщающих о высокой задержке. Если все диски ниже своего порогового значения, нет причин проверять вторичные счетчики.
ПРИМЕЧАНИЕ : В системном мониторе важно контролировать, используя максимальное поле. Использование среднего поля в системном мониторе может ввести в заблуждение.
Вы должны использовать только вторичные счетчики для дисков с высокой задержкой.Если у накопителя приемлемая задержка, нет смысла двигаться вперед. Disk Bytes / sec и Disk Transfers / sec используются для определения размера и количества запросов ввода-вывода. Эти счетчики могут помочь определить, является ли количество дисков или среда связи источником задержки. Ты можешь также используйте Avg. Дисковая очередь Длина для проверки среды передачи данных. Как правило, значение больше 32 представляет собой узкое место, которое может увеличить задержку.
Disk Transfers / sec состоит из Disk Reads / sec и Операций записи на диск / сек . Вы можете использовать эти счетчики, чтобы определить, недостаточно ли на диске поддерживающих дисков. При использовании этих счетчиков может потребоваться корректировка значений для типа внедренного вами RAID. Чтобы определить, какие значения для использования используйте следующие формулы:
- Raid 0 — количество операций ввода-вывода на диск = (чтение + запись) / количество дисков
- Raid 1 — количество операций ввода-вывода на диск = [чтения + (2 * записи)] / 2
- Raid 5 — количество операций ввода-вывода на диск = [чтения + (4 * записи)] / количество дисков
- Raid 10 — количество операций ввода-вывода на диск = [чтения + (2 * записи)] / количество дисков
Например, если максимальное значение для Disk Transfers / sec равно 1800, вы можете определить, что для диска потребуется не менее 10 15k RPM дисков в его группе RAID.Как правило, диск со скоростью вращения 15 000 об / мин способен выполнять примерно 180 запросов ввода-вывода в секунду (IOPS). 180 * 10 = 1800. Для более высокого значения вам может потребоваться более 10 дисков.
ПРИМЕЧАНИЕ : Проконсультируйтесь с поставщиком оборудования, чтобы определить точное количество операций ввода-вывода в секунду, которое могут обрабатывать ваши диски. Среднее время поиска и задержка вращения могут повлиять на вывод IOPS. Все диски НЕ созданы равными.
Если задержка постоянно высока, вы можете определить основную причину, используя вторичные счетчики.Если задержка связана с количеством дисков, примите во внимание следующее:
- Используйте более быстрый дисковод.
- Переместите часто используемые файлы на отдельный диск, сервер или SAN.
- Добавьте диски в массив RAID, если вы его используете.
- Используйте более быстрый тип RAID, например RAID 10.
- Прекратить совместное использование дисков с другими томами или LUN.
Если задержка связана со средой связи, примите во внимание следующее:
- Увеличьте глубину очереди.
- Переместите часто используемые файлы на отдельный диск, сервер или SAN.
- Проверить кэш SAN.
- Использовать несколько путей.
Следующие три вопроса можно использовать, чтобы помочь определить, есть ли узкое место в системе хранения и где оно, вероятно, находится:
- Наблюдается ли задержка? (Среднее с диска / чтение> 0,020 или среднее с диска / запись> 0,020)
- Наблюдается ли задержка на всех (большинстве) дисков (LUN) или только на одном (нескольких) дисках (LUN).
- Этот вопрос помогает нам понять, связана ли проблема с общим отсутствием связи между сервером и хранилищем или проблема более вероятна из-за ограничений физических шпинделей.
- Если большинство дисков наблюдаются с задержкой в одно и то же время, это может указывать на то, что задержка связана с узким местом связи, например с HBA, коммутатором, портом SAN или ЦП SAN.
- Если на одном запоминающем устройстве много LUN и только один или несколько наблюдаются с задержкой, проблема, вероятно, связана с LUN.
- Наконец, сравните пропускную способность диска (количество передач диска в секунду и байтов диска в секунду) в течение времени, когда наблюдалась задержка, со временем, когда наблюдается максимальная пропускная способность.
- Если задержка всегда растет пропорционально пропускной способности, проблема может быть в физических шпинделях; хотя это не исключает коммуникационный уровень. Обратитесь к администратору хранилища, чтобы он определил, способны ли физические шпиндели обрабатывать пропускная способность, наблюдаемая с дисковыми передачами / сек и дисковыми байтами / сек.
- Если обнаруживается, что задержка намного ниже, когда активность намного выше, чем узкое место, вероятно, не из-за физических шпинделей (JBOD). Администратор хранилища должен быть привлечен для помощи в проверке структуры хранилища (HBA, коммутаторы, ЦП SAN, порты, …).
В дополнение к этим рекомендациям рассмотрите возможность настройки запросов, которые генерируют большие объемы операций ввода-вывода. Чтобы определить запросы, которые потребляют большие объемы операций ввода-вывода, используйте SYS.DM_EXEC_QUERY_STATS DMV. В динамические административные представления (DMV) имеют метрики как для чтения, так и для записи и отображаются в запросе. Вы также можете включить план запроса и текст команды SQL, присоединившись к SYS.DM_EXEC_SQL_TEXT и SYS.DM_EXEC_QUERY_PLAN динамические функции управления с оператором CROSS APPLY.
Ниже приведен пример запроса с использованием SYS.DM_EXEC_QUERY_STATS :
ВЫБРАТЬ ТОП 25 кол-во исполнений, генерация_плана, last_execution_time,
total_worker_time, last_worker_time, min_worker_time, max_worker_time,
total_logical_reads, last_logical_reads, min_logical_reads, max_logical_reads,
total_physical_reads, last_physical_reads, min_physical_reads, max_physical_reads,
total_logical_writes, last_logical_writes, min_logical_writes, max_logical_writes,
total_elapsed_time, last_elapsed_time, min_elapsed_time, max_elapsed_time,
(ПОДСТРОКА (s2.текст, statement_start_offset / 2, ( (КЕЙС КОГДА statement_end_offset знак равно -1 ТОГДА (LEN (CONVERT (nvarchar (max), s2.text)) * 2) ELSE statement_end_offset КОНЕЦ) — statement_start_offset) / 2) ) Как sql_statement,
текст, p.query_plan
ОТ sys.dm_exec_query_stats qs
КРЕСТ ПРИМЕНИТЬ sys.dm_exec_sql_text (qs.plan_handle) s2
КРЕСТ ПРИМЕНИТЬ sys.dm_exec_query_plan (qs.plan_handle) P
ЗАКАЗАТЬ ПО total_physical_reads DESC
Кроме того, столбец PENDING_DISK_IO_COUNT в SYS.DM_OS_SCHEDULERS может указывать проблемы с дисковой подсистемой. Вам следует дополнительно изучить устойчивую ценность каждого процессора. Ты можешь использовать SYS.DM_IO_PENDING_IO_REQUESTS , чтобы определить ожидающие запросы и связать их с файлами базы данных. SYS.DM_IO_VIRTUAL_FILE_STATS сообщает статистику ввода-вывода как для файлов данных, так и для файлов журнала.
Еще один ресурс, который вы можете использовать, — это SYS.DM_OS_WAIT_STATS DMV. Используйте это DMV, чтобы определить, чего часто ждет двигатель, и выберите эту область для настройки. У вас может быть узкое место IOS, если ожидания PAGEIOLATCH представляют собой одни из самых высоких ожиданий. PAGEIOLATCH ожидания указывает количество времени, в течение которого ядро базы данных ожидало IOS. PAGEIOLATCH имеет различные режимы и больше ожидания на PAGEIOLATCH_SH указывает на узкое место чтения, тогда как PAGEIOLATCH_EX указывает на узкое место записи.
Изоляция дисковой активности создана на SQL Server
Вы можете отслеживать следующие счетчики, чтобы определять количество операций ввода-вывода, генерируемых компонентами SQL Server:
- SQL Server: Диспетчер буферов: чтения страниц / сек
- SQL Server: диспетчер буферов: записей страниц / сек.
- SQL Server: диспетчер буферов: страниц контрольной точки / сек
- SQL Server: диспетчер буферов: отложенных записей / сек
В системном мониторе эти счетчики отслеживают количество операций ввода-вывода, генерируемых компонентами SQL Server, путем изучения следующих областей производительности:
- Запись страниц на диск
- Чтение страниц с диска
Если значения этих счетчиков приближаются к пределу емкости аппаратной подсистемы ввода-вывода, попытайтесь уменьшить значения, настроив приложение или базу данных. для сокращения операций ввода-вывода (таких как покрытие индекса, улучшение индексов или нормализация), увеличения емкости ввода-вывода оборудования или добавления памяти.Например, вы можете использовать помощник по настройке ядра СУБД для анализа типичных рабочих нагрузок SQL Server и создания рекомендации по индексам, индексированным представлениям и секционированию для повышения производительности сервера. Дополнительные сведения о помощнике по настройке ядра СУБД см. В разделе Настройка физического дизайна базы данных.
ПРИМЕЧАНИЕ. Эти два счетчика не включают операции ввода-вывода, созданные в результате сброса журнала транзакций. Большинство операций ввода-вывода журнала транзакций записываются.
.