Причины появления ошибки NVML error 999 (an internal driver error occurred)
Проблемы, связанные с появлением ошибок библиотеки NVIDIA Management Library (NVML) с разным кодом (обычно это 15, 17 или 999) приводят к потере контроля/управления температурой и вентиляторами видеокарты.
Они связаны с некорректной работой NVML API, входящего в состав драйверов NVidia. Согласно :
- ошибка с кодом 15 свидетельствует о том, что GPU теряет связь с шиной PCI-E и затем становиться недоступной для управления (NVML_ERROR_GPU_IS_LOST);
- ошибка с кодом 17 свидетельствует о том, что видеокарта заблокирована другим процессом (NVML_ERROR_OPERATING_SYSTEM = 17, GPU control device has been blocked by the operating system/cgroups);
- error 999 свидетельствует о неизвестном сбое в работе драйверов (NVML_ERROR_UNKNOWN = 999 -an internal driver error occurred).
Основной причиной появления этих ошибок является наличие проблем в прохождении данных по каналу видеокарта-материнская плата.
Прохождение сигнала по шине PCI-E происходит с ошибками из-за таких неисправностей:
- некорректная установка или повреждение файлов драйверов;
- неверная установка в BIOS скорости передачи данных для устройств PCI-Express;
- некорректная работа устройств PCI-E из-за включения энергосберегающего режима питания этой шины;
- перегрев южного моста и вызванные этим нарушения обмена данными по линии PCI-Express;
- перегрев видеокарты и появление, связанных с этим проблем в работе ее электронных компонентов;
- неисправности райзеров (обычно это плохие контакты по линиям передачи данных и по питанию);
- плохой контакт в разъемах кабелей питания/передачи данных;
- некачественные блоки питания, слишком большая нагрузка на них;
- наличие сильных электромагнитных помех, проникающих на риг из сети;
- слишком большой разгон/даунвольтинг GPU.
Небольшой разговор
Гораздо сложнее, чем я думал, так как я пытался играть с моим Intel GPU в течение некоторого времени, используя , Иногда я получаю неожиданные ошибки. Это лето для моего опыта.
Вот упрощенный полный список стеков, насколько я понимаю.
Это действительно большой стек для устранения неполадок, более сложный со старым оборудованием и обновлениями проприетарных драйверов, даже плохой контакт в VGA-кабеле DB-15 (или дешевый кабель) может иметь значение. На самом деле, большинство проблем, которые я читаю здесь в Ask Ubuntu, касаются просто отсутствия / неправильной EDID- информации с монитора, обвиняя в этом: кабели (KVM-переключатель / адаптер подключения). Вы можете заметить это быстро из выход.
Во многих случаях драйверы ограничивают некоторые режимы из-за неполных / частично неправильных данных EDID из монитора (ошибка производителя). Пользователь преодолевает это, записывая пользовательские переопределить: Mode, HSync & VSync, EDID, DPI … в зависимости от драйвера ( например может игнорировать EDID с монитора)
Я рекомендую это прочитать для продвинутых пользователей или тех, кто предоставляет помощь здесь:
- Ubuntu Wiki: X Устранение неполадок (довольно старое и общее)
- KMS UXA DRM OMG WTF Барбекю? / Linux графика демистифицирована Мартином Фидлером из Dream Chip Technologies GmbH в Хемницере Linux-Tage 2014
Мое дурацкое понимание этих ошибок xrandr/X
Сын ( Кажется, он не знает, что его отец может или согласится купить его (все возможности водителя), поэтому он просто идет к своей маме (Ксорг) и просит ее попросить у его отца то, что он хочет. Таким образом, произойдет любой из следующих сценариев:
- высокий коэффициент: сын → (:) принимаю) мама → (:) принимаю) папа, все счастливы!
- низкий коэффициент: Сын → (:| принять) Мама → (XD отклонить) папа, жизнь иногда бывает тяжелой!
- редкий случай: сын → (X/ отклонить) мама -х- (:| нейтральный) папа, время для плана Б!
Таким образом, мы получаем эти ошибки, когда Xorg или Driver не могут обработать или отклонить запрос xrandr из-за:
- Текущие настройки Xorg
- Возможности водителя
- Возможности графического адаптера
- Возможности монитора, полученные от EDID
- Ошибка в одном из них, включая
Linux mysql crontab запланированная ошибка резервного копирования; crond [2382]: (wget) ОШИБКА (сбой getpwnam ())
http-equiv=»Content-Type» content=»text/html;charset=UTF-8″>style=»clear:both;»>
журналы crontab
tail -f /var/log/cron
Распечатать журнал
,
Сценарий может быть выполнен отдельно.
После добавления задачи в crontab она не может быть выполнена нормально;
Причина: база данных исходного каталога установки больше не является / usr / local / mysql
Crontab будет смотреть только в / usr / bin;
Так что найдите каталог установки mysql;
Добавьте путь к mysqldump в сценарии .sh, как показано ниже.
Решить проблему:
Способ 1. Установите мягкое соединение: ln -fs / usr / local / mysql / bin / mysqldump / usr / bin
Способ 2: при использовании mysqldump используйте полный путь: os.system («/ usr / local / mysql / bin / mysqldump -h127.0.0.1 -uroot -ppasswd testdata> testdata.sql»)
Интеллектуальная рекомендация
Глава первая: Причина В большинстве анекдотов в Интернете говорится, что программисты относительно тупые, плохие слова и в основном мужчины. Я один из тысяч программистов. Обычно я не знаю, как правил…
Всегда был спрос, надеясь увидеть в реальном времени рейтинг моего сайта в Baidu Я использовал некоторые инструменты, либо медленный ответ, либо результаты не точные или в режиме реального времени Поэ…
Алгоритм обнаружения характерных точек Обнаружение угла Харриса Обнаружение функции SIFT…
По просьбе пользователей сети напишите пример использования Selenium Grid для управления несколькими системами и несколькими браузерами для параллельного выполнения тестов. Поскольку у меня здесь две …
Эта проблема возникает, когда используется openrowset. Просто выполните следующий код: http://www.cnblogs.com/wayne-ivan/archive/2008/01/07/1028759.html…
Вам также может понравиться
В проекте .net я часто сталкиваюсь с необходимостью автоматически делать скриншот кадра после загрузки видео. Вот метод использования ffmpeg для автоматического создания скриншота Сначала загрузите фа…
Ленивая загрузка не удалась, потому что @Responsebobode JSON преобразует Getroles по умолчанию, которая заканчивается пользователем, поэтому ленивая загрузка недействительна. Если вы предоставляете TO…
virtualenv установка Основное использование Создайте виртуальную среду для проекта: virtualenv venv создаст папку в текущем каталоге, содержащую исполняемые файлы Python и копию библиотеки pip, чтобы …
Java.io.fileNotfoundException: файл: \ d: \ Code \ xml-load \ target \ xx.jar! \ Xxx (имя файла, имя каталога или синтаксис громкости неверно.) 1. При использовании Spring Boot для применения к JAR не…
Недавно я попытался установить MySQL под Windows, ссылаясь на документацию в Интернете, но я также сказал, что столкнулся с некоторыми проблемами во время реальной работы. Пожалуйста, запишите здесь д…
4 ответа
Меня удивляет, что никто не имеет правильного ответа на это. Сегодня я столкнулся с точно такой же проблемой, и Google не помог.
Через 2 часа я обнаружил, что при размещении файла в /etc/cron.d строка расписания должна содержать дополнительную опцию…..
Я всегда использую это для моего crontab -e
Таким образом, он содержит 6 предметов.
При размещении этого в файле внутри /etc/cron.d cron требуется дополнительная опция, которая позволяет пользователю запускать ваш сценарий / фантазию.
Это описано в man crontab(5). Например, https://linux.die.net/man/5/crontab. Это говорит:
Вакансии в /etc/cron.d/
Задания в cron.d являются системными заданиями, которые обычно используются для более чем одного пользователя. Вот почему нужно имя пользователя. MAILTO в первой строке не является обязательным.
47
2017-03-10 13:15
Простой ответ на ваш crontab, вам нужно указать пользователя для запуска команды
Пример для запуска в качестве ROOT:
0,10,20,30,40,50 * * * * root /path_to_script/script_name
или запустить от имени пользователя FRED
0,10,20,30,40,50 * * * * fred / path_to_script / script_name
по умолчанию без указания пользователя USER — запуск от имени пользователя CRON, и у этого пользователя не будет разрешений на выполнение сценария.
1
2018-10-16 11:55
Шестая позиция зарезервирована для имени пользователя, выполняющего задание. Вы указали пользователя с именем которого, скорее всего, нет на машине.
1
2017-12-19 09:19
Мы можем создать рабочие места cron для системы, а также для отдельных лиц. Crontab в специально используется для системных cronjobs. Поэтому вам нужно указать команду cronjob, которую вы выполняете. В вопросе имя пользователя не указано. Следовательно происходит. Вы можете создавать пользовательские cronjobs в
ПРИМЕЧАНИЕ:: Задания Cron очень полезны, но катастрофичны при сбоях!
2018-12-14 11:27
Нет ничего плохого в файле crontab (если под «моим» crontab вы подразумеваете, что это пользовательский crontab, а не системный crontab; в противном случае ).
С другой стороны, что-то не так со службой каталогов вашей системы — как настроено в Linux, с , Возможно, вы используете хранилище LDAP с аутентификацией Kerberos, и у вашего демона cron нет токена Kerberos для подключения к нему (или он помещен в «песочницу», как в SELinux, чтобы не иметь доступа к сети); возможно, это хранилище файлов, недоступное для чтения пользователю, чей crontab запускается; возможно, происходит какая-то другая странная и интересная вещь.
это вызов библиотеки C, который выполняет поиск имени текущего пользователя, вошедшего в систему. Если бы ваша оболочка была bash, она вернулась бы к имени — так что эта ошибка означает, что ваш реализация это что-то другое. (Если вы хотите запускать свои скрипты с помощью bash, используйте не ).
2017-01-25 21:29
Что нужно сделать, чтобы устранить ошибку NVML error 999 (an internal driver error occurred)
Для устранения ошибки NVML: cannot get fan speed, error 999 необходимо произвести следующие действия:
- проверить/заменить райзера, кабеля питания, очистить контакты на разъемах видеокарты, райзерах и кабелях питания/USB-удлинителях;
- увеличить размер файла подкачки до суммарного объема видеопамяти установленных в риге видеокарт;
- уменьшить разгон по ядру и памяти, уменьшить даунвольтинг. В первую очередь нужно уменьшать разгон/даунвольтинг на карте, номер которой первым появляется в логах майнера перед зависанием. Если первой появляется строка GPU 1, GpuMiner cu_k1 failed 30, unknown error, то проблема, скорее всего, связана именно с первой видеокартой;
- отключить опцию PCIe Power Saving в параметрах электропитания системы (меню настройки схемы электропитания – изменить дополнительные параметры питания – PCI Express – Управление состоянием связи – Откл.);
- заново произвести установку драйверов с полной деинсталляцией предыдущей версии;
- обеспечить хорошее охлаждение южного моста путем установки радиатора или вентилятора;
- установить в BIOS скорость обмена по линии PCI-E в GEN 2 или 1;
- обеспечить достаточную мощность блока питания и проверить качество выдаваемых им напряжений с помощью вольтметра;
- поменять разъем PCI-E, в который включается видеокарта, попробовать включить ее в него без райзера.
При подозрении на неисправность разъема материнской платы нужно попробовать вставить в него другую видеокарту с заведомо исправным райзером. Если ошибка возникает снова, то, скорее всего неисправность возможно связана с материнской платой.
Небольшую помощь при запуске Claymore miner при наличии проблем, связанных с контролем вентиляторов видеокарт, может дать включение в батник параметров:
-tt 1 — отключение управления вентиляторами;
-tt 0 — отключение мониторинга температуры и вентиляторов;
-wd 0 – отключение программного watchdog, встроенного в майнер.
Отключение управления работой вентиляторов в майнере не будет проблемой при использовании MSI Afterburner или nvidiainspector по методике, описанной в статье «Оптимизация потребления видеокарт Nvidia при майнинге».
Использование такого «костыля» может увеличить время бесперебойной работы рига, но если в компьютере останется плохой контакт, то все равно работа рига будет нестабильной, и он будет периодически зависать.
В этом случае может помочь один из аппаратных сторожевых таймеров, некоторые из которых описаны в статье «Китайские сторожевые таймеры для майнинга».
О других ошибках, возникающих при майнинге и способах их устранения, можно почитать в статьях:
- «Устранение ошибок при майнинге, связанных с неверной установкой или конфигурированием видеокарт»;
- «Как исправить ошибку NVIDIA NVML library not found».