Preparados para los stop error

Algunas técnicas útiles de soft-hard relacionadas con los errores pueden sernos de utilidad para nuestro propio entrenamiento ante la posibilidad de ocurrencia de estos problemas y así identificar la causa.

Impedir que el sistema se reinicie automáticamente

Cuando sucede un stop error, Windows Server nos muestra el mensaje de error relacionado y después lleva a cabo una de dos:

  • Se vuelve inestable, ‘no responde’.
  • Se reinicia automáticamente

De forma predeterminada se reinicia automáticamente después de un stop error a menos que se vuelva inestable y no responda. Si se reinicia inmediatamente puede que no dispongamos de suficiente tiempo para atender a la información del mensaje de error, además de perder la oportunidad de poder cambiar las opciones de arranque o de iniciarlo en modo seguro. Deshabilitar este reinicio predeterminado nos permite una lectura más comoda del mensaje de error. El deshabilitarlo hace que que el sistema permanecerá detenido hasta que lo reiniciemos manualmente. Aunque es recomendable que no se deshabilite en servidores críticos o remotos donde el reinicio manual es más problemático o poco accesible.

Para deshabilitar la opción de reinicio automático:

  1. Desde el panel de control, icono Sistema, pestaña avanzadas.
  2. En la sección Inicio y recuperación, botón configuración.
  3. En el cuadro Error de sistema, desmarcamos la casilla de Reinicio automático.

dibable-restart

 

Guardar la información del mensaje de error

Con el reinicio automático deshabilitado, podemos reiniciar el equipo manualmente después de mostrarnos el mensaje de error. Este mensaje nos proporciona información, como el número de error y parámetros y los nombres de controladores, que nos servirán para resolver el problema. Sin embargo, esta información desaparecerá en cuanto reiniciemos el equipo. Normalmente puede recuperarse después del reinicio desde el registro del sistema o analizando el archivo de volcado. Pero hay situaciones en que la información mostrada en pantalla no se registra adecuadamente y por tanto, es importante poder guardarla para consultas futuras. Antes de reiniciar el sistema, hemos de llevar a cabo algunas acciones para asegurarnos que se ha guardado la info para utilizarla después.

  1. Copiar los datos de las secciones técnica y de controlador del mensaje de error.
  2. Copiar y evaluar las sugerencias de la sección de acciones recomendadas. Los mensajes de error suelen proporcionar tips para solucionarlo.
  3. Comprobar las secciones de Debug port y Dump file status para verificar que Windows Server ha creado el archivo de volcado de memoria.
  4. Si hay un archivo de volcado de memoria, lo copiamos a cualquier otro medio removible, o en una unidad de red. Podemos usar la consola de recuperación para ello si somos incapaces de reiniciar Windows.

Errores más comunes

La información más extensa sobre errores de stop se encuentra en las herramientas de depuración de Windows, también podemos encontrar información actualizada usando el número de error, como 0x0000000A o 0xA como palabra clave.

Si después de realizar las acciones recomendadas el error persiste, deberíamos valorar el solicitar ayuda a personal técnico, e incluso a Microsoft.

Los códigos de los mensajes de stop se muestran en hexadecimal, 32 bits para versiones de Windows de 32 bits y 64 bits en las versiones de 64 bits. Por ejemplo: el código IRQL_NOT_LESS_OR_EQUAL se muestra como 0x0000000A.

0xA IRQL_NOT_LESS_OR_EQUAL

Este mensaje indica que el núcleo(kernel) o un controlador ha intentado acceder a una ubicación de la memoria para la que no tiene permiso, o que una solicitud de interrupción (IRQL-Interrupt Request Level) era demasiado grande. El núcleo representa una IRQL como un número entre 0 y 31, cuanto más alto más alta prioridad de la interrupción. Un hilo de ejecución normal tiene una prioridad baja IRQL-0. Este error lo causa típicamente software o hardware incompatible.

El mensaje contiene cuatro parámetros junto al número de error:

Primero: Dirección de la memoria que se intentó acceder incorrectamente

Segundo: IRQL solicitada para acceder a la memoria

Tercero: Tipo de acceso, 0x00000000=lectura, 0x00000001=escritura.

Cuarto: Dirección de la instrucción que intentó el acceso a la dirección de memoria especificada en el primero.

Si el cuarto parámetro está dentro del rango de direcciones de un controlador usado por el sistema, podemos determinar el controlador que se ejecutaba en el momento del acceso a la memoria. Normalmente el nombre del controlador lo leemos en una línea parecida a **Address 0xZZZZZZZZ has base at <dirección> – <controlador>.

Si el tercero es idéntico al primero es porque se da una condición especial en la que una rutina, llevada a cabo por un hilo para manejar en segundo plano tareas conocidas como work items, ha devuelto una IRQL alta. En este caso, algunos de los parámetros toman un nuevo significado.

Primero: Dirección de la rutina

Segundo: IRQL del núcleo

Tercero: Dirección de la rutina

Cuarto:  Dirección del work item

Para resolver este error revisamos el visor de sucesos, registro del sistema para ver el problema.

Elementos del controlador del dispositivo: Un error de este tipo puede suceder después de instalar un controlador de dispositivo caducado o erróneo, un servicio del sistema o haber cambiado firmware. Si el mensaje nos muestra el nombre del controlador  y éste ha sido actualizado o cambiado hace poco, entonces lo mejor es volver al controlador anterior (roll back desde Administrador de dispositivos). Si el dispositivo no es crítico para la funcionalidad del sistema, podemos desinstalar el dispositivo o deshabilitar el controlador.

Elementos hardware: El error puede ser causado también por un error o fallo de hardware. Si el mensaje apunta a una categoría de dispositivos, podemos intentar quitar o reemplazarlos para ver si son ellos los que causan el problema.

Elementos de compatibilidad de software: Si el error sucede durante una actualización de Windows Server, puede que esté causado por un controlador incompatible, un servicio del sistema, un antivirus o una copia de seguridad. Para evitar el problema mientras actualizamos, simplificamos la configuración de hardware presente, quitando los controladores de dispositivo, servicios de sistema y antivirus antes de comenzar a actualizar. Después de una instalación con éxito, obtener la compatibilidad necesaria.

 

Podríamos ir viendo diversos errores pero supongo que podemos encontrarlos fácilmente con google mismo, en cuanto se tiene un número de error y sus parámetros. Aquí queda este como muestra.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *