Publicado por primera vez en MSDN el 27 de mayo de 2011
Hola Fans de clúster,

Esta publicación de blog aclarará las consideraciones de planificación en torno a
quórum
en un clúster de conmutación por error y responderá algunas de las preguntas más comunes que escuchamos.

La configuración de quórum en un clúster de conmutación por error determina el número de errores que el clúster puede soportar mientras permanece en línea. Si se produce un error adicional más allá de este umbral, el clúster dejará de ejecutarse. Una percepción común es que la razón por la que el clúster dejará de ejecutarse si se producen demasiados errores es para evitar que los nodos restantes asuman demasiadas cargas de trabajo y que los hosts se comprometan en exceso. De hecho, el clúster no conoce sus limitaciones de capacidad ni si estaría dispuesto a recibir un golpe de rendimiento para mantenerlo en línea. Más bien, el quórum está diseñado para manejar el escenario cuando hay un problema con la comunicación entre conjuntos de nodos de clúster, de modo que dos servidores no intenten alojar simultáneamente un grupo de recursos y escribir en el mismo disco al mismo tiempo. Esto se conoce como un» cerebro dividido » y queremos evitar esto para evitar cualquier posible corrupción en un disco que tenga dos propietarios de grupo simultáneos. Al tener este concepto de quórum, el clúster obligará al servicio de clúster a detenerse en uno de los subconjuntos de nodos para asegurarse de que solo hay un propietario verdadero de un grupo de recursos en particular. Una vez que los nodos que se han detenido puedan comunicarse de nuevo con el grupo principal de nodos, se volverán a unir automáticamente al clúster e iniciarán su servicio de clúster.

Para obtener más información sobre el quórum en un clúster, visite:
http://technet.microsoft.com/en-us/library/cc731739.aspx
.

Votar hacia el Quórum

Tener ‘quórum’, o una mayoría de votantes, se basa en un algoritmo de votación en el que más de la mitad de los votantes deben estar en línea y ser capaces de comunicarse entre sí. Dado que un clúster determinado tiene un conjunto específico de nodos y una configuración de quórum específica, el clúster sabrá cuántos «votos» constituyen una mayoría de votos, o quórum. Si el número de votantes cae por debajo de la mayoría, el servicio de clúster se detendrá en los nodos de ese grupo. Estos nodos seguirán escuchando la presencia de otros nodos, en caso de que otro nodo aparezca de nuevo en la red, pero los nodos no comenzarán a funcionar como un clúster hasta que el quórum vuelva a existir.

Es importante darse cuenta de que el clúster requiere
más de
la mitad del total de votos para lograr quórum. Esto es para evitar un «empate» en el número de votos en una partición, ya que la mayoría siempre significará que la otra partición tiene menos de la mitad de los votos. En un grupo de 5 nodos, 3 votantes deben estar en línea; sin embargo, en un grupo de 4 nodos, 3 votantes también deben estar en línea para tener mayoría. Debido a esta lógica, se recomienda tener siempre un número impar de votantes totales en el grupo. Esto no significa necesariamente que se necesite un número impar de nodos, ya que tanto un disco como un recurso compartido de archivos pueden contribuir con un voto, dependiendo del modelo de quórum.

Un votante puede ser:

  • Un nodo
    • 1 Voto
    • Cada nodo del clúster tiene 1 voto
  • Un» Testigo de Disco «o»Testigo de Uso compartido de archivos»
    • 1 Voto
    • 1 Testigo de disco o 1 Testigo de Uso Compartido de archivos puede tener un voto en el clúster, pero no varios discos, varios archivos compartidos ni ninguna combinación de los dos

Tipos de quórum

Hay cuatro tipos de quórum. Esta información también está disponible aquí:
http://technet.microsoft.com/en-us/library/cc731739.aspx#BKMK_choices
.

Mayoría de nodos

Este es el tipo de quórum más fácil de entender y se recomienda para clústeres con un número impar de nodos (3 nodos, 5 nodos, etc.).). En esta configuración, cada nodo tiene 1 voto, por lo que hay un número impar de votos totales en el clúster. Si hay una partición entre dos subconjuntos de nodos, el subconjunto con más de la mitad de los nodos mantendrá el quórum. Por ejemplo, si un clúster de 5 nodos se divide en un subconjunto de 3 nodos y un subconjunto de 2 nodos, el subconjunto de 3 nodos se mantendrá en línea y el subconjunto de 2 nodos se desconectará hasta que pueda reconectarse con los otros 3 nodos.

Nodo & Mayoría de disco

Esta configuración de quórum se usa con mayor frecuencia, ya que funciona bien con clústeres de 2 y 4 nodos, que son las implementaciones más comunes. Esta configuración se utiliza cuando hay un número par de nodos en el clúster. En esta configuración, cada nodo obtiene 1 voto, y además 1 disco obtiene 1 voto, por lo que generalmente hay un número impar de votos totales.

Este disco se denomina Testigo de disco (a veces denominado «disco de quórum») y es simplemente un pequeño disco agrupado que se encuentra en el grupo de almacenamiento Disponible en clúster. Este disco está altamente disponible y puede conmutar por error entre nodos. Se considera parte del grupo de Recursos principales del clúster, sin embargo, generalmente se oculta a la vista en el Administrador de clúster de conmutación por error, ya que no es necesario interactuar con él.

Dado que hay un número par de nodos y 1 voto de testigo de Disco de adición, en total habrá un número impar de votos. Si hay una partición entre dos subconjuntos de nodos, el subconjunto con más de la mitad de los votos mantendrá el quórum. Por ejemplo, si un clúster de 4 nodos con un Testigo de disco se divide en un subconjunto de 2 nodos y otro subconjunto de 2 nodos, uno de esos subconjuntos también poseerá el Testigo de disco, por lo que tendrá un total de 3 votos y permanecerá en línea. El subconjunto de 2 nodos se desconectará hasta que pueda reconectarse con los otros 3 votantes. Esto significa que el clúster puede perder la comunicación con dos votantes cualesquiera, ya sean 2 nodos o 1 nodo y el Disco Testigo.

Nodo & Mayoría de recursos compartidos de archivos

Esta configuración de quórum se usa generalmente en clústeres de varios sitios. Esta configuración se usa cuando hay un número par de nodos en el clúster, por lo que se puede usar indistintamente con el modo de quórum de Mayoría de nodos y discos. En esta configuración, cada nodo obtiene 1 voto y, además, 1 recurso compartido de archivos remoto obtiene 1 voto.

Este recurso compartido de archivos se denomina Testigo de uso compartido de archivos (FSW) y es simplemente un recurso compartido de archivos en cualquier servidor del mismo Bosque de AD al que tengan acceso todos los nodos del clúster. Un nodo del clúster colocará un bloqueo en el recurso compartido de archivos para considerarlo el «propietario» de ese recurso compartido de archivos, y otro nodo tomará el bloqueo si falla el nodo propietario original. En un servidor independiente, el recurso compartido de archivos por sí solo no está altamente disponible, sin embargo, el recurso compartido de archivos también puede colocar un recurso compartido de archivos en clúster en un clúster independiente, lo que hace que el FSW se agrupe y le da la capacidad de conmutación por error entre nodos. Es importante que no coloque este voto en un nodo del mismo clúster, ni dentro de una máquina virtual del mismo clúster, porque perder ese nodo causaría que perdiera el voto de FSW, lo que provocaría la pérdida de dos votos en un solo error. Un solo servidor de archivos puede alojar varios archivos FSWs para varios clústeres.

Generalmente, los clústeres de varios sitios tienen dos sitios con un número igual de nodos en cada sitio, lo que da un número par de nodos. Al agregar este voto adicional en un sitio de 3
rd
, hay un número impar de votos en el clúster, con un gasto muy bajo en comparación con la implementación de un sitio de 3
rd
con un nodo de clúster activo y un DC grabable. Esto significa que se puede perder el sitio o el FSW y el clúster puede mantener el quórum. Por ejemplo, en un clúster de varios sitios con 2 nodos en Site1, 2 nodos en Site2 y un FSW en Site3, hay un total de 5 votos. Si hay una partición entre los sitios, uno de los nodos de un sitio poseerá el bloqueo del FSW, de modo que el sitio tendrá un total de 3 votos y permanecerá en línea. El sitio de 2 nodos se desconectará hasta que pueda reconectarse con los otros 3 votantes.

Legado: Solo disco

Importante:
Este tipo de quórum no se recomienda, ya que tiene un único punto de error.

El tipo de quórum de solo disco estaba disponible en Windows Server 2003 y se ha mantenido por razones de compatibilidad, sin embargo, se recomienda encarecidamente no usar nunca este modo a menos que lo indique un vendedor de almacenamiento. En este modo, solo el Testigo de disco contiene un voto y no hay otros votantes en el clúster. Esto significa que si el disco no está disponible, todo el clúster se desconectará, por lo que se considera un único punto de error. Sin embargo, algunos clientes optan por implementar esta configuración para obtener una configuración de «último hombre en pie» en la que el clúster permanezca en línea, siempre que cualquier nodo siga operativo y pueda acceder al disco del clúster. Sin embargo, con este objetivo de implementación, es importante considerar si el último nodo restante puede incluso manejar la capacidad de todas las cargas de trabajo que se han trasladado a él desde otros nodos.

Selección de quórum predeterminada

Cuando el clúster se crea mediante el Administrador de clúster de conmutación por error, Clúster.exe o PowerShell, el clúster seleccionará automáticamente el mejor tipo de quórum para simplificar la implementación. Esta opción se basa en el número de nodos y el almacenamiento disponible. La lógica es la siguiente:

  • Número Impar de Nodos – usar Mayoría de Nodos
    • Número par de Nodos
      • Discos de Clúster disponibles-usar Nodo & Mayoría de disco
      • Sin Disco de Clúster disponible-usar Mayoría de nodos

El clúster nunca seleccionará el Nodo y el Recurso compartido de archivos Mayoría o Legado: Solo Disco. El tipo de quórum sigue siendo totalmente configurable por el administrador si no se prefieren las selecciones predeterminadas.

Cambiar los tipos de quórum

Cambiar el tipo de quórum es fácil a través del Administrador de clúster de conmutación por error. Haga clic con el botón secundario en el nombre del clúster, seleccione Más acciones… y, a continuación, seleccione Configurar configuración de Quórum de clúster to para iniciar el Asistente para Configurar Quórum de clúster. Desde el asistente es posible configurar los 4 tipos de quórum, cambiar el Testigo de Disco o el Testigo de Uso compartido de archivos. El asistente incluso le indicará el número de fallos que se pueden mantener en función de su configuración.

Para obtener una guía paso a paso de la configuración del quórum, visite:
http://technet.microsoft.com/en-us/library/cc733130.aspx
.

Gracias!
Symon Perriman
Evangelista técnico
Tecnologías de nube privada
Microsoft

Actualizado: 6 de noviembre de 2019 por Rob Hindman

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

lg