Rendemento dos sistemas de almacenamento de matrices de discos nunha conexión de host único

En xeral, as matrices de discos ou discos teñen o mellor rendemento nun escenario de conexión de host único. A maioría dos sistemas operativos baséanse en sistemas de ficheiros exclusivos, o que significa que un sistema de ficheiros só pode ser propiedade dun único sistema operativo. Como resultado, tanto o sistema operativo como o software de aplicación optimizan a lectura e a escritura de datos para o sistema de almacenamento en disco en función das súas características. Esta optimización ten como obxectivo reducir os tempos de busca física e diminuír os tempos de resposta mecánica do disco. As solicitudes de datos de cada proceso do programa son xestionadas polo sistema operativo, o que resulta en solicitudes de lectura e escritura de datos optimizadas e ordenadas para o disco ou matriz de discos. Isto leva ao mellor rendemento do sistema de almacenamento nesta configuración.

Para as matrices de discos, aínda que se engade un controlador RAID adicional entre o sistema operativo e as unidades de disco individuais, os controladores RAID actuais xestionan e verifican principalmente as operacións de tolerancia a fallos do disco. Non realizan fusión, reordenación ou optimización de solicitudes de datos. Os controladores RAID están deseñados partindo da hipótese de que as solicitudes de datos proceden dun único host, xa optimizado e ordenado polo sistema operativo. A caché do controlador só ofrece capacidades de almacenamento en búfer directo e computacional, sen poñer os datos en cola para a optimización. Cando a caché se enche rapidamente, a velocidade diminúe inmediatamente ata a velocidade real das operacións do disco.

A función principal do controlador RAID é crear un ou máis discos grandes tolerantes a fallos a partir de varios discos e mellorar a velocidade global de lectura e escritura de datos mediante a función de caché de cada disco. A caché de lectura dos controladores RAID mellora significativamente o rendemento de lectura da matriz de discos cando se len os mesmos datos nun curto espazo de tempo. A velocidade máxima real de lectura e escritura de toda a matriz de discos está limitada polo valor máis baixo entre o ancho de banda da canle anfitrión, o cálculo de verificación da CPU do controlador e as capacidades de control do sistema (motor RAID), o ancho de banda da canle de disco e o rendemento do disco (o rendemento real combinado de todos os discos). Ademais, a falta de coincidencia entre a base de optimización das solicitudes de datos do sistema operativo e o formato RAID, como o tamaño do bloque das solicitudes de E/S que non se aliña co tamaño do segmento RAID, pode afectar significativamente o rendemento da matriz de discos.

Variacións de rendemento dos sistemas de almacenamento de matrices de discos tradicionais en acceso múltiple

En escenarios de acceso a múltiples hosts, o rendemento das matrices de discos diminúe en comparación coas conexións de host único. Nos sistemas de almacenamento de matriz de discos a pequena escala, que normalmente teñen un par único ou redundante de controladores de matriz de discos e un número limitado de discos conectados, o rendemento vese afectado polos fluxos de datos non ordenados de varios hosts. Isto leva a un aumento dos tempos de busca do disco, a información de cabeceira e cola dos segmentos de datos e a fragmentación de datos para procesos de lectura, fusión, cálculos de verificación e reescritura. En consecuencia, o rendemento do almacenamento diminúe a medida que se conectan máis hosts.

Nos sistemas de almacenamento de matrices de discos a gran escala, a degradación do rendemento é diferente da das matrices de discos a pequena escala. Estes sistemas a gran escala usan unha estrutura de bus ou unha estrutura de conmutación de punto cruzado para conectar varios subsistemas de almacenamento (matrices de discos) e inclúen cachés de gran capacidade e módulos de conexión de host (similares aos concentradores ou switches de canles) para obter máis hosts dentro do bus ou de conmutación. estrutura. O rendemento depende en gran medida da caché nas aplicacións de procesamento de transaccións, pero ten unha eficacia limitada en escenarios de datos multimedia. Aínda que os subsistemas de matriz de discos internos destes sistemas a gran escala funcionan de forma relativamente independente, unha única unidade lóxica só se constrúe dentro dun único subsistema de disco. Así, o rendemento dunha única unidade lóxica segue sendo baixo.

En conclusión, as matrices de discos a pequena escala experimentan un descenso do rendemento debido a fluxos de datos desordenados, mentres que as matrices de discos a gran escala con múltiples subsistemas de matrices de discos independentes poden soportar máis hosts pero aínda teñen limitacións para as aplicacións de datos multimedia. Por outra banda, os sistemas de almacenamento NAS baseados na tecnoloxía RAID tradicional e que utilizan protocolos NFS e CIFS para compartir almacenamento con usuarios externos mediante conexións Ethernet experimentan menos degradación do rendemento en contornas de acceso a múltiples hosts. Os sistemas de almacenamento NAS optimizan a transmisión de datos mediante múltiples transferencias paralelas de TCP/IP, o que permite unha velocidade máxima compartida duns 60 MB/s nun único sistema de almacenamento NAS. O uso de conexións Ethernet permite que os datos se escriban de forma óptima no sistema de disco despois da xestión e reordenación do sistema operativo ou do software de xestión de datos no servidor delgado. Polo tanto, o propio sistema de discos non experimenta unha degradación significativa do rendemento, polo que o almacenamento NAS é axeitado para aplicacións que requiren compartir datos.


Hora de publicación: 17-Xul-2023