2017-10-23
Microsoft agregará supercomputadoras Cray a su servicio de computación en la nube Azure para manejar las necesidades de aquellos con cargas de trabajo de computación de alto rendimiento (HPC).
Los sistemas de computación en la nube como Azure se pueden usar para construir grandes máquinas tipo clúster para cargas de trabajo distribuidas de alto rendimiento. Combinado con FPGA y GPU, esto los hace competitivos, algunas veces, con las supercomputadoras tradicionales.
Pero a veces, una carga de trabajo realmente necesita interconexiones y almacenamiento de alto rendimiento y baja latencia que son el sello distintivo de las supercomputadoras "reales". Es por eso que Microsoft está agregando clústeres de superordenadores Cray XC y Cray CS junto con el almacenamiento de ClusterStor a su línea Azure. Las máquinas están diseñadas para tareas tales como análisis, modelado climático, simulaciones de ingeniería e investigación científica y médica. Las compañías prevén que los clientes combinen Cray HPC con cargas de trabajo de Azure para ofrecer un mejor rendimiento y una mayor escalabilidad que Cray o Azure pueden ofrecer solos.
Las máquinas Cray usan una mezcla de procesadores Intel Xeon, GPU Nvidia Tesla P100, coprocesadores Xeon Phi y FPGA, con varias interconexiones diferentes, incluyendo InfiniBand (también utilizado en Azure) y la propia interconexión Aries de Cray. Esto permite que los procesadores dentro de cada superordenador se comuniquen entre sí con más ancho de banda y menor latencia que si usaran Ethernet común o de jardín. Hay muchas formas de conectar los procesadores entre sí, y también las máquinas dentro de un clúster, con Cray que ofrece varias configuraciones y la topología óptima del sistema según las necesidades de la carga de trabajo.
A diferencia de la mayoría de los recursos de cálculo de Azure, que generalmente se comparten entre los clientes, las supercomputadoras Cray serán recursos dedicados. Esto sugiere que Microsoft no ofrecerá una forma de compartir el tiempo o tomar prestado temporalmente una supercomputadora. Más bien, es una forma para que los usuarios de supercomputadoras coloquen sus sistemas con Azure para obtener la latencia más baja y la conexión de mayor ancho de banda a las capacidades informáticas de Azure, en lugar de tener que tenerlas en sus instalaciones.