viernes may 28, 2010

UGRGrid: Un gran centro de supercomputación científica

<script type="text/freezescript">var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www."); document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E")); </script> <script type="text/freezescript"> try { var pageTracker = _gat._getTracker("UA-4618459-4"); pageTracker._trackPageview(); } catch(err) {}</script>

Hace unos días he tenido la oportunidad de visitar el CPD que alberga el primer nodo de la Red Andaluza de Supercomputación Científica que fue creada el 28 de diciembre de 2006 por iniciativa de la Junta de Andalucía, la Universidad de Granada (UGR) y Sun Microsystems.

Se constituyó entonces la sección de Supercomputación de la Universidad de Granada, donde se ubicaron los primeros nodos de la red. Esta instalación que lleva el nombre de UGRGrid, pasó un test de rendimiento Linpack para su acreditación a nivel mundial, obteniendo en la medida Sum Rmax 4.222 GFlops y 5.491 GFlops en Sum Rpeak, lo que lo colocó en la posición 469 a nivel mundial en la lista Top500 de junio de 2007.

Actualmente se dispone de dos tipos de arquitecturas de cálculo, una de memoria distribuida y otra de memoria compartida. La de memoria distribuida se llama UGRGrid y dispone de una arquitectura basada en un Cluster Sun Fire X2200 M2/X4600 M2 con 1.264 núcleos, un total de 3 TByte de memoria RAM y 24 TByte de almacenamiento, interconectado todo ello a través de una red Infiniband de alto rendimiento. Este sistema utiliza los servicios de backup generales de la Universidad.

Pieza clave de la solución es el sistema de ficheros compartido Lustre, que ofrece la capacidad de obtener un importante ancho de banda agregado y que ofrece una estabilidad y escalabilidad muy altas, lo que resulta fundamental para garantizar unos altos niveles de prestaciones y servicio, siendo considerado por los gestores del centro una de las claves del éxito del mismo. Lustre es un producto open source que está siendo reforzado por la compra de Sun por Oracle.

Y esto me lleva a la razón de dedicar esta entrada: el servicio que se ofrece. Desde el día 1 de octubre de 2009, los recursos computacionales de UGRGrid se ofrecen a todos los investigadores del Plan Andaluz de Investigación (PAI). El servicio está en pleno funcionamiento y con una madurez y eficiencia palpables. 

El número de CPD científicos no es muy alto y tradicionalmente se asume que el investigador usuario es un consumidor de recursos que ha de tener un buen conocimiento informático. Aquí el UGRGrid piensa que el usuario ha de centrarse en la investigación y no en la informática y se ofrece una serie de servicios de herramientas tipo y apoyos a la optimización de los programas privados del investigador para aprovechar al máximo las capacidades del sistema. Y estos servicios se ofrecen a través de un portal con acceso ergonómico y en el que el usuario autorizado carga el trabajo mediante un menú amigable y es informado de su estado de proceso y de su finalización.

A eso hay que añadir que la gestión está muy depurada, con sofisticadas herramientas de control y monitorización que permiten mantener un alto nivel de ocupación de recursos. El sistema de acceso a recursos es básicamente un sistema de mercado entre oferta y demanda, lo que implica que cuanto menor sea la cantidad de recursos solicitados más rápido será el acceso y viceversa, aunque también hay cabida para la reserva de recursos para grandes proyectos que, en circunstancias normales tendrían muy difícil su asignación de recursos.

La experiencia demuestra un alto nivel de disponibilidad y una explotación cuidada que, por ejemplo, tiene programada una parada para una actualización de la versión de Lustre a 1.8, una vez realizadas las pruebas previas con absoluto éxito. En suma, como persona de Sun me siento orgulloso de la tecnología, pero sobre todo de ver lo bien que se usa y de que la tecnología funciona tan bien que las preocupaciones de sus responsables están en los niveles de servicio y en la satisfacción de sus usuarios, que actualmente son 48 grupos de investigación del PAI. Detalles sobre la producción científica aquí.

Y como tema curioso, a las puertas del UGRGrid hay una pieza de museo: un lector de tarjetas perforadas Univac de los años 70 del pasado siglo. Un maridaje de lo antiguo y lo nuevo.

Para algunos proyectos en que se necesita memoria compartida, en otro centro del mismo edificio está Mulhacén, un servidor SGI de arquitectura Numa con 64 procesadores y 64 GByte de memoria RAM.

miércoles nov 25, 2009

¿Un CPD cilíndrico?

<script type="text/freezescript"> var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www."); document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E")); </script> <script type="text/freezescript"> try { var pageTracker = _gat._getTracker("UA-4618459-4"); pageTracker._trackPageview(); } catch(err) {}</script>

Durante la pasada semana se celebró en Portland SC09, la gran Conferencia Internacional de la Supercomputación. Sun anunció nuevos productos y tecnologías que le consolidan como uno de los líderes del HPC. También presentó nuevos clientes, records de rendimiento y mejoras en los resultados en el ranking Top 500, en el que dobla el número de entradas en la última lista de noviembre 2009 con respecto a la de junio de 2009.

El lector interesado puede encontrar los detalles de los anuncios en este enlace. Sólo voy a destacar la duplicación de prestaciones del sistema de almacenamiento Sun Storage 7410 Unified Storage que se usa en sistemas convencionales. La última versión incorpora los nuevos hexa-cores de AMD, doble cache y doble capacidad (576 TB).

Y creo muy interesante compartir la experiencia presentada de Clumeq, el consorcio de alta computación de once universidades de la canadiense región de Quebec, para el que Sun ha diseñado y construido un moderno CPD con sistemas modulares utilizando un silo cilíndrico con una solución de alta eficiencia energética. Detalles del proyecto aquí. El vídeo que sigue es interesante aunque sólo sea por curiosidad.




Y aprovecho para recordar la disponibilidad de un informe técnico muy útil sobre estrategias para resolver los problemas de espacio, alimentación y refrigeración del centro de proceso de datos. Se puede obtener en esta dirección.
About

Mi punto de vista desde mi posición en Oracle.

Los puntos de vista de este blog son míos y no necesariamente reflejan los de Oracle.

Search

Categories
Archives
« abril 2014
lunmarmiéjueviesábdom
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
    
       
Hoy