puede ejecutar cargas de trabajo genómico en Google Cloud hasta 25% más rápido y 34% con menor costo con procesadores Intel Xeon
Como resultado de una colaboración con Intel y Google Cloud para acelerar la investigación genómica, el Broad Institute del MIT y Harvard han optimizado sus flujos de trabajo para instancias rápidas y rentables de Google N1 y N2.
En comparación con el despliegue inicial de las cargas de trabajo en Google Cloud, la colaboración dio lugar a una reducción del 85% en el costo del procesamiento de datos tras la optimización. Para adaptarse a un aumento espectacular de la generación de datos genómicos y de la demanda de investigación computacional, el Broad Institute migró sus cargas de trabajo a instancias de Google Cloud N2.
“Sabíamos que la nube permitiría un nivel completamente nuevo de coordinación y colaboración de datos, y que podríamos trabajar con otros para crear un ecosistema de datos basado en la nube, en el que los investigadores podrían combinar sus flujos de trabajo en más de los datos que generaran con otros conjuntos de datos en experimentos computacionales más ricos y potentes.” – Geraldine Van der Auwera, directora de divulgación y comunicación de la Plataforma de Ciencias de los Datos del Broad Institute del MIT y Harvard.
Mediante la modularización de sus flujos de trabajo de canalización, el dimensionamiento adecuado de las instancias de nube en función de las necesidades de la carga de trabajo y la optimización para los procesadores escalables de Intel® Xeon®, los usuarios del Broad Institute pueden ejecutar sus flujos de trabajo genómico en Google Cloud aproximadamente un 25% más rápido y a un coste un 34% menor mediante la implementación en instancias N2 con procesadores escalables Xeon.
Intel mantiene una colaboración con el Broad Institute desde 2017, ayudando a optimizar los procesos del instituto y el Genome Analysis Toolkit (GATK) con las bibliotecas de Intel, incluida la Intel® Genomics Kernel Library. Juntos, también gestionan el Centro Intel-Broad para la Ingeniería de Datos Genómicos, un proyecto que permite a investigadores e ingenieros de software de todo el mundo construir, optimizar y compartir ampliamente nuevas herramientas e infraestructuras que ayuden a los científicos a integrar y procesar datos genómicos.
Intel ha colaborado con el Broad Institute para ayudar a optimizar sus procesos en Google Cloud. Por ejemplo, los kernels específicos del Genome Analytics Toolkit están optimizados para operaciones vectoriales con Intel® Advanced Vector Extensions 512 (Intel® AVX-512). Algunas funciones de almacenamiento optimizadas utilizan la Intel® Intelligent Storage Acceleration Library (Intel® ISA-L).
Con el objetivo de hacer realidad una visión más amplia del ecosistema de las ciencias naturales, el Broad Institute, Microsoft y Verily desarrollaron conjuntamente la plataforma Terra, una plataforma escalable y segura para que los investigadores biomédicos de todo el mundo puedan acceder a los datos, ejecutar herramientas de análisis y colaborar.
Terra está construida sobre una infraestructura en la nube, lo que permite al Broad Institute ampliarse fácilmente y dotar a la comunidad investigadora de nuevas capacidades en beneficio de la investigación de soluciones para las enfermedades humanas.
¿Por qué es importante?
La genómica ha cambiado la forma en que se realiza la ciencia biológica. Con la ayuda de Intel y Google Cloud, el Broad Institute está a la vanguardia de la innovación, permitiendo y ayudando a acelerar la investigación genómica. Al migrar a la nube y optimizar las cargas de trabajo para las instancias de Google Cloud, el Broad Institute resolvió sus desafíos de capacidad de almacenamiento y capacidad computacional de manera escalable y con visión de futuro.
La construcción colaborativa de la plataforma Terra permitió al Broad Institute potenciar no sólo a sus equipos de investigación, sino a los científicos de todo el mundo, para que pudieran aprovechar estas herramientas y conductos optimizados, y habilitar un ecosistema de datos federado que abre muchas posibilidades nuevas e interesantes para la investigación biomédica.
Más información | Intel