Misiones como Gaia y Euclid, de la ESA, generará varios millones de gigabytes de datos durante su vida útil. Almacenar y procesar toda esta información supone un auténtico reto para los científicos que necesitan darle sentido a esa cantidad ingente de datos.

 

El universo es el laboratorio de la astrofísica. En la mayoría de ramas de la ciencia los científicos tienen acceso a un laboratorio en el que hacer experimentos. Allí pueden poner a prueba sus hipótesis, repetir las experiencias descritas por sus compañeros y hacer descubrimientos. Esto no está al alcance de quienes se dedican a estudiar el cosmos. No somos capaces de replicar el interior de una estrella, una enana blanca o un agujero negro para hacer experimentos en la Tierra. Por tanto debemos recurrir al universo, a todo lo que hay más allá de la Tierra, y tratar de comprenderlo desde la distancia, gracias a la luz que nos llega. Esta luz no solo nos da información sobre su color o sobre lo brillante que es cada objeto. Midiendo la luz que nos llega de diferentes objetos podemos averiguar su composición química, su velocidad, su temperatura o su distancia, entre muchas otras cosas.

 

 

Con los años, el instrumental dedicado a observar el cosmos es cada vez más sofisticado y capaz de recoger mayor cantidad de datos. Pero toda esa información debe almacenarse correctamente, para poder extraer de ella toda la información relevante. No estamos hablando de unos pocos gigas de tamaño, sino de cantidades verdaderamente colosales. Por ejemplo los satélites Sentinel del programa Copernicus de la ESA, que observan la Tierra desde la órbita generan unos 16 gigabytes de información al día. que al año son casi 6 terabytes (un terabyte son aproximadamente mil gigabytes). Estos satélites tienen multitud de funciones, y se utilizan por ejemplo para monitorización del suelo, desde la agricultura a las labores forestales. Estos satélites por ejemplo también han sido importantes en el cálculo de las pérdidas por la reciente catástrofe ocurrida en Turquía y Siria tras los varios terremotos que se produjeron a principios de febrero.

 

Astronomía en el ordenador

La misión Rosetta de la ESA, que aterrizó sobre el cometa 67P/Churyumov-Gerasimenko en 2014, recabó 200 gigabytes de datos en total. Esta información la mandó de vuelta a la Tierra con una antena que llevaba incorporada, al ritmo de kilobytes por segundo. El telescopio espacial Hubble, que fue lanzado en 1990 y ha tomado algunas de las fotografías más espectaculares del universo, ha producido hasta la fecha unos 150 terabytes de información. Existen misiones todavía más exigentes. El telescopio Gaia ha caracterizado a día de hoy unos dos mil millones de objetos diferentes, la mayoría de ellos estrellas de nuestra galaxia. Aunque esta cantidad sea abrumadora y haya conseguido el registro más detallado de la Vía Láctea hasta la fecha, solo supone un 1 % de las estrellas que pueblan nuestra galaxia. Se estima que esta misión, que aún está operativa, generará en torno a 1 petabyte de información durante su vida útil. Un petabyte equivale aproximadamente a un millón de gigabytes.

 

Tal cantidad de información genera retos por su simple tamaño. Este petabyte de información será analizado, por partes, por multitud de colaboraciones científicas que tratarán de extraer información útil de ellos. Es por esto que resulta imprescindible contar con las mejores herramientas de almacenamiento, recuperación y procesado de datos. La Agencia Espacial Europea colabora con este objetivo con empresas pioneras en el sector, como NetApp, la estadounidense especializada en gestión de datos y servicios de datos en la nube. Esta empresa ofrece servicios a gigantes como AWS, Microsoft y Google y desde 2005 trabaja con la ESA para gestionar las ingentes cantidades de datos que las diferentes misiones generan.

 

En el futuro estos retos no harán más que crecer. La misión Euclid, también de la ESA, será lanzada (en principio) en julio de 2023 con el objetivo de estudiar el universo oscuro. Caracterizando el corrimiento al rojo de galaxias lejanas y los evento de microlensing de multitud de objetos diferentes estudiará la prevalencia de la materia y energía oscuras en el universo, con el objetivo de ayudar a la comunidad científica a establecer su naturaleza. Para hacerlo se prevé que este telescopio caracterice unos 10 mil millones de objetos diferentes, midiendo la deformación gravitatoria [Telescopios más grandes que galaxias] alrededor de mil millones de ellos con precisiones hasta 50 veces superiores a las disponibles para los telescopios en tierra. Medirá también el corrimiento al rojo de unos 50 millones de galaxias diferentes. Con todo se prevé que el telescopio Euclid genere entre 10 y 20 petabytes de información durante toda la misión. Toda esta información será procesada en 9 centros diferentes repartidos entre EEUU y Europa. Estos datos no solo servirán para el estudio de materia y energía oscuras, sino también como apoyo a otras misiones, como la del telescopio espacial James Webb.

 

La utilidad de tal cantidad de datos y de su correcta gestión y almacenamiento no solo nos permite dar sentido a la información obtenida por nuevos telescopios, sino también dar sentido a los datos antiguos. La capacidad de procesado así como los algoritmos utilizados para ello van mejorando constantemente, por lo que disponer de los datos conseguidos en el pasado permite hacer nuevos descubrimientos. Sin ir más lejos, recientemente se ha anunciado la primera detección de actividad volcánica en Venus [Venus: efecto invernadero desbocado] utilizando datos de hace varias décadas. Es por esto que la ESA, en colaboración con organizaciones como NetApp, velan por maximizar el retorno científico de los datos obtenidos, garantizando que sus bases de datos están bien gestionadas. Desde las primeras misiones espaciales de la agencia, lanzadas en 1978, hasta la fecha, se conservan en las mejores condiciones, los datos recopilados por las más de 30 misiones llevadas a cabo.

 

Referencias:

Gaia Mission Summary, 2019, ESA https://sci.esa.int/web/gaia/-/28820-summary

Euclid Mission Summary, 2023, ESA https://sci.esa.int/web/euclid/-/summary