Saturday, February 02, 2008

PALIMPEST: SERVICIO DE BASE DE DATOS DE GOOGLE PARA CIENTIFICOS

Fuentes de Google han desvelado que el dominio http://research.google.com será pronto un espacio para albergar terabytes de datos científicos open-source. El almacenamiento será gratuito para los científicos y cualquiera podrá acceder libremente a los datos. El proyecto, conocido como Palimpsest, se dio a conocer ya a la comunidad científica en el Science Foo camp del Googleplex celebrado en agosto del año pasado. Su lanzamiento, previsto inicialmente para esta semana se ha retrasado, pero debutará pronto.

El nuevo sitio, basado en la tecnología de visualización de datos, Trendalyzer, adquirida por Google, ofrecerá también algoritmos para el análisis e investigación de la información, y contará con herramientas de comentarios y anotaciones similares a las de Youtube.

Este espacio de almacenamiento cubrirá una necesidad fundamental de los científicos que quieren compartir abiertamente sus datos y permitirá que cualquiera pueda tener acceso a una cantidad de datos sin precedentes. Por ejemplo, dos de los conjuntos de datos que se incluirán son 120 terabytes de datos de telescopio espacial Hubble y de imágenes del Palimpsesto de Arquímedes, manuscrito del siglo X que ha inspirado el proyecto de almacenamiento de datos de Google.

Una de las principales dificultades relacionadas con estos gigantescos conjuntos de datos es como pasarlos a Google. El método de distribución preferido por Pimm es el de las unidades de disco. Uno de los asistentes al SciFoo lo describió del siguiente modo: el personal de Google está preparando una matriz de discos 3TB (Linux RAID5). La matriz se enviará en un “maletín” a cualquiera que quiera enviar sus datos a Google. El interesado proporcionará a Google el árbol de archivos y la compañía cogerá los datos de la unidad.

Parece ser que Google está buscando conjuntos de datos interesantes, por lo que

No comments: