четвер, 26 березня 2015 р.

Новая программа решит проблему обработки большого потока данных в астрономии

Это почти обряд посвящения в физике и астрономии. Ученые проводят годы, строя фантастический новый инструмент. Затем, когда долгожданное устройство, наконец, приближается к завершению, начинается паника: а как будет обрабатываться поток данных?

Подобная ситуация возникла и сейчас с радиотелескопом Square Kilometer Array (SKA), строительство которого планируется в Африке и Австралии, который будет иметь беспрецедентную возможность передавать данные - много точек, с большим количеством деталей о местоположении и свойствах звезд, галактик и гигантских облаков газообразного водорода.

В исследовании, опубликованном в The Astronomical Journal, команда ученых из Университета Висконсин-Мэдисон разработала новый, более быстрый подход к анализу всех этих данных.

Водородные облака могут показаться менее привлекательными, чем другие цели радиотелескопов, такие как вспышки звездообразования в галактике. Но водород имеет фундаментальное значение для понимания космоса, как самое распространенное вещество во Вселенной, наполняющее собой звезды и галактики.

Пока астрономы ожидают заполучить готовый SKA, который будет введен в эксплуатацию в середине 2020-х годов, ведутся дискуссии о том, что делать с обработкой данных. "Мы не имеем достаточно серверов для хранения данных. Нам даже не хватает электроэнергии для питания серверов. И никто не имеет четкого представления, как обрабатывать эту волну данных, чтобы суметь разобраться в ней", говорит Роберт Линднер.

Во многих отношениях, данные о водороде от SKA будут напоминать значительно более быстрый поток, чем поступающий из существующих радиотелескопов. Наименьшая единица, или пиксель, будет хранить каждый бит информации о всем водороде непосредственно на крошечном участке неба. Во-первых, не ясно, этот пиксель регистрирует одно облако водорода или многие, но ответ на этот вопрос является основой для понимания фактического расположения всего водорода.

Люди визуально способны это растолковать, но на интерпретацию каждого пикселя требуется от 20 до 30 минут, используя лучшие существующие модели и программное обеспечение. Таким образом, Линднер спрашивает: как будут астрономы интерпретировать миллионы пикселей данных водорода, которые будет предоставлять SKA?

В новом исследовании, Линднер и его коллеги представили вычислительный подход, который решает проблему местоположения водорода только за секунду машинного времени.

В исследовании помог Карлос Вера-Сиро из UW-Madison с программным обеспечением, которое может быть обучено интерпретировать проблему "сколько облаков за пикселем?" Программное обеспечение компьютерной сети с высокой пропускной способностью в UW-Madison под названием HTCondor. Аспирант Клэр Мюррей представила ручной анализ для сравнения.

Эти сравнения показали, что новая система сможет поглотить потоп данных SKA, и результат будет достаточно точным, чтобы заменить ручную обработку.

В конечном счете, цель состоит в том, чтобы исследовать формирование звезд и галактик, говорит Линднер. "Мы пытаемся понять начальные условия образования звезд - как, где, когда они начинаются? Как понять, что звезда собирается образоваться здесь, а не там? С автоматической обработкой данных мы не будем ограничены во времени".

"Давайте все исследования через SKA. Даже если каждый пиксель будет распознан не столь точно как при человеческом расчете, мы можем сделать в тысячу и миллион раз больше пикселей, что в среднем пойдет в нашу пользу".

Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.