Добро пожаловать на форум, Гость!
Войдите или зарегистрируйтесь!
Имя пользователя:   Пароль:  
Запомнить меня 




Начать новую тему Ответить на тему   [ 1 сообщение ] 
Автор Сообщение
 Заголовок сообщения: Сутки за 20 минут
СообщениеДобавлено: 03 мар 2010, 17:09 
Эцилоп
Аватар пользователя
Статус: Не в сети

GeoIP: Kyrgyzstan

Сообщений: 69

Зарегистрирован: 01 мар 2010, 15:38
Благодарил (а): 0 раз.
Поблагодарили: 4 раз.
Специалисты IBM разработали математический алгоритм, способный в считанные минуты проанализировать несколько терабайт исходных данных, что, по словам его авторов, позволит значительно ускорить такие процессы, как прогнозирование погоды или оценка расходов электричества.

Алгоритм создан сотрудниками цюрихской исследовательской лаборатории IBM. Он способен выполнить сортировку, корреляцию и анализ миллионов неупорядоченных наборов данных. Как отмечает специалист IBM Костас Бекас, в обычном случае подобная задача требует нескольких дней машинного времени суперкомпьютера.

Реализация алгоритма занимает всего несколько тысяч строк кода. По словам исследователей, он упростит выявление тенденций при обработке данных, собранных с таких источников, как датчики или интеллектуальные счетчики. Его можно будет применять для анализа растущих объемов данных, например для определения тенденций использования электричества, для расчетов и прогнозирования уровней загрязнения воздуха или воды. Он также применим для обработки данных с мировых финансовых рынков с оценкой уровня индивидуального и коллективного риска.

"Область наших интересов - измерение качества данных", - указывает Бекас, добавляя, что для эффективного анализа обширных наборов данных сегодня требуются новые математические методы, позволяющие снизить вычислительную сложность.

Алгоритм реализует методы калибровки данных и статистического анализа, позволяющие оценивать модели измерения и скрытые взаимоотношения между наборами данных. На исследовательский этап проекта у IBM ушло около двух лет.

Как утверждают в IBM, применение алгоритма позволит снизить расходы компаний за счет его высокой энергоэффективности. При исполнении на установленной в немецком исследовательском центре Forschungszentrum Julich системе Blue Gene/P Solution алгоритм обработал 9 Тбайт данных менее чем за 20 минут. Для сравнения, анализ того же объема информации традиционными способами занял бы день машинного времени этого суперкомпьютера, работающего на пике производительности, что соответственно увеличило бы расходы на электроэнергию.

Согласно списку Top 500.org от ноября прошлого года, Blue Gene/P - четвертый по быстродействию суперкомпьютер в мире. Он оснащен 294 912 процессорными ядрами IBM Power, совокупная пиковая производительность которых составляет 1 PFLOPS.

"Традиционный подход к анализу состоит в том, чтобы индивидуально обрабатывать каждый из множества наборов данных, - отмечает Элени Працини, менеджер по математическим и вычислительным наукам исследовательского подразделения IBM. - Новый же алгоритм сравнивает наборы данных друг с другом, открывая в числе прочего возможность для предприятий выявлять скрытые тенденции в таких областях, как управление рисками и финансовые портфели".

Как указывает Працини, предприятиям неизбежно понадобятся более быстрые механизмы бизнес-аналитики по мере того, как для вычислений начинают применяться все новые устройства и серверам приходится обрабатывать все более крупные объемы данных.

Теперь, когда подтверждена работоспособность алгоритма на тестовых наборах данных, лаборатория приступила к совместному с глобальным сервисным подразделением IBM внедрению разработки при оказании конкретных услуг. Со временем алгоритм может быть реализован в некоторых приложениях IBM, в частности в ПО статистического анализа SPSS.


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ 1 сообщение ] 
   Похожие темы   Автор   Ответов   Просмотров   Последнее сообщение 
Перенесенная ^_^

в форуме Linux

root

3

38

02 мар 2010, 16:15

Gen1us2k Перейти к последнему сообщению

Нет новых непрочитанных сообщений в этой теме Опубликован пакетный менеджер GNU Guix 0.12 и дистрибутив...

в форуме Новости *nix

[Ботя]

0

396

23 дек 2016, 13:30

Гость Перейти к последнему сообщению

Нет новых непрочитанных сообщений в этой теме Компания Microsoft представила виртуальную файловую систе...

в форуме Новости *nix

[Ботя]

0

329

04 фев 2017, 03:30

Гость Перейти к последнему сообщению



Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Собрано Raven. Русская поддержка phpBB
phpBB SEO