Data Handling Optimization in Russian Data Lake Prototype › Научные исследования в СПбГУ

Ссылки

https://iopscience.iop.org/article/10.1088/1742-6596/2438/1/012021/pdf
Конечная издательская версия

DOI

https://doi.org/10.1088/1742-6596/2438/1/012021
Конечная издательская версия

Александр Александрович Алексеев
Андрей Константинович Кирьянов
Алексей Анатольевич Климентов
Татьяна Корчуганова
Валерий Митцин
Данила Олейник
Артём Петросян
Сергей Смирнов
Андрей Константинович Зароченцев

Эксперименты ЦЕРН готовятся к эре HL-LHC, которая принесет беспрецедентный объем научных данных. Эти данные должны будут храниться и обрабатываться тысячами физиков, но ожидаемый рост ресурсов далеко не соответствует экстраполированным требованиям существующих моделей как с точки зрения объема хранилища, так и вычислительной мощности. Отдельные вычислительные ресурсы, такие как высокопроизводительные компьютеры и университетские кластеры, могут обеспечивать дополнительные вычислительные циклы, но не имеют достаточного отдельного хранилища. В этой статье мы представим основные архитектурные идеи, детали развертывания и результаты тестирования, уделив особое внимание нашим исследованиям по созданию прототипа распределенной системы обработки и хранения данных с упором на оптимизацию эффективности ресурсов за счет снижения накладных расходов на доступ к данным. Описываемый прототип построен с использованием территориально распределенных площадок WLCG и университетских кластеров в России.

Переведенное название	Оптимизация обработки данных в российском прототипе озера данных
Язык оригинала	английский
Номер статьи	012021
Число страниц	6
Журнал	Journal of Physics: Conference Series
Том	2438
DOI	https://doi.org/10.1088/1742-6596/2438/1/012021
Состояние	Опубликовано - 15 фев 2023
Событие	20th International Workshop on Advanced Computing and Analysis Techniques in Physics Research - Virtual and IBS Science Culture Center, Daejeon, South Korea, Daejeon, Республика Корея Продолжительность: 29 ноя 2021 → 3 дек 2021 Номер конференции: 2021 https://indico.cern.ch/event/855454/

Предметные области Scopus

Информационные системы
Компьютерные сети и коммуникации

Области исследований

LHC, Big data, GRID, Data Lake

ID: 102984757