Data Handling Optimization in Russian Data Lake Prototype

Links

https://iopscience.iop.org/article/10.1088/1742-6596/2438/1/012021/pdf
Final published version

DOI

https://doi.org/10.1088/1742-6596/2438/1/012021
Final published version

Александр Александрович Алексеев
Андрей Константинович Кирьянов
Алексей Анатольевич Климентов
Татьяна Корчуганова
Валерий Митцин
Данила Олейник
Артём Петросян
Сергей Смирнов
Андрей Константинович Зароченцев

Эксперименты ЦЕРН готовятся к эре HL-LHC, которая принесет беспрецедентный объем научных данных. Эти данные должны будут храниться и обрабатываться тысячами физиков, но ожидаемый рост ресурсов далеко не соответствует экстраполированным требованиям существующих моделей как с точки зрения объема хранилища, так и вычислительной мощности. Отдельные вычислительные ресурсы, такие как высокопроизводительные компьютеры и университетские кластеры, могут обеспечивать дополнительные вычислительные циклы, но не имеют достаточного отдельного хранилища. В этой статье мы представим основные архитектурные идеи, детали развертывания и результаты тестирования, уделив особое внимание нашим исследованиям по созданию прототипа распределенной системы обработки и хранения данных с упором на оптимизацию эффективности ресурсов за счет снижения накладных расходов на доступ к данным. Описываемый прототип построен с использованием территориально распределенных площадок WLCG и университетских кластеров в России.

Translated title of the contribution	Оптимизация обработки данных в российском прототипе озера данных
Original language	English
Article number	012021
Number of pages	6
Journal	Journal of Physics: Conference Series
Volume	2438
DOIs	https://doi.org/10.1088/1742-6596/2438/1/012021
State	Published - 15 Feb 2023
Event	20th International Workshop on Advanced Computing and Analysis Techniques in Physics Research - Virtual and IBS Science Culture Center, Daejeon, South Korea, Daejeon, Korea, Republic of Duration: 29 Nov 2021 → 3 Dec 2021 Conference number: 2021 https://indico.cern.ch/event/855454/

Scopus subject areas

Information Systems
Computer Networks and Communications

ID: 102984757