Ссылки

DOI

Эксперименты ЦЕРН готовятся к эре HL-LHC, которая принесет беспрецедентный объем научных данных. Эти данные должны будут храниться и обрабатываться тысячами физиков, но ожидаемый рост ресурсов далеко не соответствует экстраполированным требованиям существующих моделей как с точки зрения объема хранилища, так и вычислительной мощности. Отдельные вычислительные ресурсы, такие как высокопроизводительные компьютеры и университетские кластеры, могут обеспечивать дополнительные вычислительные циклы, но не имеют достаточного отдельного хранилища. В этой статье мы представим основные архитектурные идеи, детали развертывания и результаты тестирования, уделив особое внимание нашим исследованиям по созданию прототипа распределенной системы обработки и хранения данных с упором на оптимизацию эффективности ресурсов за счет снижения накладных расходов на доступ к данным. Описываемый прототип построен с использованием территориально распределенных площадок WLCG и университетских кластеров в России.
Переведенное названиеОптимизация обработки данных в российском прототипе озера данных
Язык оригиналаанглийский
Номер статьи012021
Число страниц6
ЖурналJournal of Physics: Conference Series
Том2438
DOI
СостояниеОпубликовано - 15 фев 2023
Событие20th International Workshop on Advanced Computing and Analysis Techniques in Physics Research - Virtual and IBS Science Culture Center, Daejeon, South Korea, Daejeon, Республика Корея
Продолжительность: 29 ноя 20213 дек 2021
Номер конференции: 2021
https://indico.cern.ch/event/855454/

    Предметные области Scopus

  • Информационные системы
  • Компьютерные сети и коммуникации

    Области исследований

  • LHC, Big data, GRID, Data Lake

ID: 102984757