При организации хранилища данных основными идеями являются:
Почему стали хранить избыточные данные? Ответ очень прост - сокращение времени доступа к данным. Это достигается в два этапа. Первый этап - отказ от нормализации более чем "третья нормальная форма". Нормализация подобна операции архивирования, основной задачей которой является обеспечение как можно более компактного размещения информации на носителе, тогда как отказ от нормальности приводит к существенному росту объема сохраненных данных. Основным мотивом отказа от нормальности данных стало то, что при анализе данных требуются ненормализованные данные. При избыточном хранении данных сокращается время доступа к ненормализованным данным. Второй этап - сохранение агрегированных данных. При увеличении размера таблиц, операции объединения становятся все более неэффективными и требуют все больше ресурсов (повышенная загрузка процессора, увеличение времени на объединение, требуются высококлассные программисты и т.д.) на обработку данных. Для снижения нагрузки на оборудование и вычислительные ресурсы агрегированные данные, так же как и прочие данные, стали сохранять в хранилище, что сократило время получения агрегированных данных для анализа.
Для организации многомерной БД в основном используют схему звезда или схему снежинка. Схема снежинка получается добавлением консольных таблиц к схеме звезда. Пример схемы представлен на рисунке:

Рассмотрим схему звезда. Основная часть состоит в размещении «таблицы фактов» в центре звезды, а таблицы измерений находятся по краям. Таблица фактов и таблицы измерений связаны идентифицирующими связями, при этом первичные ключи таблицы измерений мигрируют в таблицу фактов в качестве внешних ключей. При организации связи таблиц измерений и консольных последняя является родительской, а таблица измерений является дочерней.
При создании таблиц со схемой звезда необходимо проанализировать бизнес-правила предметной области с целью выяснения центрального вопроса. Моделирование должно начинаться с центрального вопроса. Данные необходимые для ответа на этот вопрос должны помещаться в центральную таблицу факта. В таблицу фактов не выгодно помещать повторяемые текстовые данные, так как это приведет к значительному росту размера таблицы. Текстовые данные помещают обычно в таблицы измерений.
Таблицы измерений содержат редко изменяемые данные (справочники), которые содержат как минимум одно описательное поле и могут содержать поля указывающего на родителя данной таблицы (консольные таблицы).
Схема снежинка более тяготеет к нормальности данных. При использовании схемы снежинка снижается производительность и понимание функционирования многомерной БД.
Выделяют несколько технологий реализации хранилищ:
Кратко рассмотрим виды хранилищ и их схемы. Урок по проектированию хранилища данных можно посмотреть тут (ссылка).
Виртуальное хранилище представляет собой витрину данных, которая собирает данные из разных источников.

Основные преимущества:
Недостатки:
Борьба за доступность к хранилищу и увеличение периода времени привели к появлению других концепций для хранения данных.
Общее хранилище представляет собой хранилище, куда копируются все виды данных.

Преимущества:
Недостатки:
Распределенное хранилище представлено на схеме.

Преимущества:
Недостатки:
Гибридное хранилище представляет 3 уровневую систему хранения данных.

Преимущества:
Недостатки: