Звезда и Снежинка

Anonim

Хранилище данных - это система, предназначенная для хранения и организации данных в центральных хранилищах, включая данные из других источников. Это основная концепция бизнес-аналитики в моделях реляционных баз данных, в которой используются аналитические методы для интеграции бизнес-данных в центральную базу данных.

В хранилище данных используются две общие архитектурные модели:

  • Звездная схема
  • Снежинка

Оба являются распространенными многомерными моделями баз данных, используемыми для удовлетворения потребностей больших баз данных в аналитических целях на реальных хранилищах данных.

Мы представляем беспристрастное сравнение между ними, чтобы лучше понять, какой из них лучше другого.

Что такое схема звезд?

Это наиболее распространенная и широко распространенная архитектурная модель, используемая для разработки хранилищ данных и витрин данных, в которых данные организованы в виде фактов и измерений. Это простейшая архитектурная модель, в которой одна таблица фактов используется для обозначения нескольких таблиц измерений, имитирующих звездный рисунок.

Как следует из названия, диаграмма напоминает звезду с таблицей фактов в центре и множеством таблиц измерений, исходящих от нее, создавая звездный узор.

Он также известен как Star Join Schema и хранит все атрибуты измерения в одну денормализованную таблицу фактов, чтобы быстро перемещаться по большим многомерным наборам данных, что объясняет быстрое время отклика запроса.

Что такое схема снежинок?

Это расширение звездной схемы с добавленной функциональностью. В отличие от звездной схемы таблицы размеров в схеме снежинки нормируются на несколько связанных таблиц.

Архитектурная модель представляет собой логическое расположение таблиц в иерархии отношений «один-к-одному», где несколько таблиц измерений упорядочиваются в таблицы под размерности, напоминающие узор, похожий на снежинки, отсюда и название.

Это более сложная версия звездной схемы с большим количеством объединений между таблицами измерений, которая учитывает медленное время обработки для извлечения данных, что означает медленное время ответа на запрос. Это минимизирует избыточность данных, что, в свою очередь, повышает производительность запросов.

Разница между звездой и схемой снежинки

Архитектура схемы звезд и снежинок

В реляционных базах данных звездная схема является самой простой архитектурной моделью, используемой для разработки хранилищ данных и многомерных витрин данных. Как следует из названия, модель напоминает звезду с точками, исходящими из центра, что означает, что таблица фактов - это центр, а точки - таблицы размеров. Как и другие размерные модели, он состоит из данных в виде фактов и измерений. С другой стороны, схема снежинок является более сложной архитектурной моделью, которая относится к многомерной базе данных с логическим расположением таблиц в виде снежинки.

Таблица размеров

Схема снежинки очень похожа на звездную схему, за исключением того, что она может содержать несколько таблиц измерений, которые далее нормализуются во множество связанных таблиц, называемых таблицами под размерности. Он представляет собой несколько уровней отношений, которые выходят в шаблон снежинки. Тем не менее, звездная схема хранит все связанные атрибуты измерения в одну денормализованную таблицу размеров, что упрощает ее понимание и обработку более простых запросов.

Бизнес-модель схемы звезд и снежинок

Таблица измерений не может содержать повторяющиеся строки в моделях реляционных баз данных для простого факта, что она может создавать неоднозначность при поиске. Каждая таблица должна иметь столбец или комбинацию столбцов, называемых первичным ключом, который однозначно идентифицирует все записи таблицы. Внешний ключ - это столбец или группа столбцов, которые обеспечивают связь между двумя таблицами. В схеме звезд каждая таблица измерений имеет первичный ключ, который связан с внешним ключом в таблице фактов. Бизнес-иерархия в схеме снежинки представлена ​​отношением первичного ключа / внешнего ключа между таблицами измерений.

Целостность данных в схеме звезд и снежинок

Ключевым отличием двух моделей реляционных баз данных является нормализация. Таблицы измерений в схеме звезд не являются нормированными, что означает, что бизнес-модель будет использовать относительно больше места для хранения таблиц измерений, а больше пространства означает более избыточные записи, что в конечном итоге приведет к несогласованности. С другой стороны, схема Snowflake минимизирует избыточность данных, поскольку таблицы размеров нормированы, что учитывает гораздо меньшие избыточные записи. Бизнес-иерархия и ее размеры сохраняются посредством ссылочной целостности, что означает, что отношения могут быть независимо обновлены в хранилищах данных.

Производительность запроса

Звездная схема имеет меньшее количество соединений между таблицей измерений и таблицей фактов по сравнению с схемой снежинки, которая имеет несколько объединений, что объясняет меньшую сложность запросов. Поскольку размеры в схеме звезды связаны через центральную таблицу фактов, у нее есть четкие пути соединения, которые означают быстрое время отклика запросов и быстрое время отклика, что означает лучшую производительность. Схема Snowflake имеет большее количество соединений, поэтому время запросов более длительное, что приводит к более сложным запросам, что в конечном итоге снижает производительность.

Схема звездной схемы против схемы снежинок: сравнительная таблица

Сводка звездных схем Снежинка

Оба являются наиболее распространенными и широко принятыми архитектурными моделями, используемыми для разработки хранилищ баз данных и витрин данных. Тем не менее, каждая бизнес-модель имеет свою долю плюсов и минусов.В то время как звездная схема является простейшей многомерной моделью, используемой для организации данных в фактах и ​​измерениях, она идеально подходит для разработки витрин данных, которые связаны с менее сложными отношениями. Схема снежинок является логическим представлением таблиц в многомерной базе данных, в которой размеры хранятся в таблицах под размерности. Основное различие между ними - нормализация. Таблицы размеров в схеме снежинки полностью нормализуются в несколько таблиц поиска, тогда как в схеме звезд таблицы измерений денормализуются в одну центральную таблицу фактов.