Наука о данных

MongoDB: моделирование данных

10.02.2022

Предыдущая часть: “MongoDB: введение, преимущества и настройка среды”

Данные в MongoDB обладают гибкой схемой хранения документов в одной коллекции. Документам не обязательно иметь одинаковый набор полей или структуру. Общие поля в них могут содержать разные типы данных.

Типы моделей данных

MongoDB предоставляет два типа моделей данных: встроенную и нормализованную. В зависимости от требований допускается применение любой из моделей при подготовке документа.

Встроенная модель данных

Данная модель, еще известная как денормализованная, позволяет встраивать все связанные данные в один документ.

Предположим, мы получаем данные о сотрудниках в трех разных документах: Personal_details, Contact и Address. Встроим все три документа в один, как показано ниже:

{
	_id: ,
	Emp_ID: "2C325A33F6"
	Personal_details:{
		First_Name: "Ivan",
		Last_Name: "Ivanov",
		Date_Of_Birth: "1980-01-01"
	},
	Contact: {
		e-mail: "ivan.ivanych@gmail.com",
		phone: "9098022338"
	},
	Address: {
		city: "Moscow",
		country: "Russia"
	}
}

Нормализованная модель данных

Данная модель позволяет обращаться к поддокументам в исходном документе, используя ссылки. Перепишем ранее рассмотренный документ согласно нормализованной модели:

Employee:

{
	_id: <ObjectId101>,
	Emp_ID: "2C325A33F6"
}

Personal_details:

{
	_id: <ObjectId102>,
	empDocID: " ObjectId101",
	First_Name: "Ivan",
	Last_Name: "Ivanov",
	Date_Of_Birth: "1980-01-01"
}

Contact:

{
	_id: <ObjectId103>,
	empDocID: " ObjectId101",
	e-mail: "ivan.ivanych@gmail.com",
	phone: "9098022338"
}

Address:

{
	_id: <ObjectId104>,
	empDocID: " ObjectId101",
	city: "Moscow",
	country: "Russia"
}

Пример

Допустим, нужно создать проект базы данных для блога/веб-сайта клиента и показать ему отличия между схемами РСУБД и MongoDB. К каждой публикации на сайте предъявляются следующие требования. Она должна:

обладать уникальным заголовком, описанием и url;
иметь один или два тега;
сопровождаться упоминанием имени ее автора и общим количеством лайков;
иметь комментарии пользователей с их именами, сообщениями, лайками, указанием даты и времени;
иметь несколько комментариев или ни одного.

Учитывая данные требования, в схеме РСУБД проект будет состоять, как минимум, из 3 таблиц:

А в схеме MongoDB он будет включать одну коллекцию Post и следующую структуру:

{
   _id: POST_ID
   title: TITLE_OF_POST, 
   description: POST_DESCRIPTION,
   by: POST_BY,
   url: URL_OF_POST,
   tags: [TAG1, TAG2, TAG3],
   likes: TOTAL_LIKES, 
   comments: [	
      {
         user:'COMMENT_BY',
         message: TEXT,
         dateCreated: DATE_TIME,
         like: LIKES 
      },
      {
         user:'COMMENT_BY',
         message: TEXT,
         dateCreated: DATE_TIME,
         like: LIKES
      }
   ]
}

Таким образом, для показа данных в РСУБД потребуется объединить три таблицы, тогда как в MongoDB данные будут отображаться только из одной коллекции.

MongoDB: моделирование данных

Типы моделей данных

Встроенная модель данных

Нормализованная модель данных

Рекомендации при проектировании схемы в MongoDB

Пример

Читайте также

Как оставаться в тренде dev-индустрии

Блоки кода с подсветкой синтаксиса на Medium

Что такое Flutter и зачем его изучать?

Тесты

Насколько хорошо вы разбираетесь в Go?

Что вы знаете об основах языка Java

Насколько хорошо вы разбираетесь в AngularJS?