Alteryx - достойная платформа обработки данных?

Alteryx известна как платформа, которая сочетает в себе аналитику, обработку данных и автоматизацию процессов. Интеграция со многими инструментами может быть реализована очень легко и использована во многих примечательных случаях. Для этого обзора я использовал Google BigQuery в качестве исходной и целевой платформы.

Как начать работу:

  • Установите Alteryx и создайте GCP-аккаунт с правом заведения учетной записи на сервисе.
  • Установите инструменты BigQuery для Alteryx.
  • Пройдите аутентификацию на BigQuery по типу Service-to-Service или End user (полное руководство).

Примеры использования

Вот несколько типичных примеров использования платформы, которые демонстрируют впечатляющие возможности Alteryx.

Подготовка данных

Хотя программные средства и облачные платформы, такие как GCP, уже предлагают собственные инструменты для подготовки данных (Cloud Dataprep) или такие сервисы, как Data Transfer Service, до разнообразия инструментария Alteryx им еще далеко. На этой платформе доступны ESB-функция (интеграционная шина данных) и различные технологии аналитики/обработки данных  —  вы можете выбрать один из множества инструментов или использовать алгоритмы Python и R.

Подготовка данных без написания кода. Изображение автора

Еще один повод обратиться к Alteryx  —  доступ к локальной версии, обязательной в некоторых компаниях из-за проблем с управлением данными. В этом случае вы можете взять данные из любого источника или данные, уже загруженные в BigQuery, и подготовить их для дальнейших аналитических операций.

Рабочий процесс подготовки данных. Изображение автора

Вы можете воспользоваться одним из многих уже встроенных инструментов подготовки данных (показанных синими значками на изображении выше) или, как уже говорилось, предоставить возможность выполнить всю работу алгоритмам Python и R. После этого вы сможете загрузить данные обратно в новую таблицу в BigQuery с помощью инструмента вывода (BigQuery Output).

Интеграция данных

Вы также можете использовать Alteryx для ETL (процесса извлечения, преобразования и загрузки данных) / ELT (процесса извлечения, загрузки и преобразования данных). Как отмечалось выше, Alteryx предлагает широкий набор инструментов для связи с базами данных и интеграции данных.

Рабочий процесс ELT/ETL. Изображение автора

Этот пример аналогичен вышеописанному. Вы можете извлечь данные из базы данных MSSQL, преобразовать их и, наконец, загрузить в хранилище данных. Широкий спектр источников данных, поддерживаемых инструментами ввода (как показано зелеными значками), безусловно, является большим плюсом.

Поддерживаемые источники данных. Изображение автора

Эта область применения подробно описана в истории Tropical Smoothie CAFE, источниками данных которого являются AWS (Amazon Web Services).

Отчеты и аналитика

Вдобавок ко всем вышеперечисленным возможностям, Alteryx делает акцент на аналитику, предоставляя пользователям средства для создания отчетов. У многих компаний есть необработанные данные в хранилище или в озере, на основе которых нужно создавать отчеты. Alteryx поможет справиться с довольно сложными задачами анализа и обработки данных, такими как:

  • подготовка;
  • агрегирование;
  • статистика;
  • машинное обучение.

После выполнения аналитической и статистической работы можно использовать один из многих поддерживаемых инструментов BI и BI Server для загрузки данных. Я загрузил свои данные на сервер Tableau.

Рабочий процесс аналитики. Изображение автора

В этом случае Alteryx станет просто находкой для обработки данных, потому что инструменты BI не предлагают широкого спектра аналитических возможностей. Аналогичный случай использования описан Siemens в этой истории.

Заключение

Alteryx  —  это больше, чем просто инструмент для анализа данных. Он также предназначен для решения задач интеграции данных и может похвастаться множеством средств связи с системами и базами данных. Вместе с такими технологиями, как BigQuery, а также множеством других программ и баз данных, вы можете реализовать интеграцию и подготовку данных, а также отчеты и различные аналитические методы.

Что мне особенно нравится, так это возможность выбирать между множеством инструментов Alteryx (с поддержкой операции перетаскивания мышью) и использовать алгоритмы Python или R. Сочетание этих возможностей создает отличную платформу для интеграции и аналитики данных. Это позволит вам и вашей компании использовать широкий набор инструментов для решения непростых проблем изменчивого мира, управляемого большими данными.

Читайте также:

Читайте нас в TelegramVK и Яндекс.Дзен


Перевод статьи Christianlauer: Alteryx — a worthy Data Platform?

Предыдущая статьяСверточная нейросеть: подробное руководство (с использованием ELI5)
Следующая статья5 советов по быстрому написанию кода на любом языке программирования