Тренды

Язык R: прокачайте свои навыки до следующего уровня

28.05.2023

Язык программирования R активно применяется для анализа данных в бизнесе и науке. Это важный и очень популярный инструмент науки о данных. Его предпочитают многие статистики и дата-сайентисты, которые часто работают с большими объемами данных и сложными статистическими задачами.

Главная роль здесь отводится памяти и времени выполнения. Для максимальной производительности нужен эффективный код. Напишите его в своем следующем проекте на R, следуя этим семи рекомендациям.

Заключение

Из статьи мы узнали, как анализируется и ускоряется код на R.

Анализ кода поддерживается пакетом provis.
Применяются векторизованные функции rowSums(), colSums(), rowMeans() и colMeans().
Где возможно, вместо фреймов данных используются матрицы.
Пропущенные значения в векторе проверяются с помощью anyNA(), а не is.na().
Код на R ускоряется использованием if() ... else() вместо ifelse().
Для сложного моделирования применяются распараллеленные функции пакета parallel.
Максимальная производительность сложных частей кода достигается использованием пакета Rcpp.

Язык R: прокачайте свои навыки до следующего уровня

Рекомендация 1. Выполняйте профилирование кода

Рекомендация 2. Векторизируйте код

Рекомендация 3. Матрицы вместо фреймов данных

Рекомендация 4. is.na() и anyNA

Рекомендация 5. if() … else() вместо ifelse()

Рекомендация 6. Параллельные вычисления

Рекомендация 7. Интерфейс сопряжения R с другими языками

Заключение

Читайте также

Будет ли ИИ главенствовать в 2021 году? Большой вопрос

Учимся избегать null-значений в современном Java. Часть 1

Сканируем образы Docker на уязвимости

Тесты

Насколько хорошо вы знаете Python?

Насколько хорошо вы разбираетесь в алгоритмах и структурах данных

Насколько хорошо вы знакомы с Mac?