R — отличный язык, который используется для обработки данных и работы с ними. Рассмотрим пять крутых приемов работы на R, которые просто необходимо знать. Они разнятся в применении, но задействуются в большинстве существующих проектов. Итак, начнем!
Запуск кода Python на R
Начинаем с возможности запуска кода Python на R. Конкретно этот прием очень пригодится тем, кто захочет запускать Python вне среды R. Помогает в этом пакет Reticulate. Главное — не забудьте установить Python на компьютер.
И вот как именно запускается код Python на R.
Открываем скрипт на R. Для этого переходим в RStudio (или другую интегрированную среду разработки) и создаем новый пустой скрипт на R. Вот как он будет выглядеть:
Теперь устанавливаем новый пакет reticulate. Для этого переходим в консоль R и набираем install.packages(“reticulate”)
:
После ввода этой команды нам доступен запуск Python-скриптов! Для начала сделаем примерный файл на Python. Открываем любой текстовый редактор и вводим print(“hello”)
:
После сохраняем этот файл где-нибудь на компьютере. Название сохраненного файла должно иметь расширение .py
(как в примере), которое показывает, что в этом файле содержится код на Python.
Дальше возвращаемся в RStudio (или другую интегрированную среду разработки на R) и импортируем новый пакет:
Теперь импортируем Python для этого проекта. Как найти Python на компьютере, см. здесь. Импортируем путь к Python в R:
Зеленый текст нужно заменить на путь к файлу. Теперь запускаем файл на Python: надо взять путь к созданному файлу на Python и вставить его на R. Делается это с помощью следующего скрипта:
Зеленый текст снова нужно заменить на путь к файлу. После запуска этих строчек в консоли на R будет следующее:
Вот так запускается файл на Python в R! Вставляем вместо кода внутри созданного нами Python-скрипта любой другой код Python, и он так же будет запускаться в этой консоли. Нужно лишь установить на компьютере пакеты Python, и тогда все, что изначально запускается на Python, будет запускаться и в R.
Чтение/импорт и преобразование файлов
Следующий крутой прием работы на R связан с возможностью очень легко читать/импортировать и конвертировать файлы. Как известно, импорт CSV-файлов, файлов в Excel, а также текстовых файлов имеет свои особенности на R. Пакет Rio значительно упрощает весь этот процесс! Перейдите по ссылке и узнайте больше об этом пакете.
Большинство наиболее используемых файлов данных появляются в R с помощью функции import
.
Нахождение структуры объектов
Еще один крутой прием работы на R — возможность находить структуру объектов с помощью функции str()
. Структура объектов дает дополнительную информацию о них. Вот пример того, как это происходит на R:
#СОЗДАНИЕ СПИСКА ЧИСЕЛ
list <- list(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)#ИСПОЛЬЗОВАНИЕ ФУНКЦИИ STR()
str(list)
В результате будет выводиться информация об этом списке. В данном конкретном примере вывод будет такой:
Просмотр первой или последней части табличной структуры
Следующий прием экономит много времени при проведении проверки, так как позволяет просматривать первую или последнюю часть набора данных. Для этого в R имеется несколько встроенных функций. Задействуем две из них: head()
и tail()
. Эти функции очень просто использовать.
Вернемся к списку, который мы создали чуть выше:
#СОЗДАНИЕ СПИСКА ЧИСЕЛ
list <- list(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
Воспользуемся функцией head
, чтобы получить верхнюю часть этого набора данных:
head(list)
Вывод будет такой:
Было выведено несколько верхних строк набора данных. Для получения его нижних строк используем tail()
:
tail(list)
Вывод будет такой:
Чтение/экспорт данных в Google Sheets
И заключительный прием работы на R связан с отличным пакетом, позволяющим читать и экспортировать наборы данных в Google Sheets. Это довольно сложный процесс: понадобится интернет-подключение, учетная запись Google и возможность предоставить из нее доступ к API. У вас все это есть? Значит, вы готовы!
Вот и все. Большое спасибо за то, что прочитали!
Читайте также:
- R - язык для статистической обработки данных. Часть 1/3
- Анализ текста средствами языка программирования R
- Введение в R: линейная алгебра
Читайте нас в Telegram, VK и Яндекс.Дзен
Перевод статьи Manpreet Singh: 5 awesome R tricks you need to see