Сейчас исследователи данных в основном работают в браузере с помощью Jupyter Notebook или другого подобного браузерного блокнота. Некоторые задачи можно выполнять вне браузера, но затем дата-сайентист опять возвращается в браузерный блокнот.
Учитывая такую специфику работы специалистов по данным, эти 5 браузерных расширений точно пригодятся любому дата-сайентисту.
1. Diigo
Diigo — это расширение для браузера, позволяющее быстро делать закладки и аннотации на веб-страницах, не покидая их. Diigo дает возможность дата-сайентисту сохранять учебные материалы и ссылки на научные работы.
Diigo предлагает несколько важных функций, которые могут использовать специалисты по работе с данными.
- Bookmarks: сохранение нужных страниц сайта.
2. Tags: пометка коллекции тегами.
3. Highlights: выделение предложений на веб-странице цветом.
4. Sticky Notes: добавление заметок к веб-страницам.
5. Outliners: произвольное структурирование материалов исследования.
6. Group: обмен материалами с коллегами.
Можно также использовать премиум-функции, в частности функцию, предназначенную для заархивированных веб-страниц, но основных возможностей Diigo вполне достаточно для продуктивной работы.
2. CatalyzeX
CatalyzeX — это расширение для браузера, позволяющее автоматически находить код, реализованный в статьях по ИИ и МО. Расширение можно использовать непосредственно в самой научной статье или при просмотре результатов выдачи Google.
Например, если в поисковый запрос ввести название статьи “Neural Network GAN paper”, расширение автоматически найдет реализацию кода (как правило, в таких случаях будет показана страница GitHub).
Если нажать кнопку CODE, вы попадаете на страницу GitHub, где хранится код.
Как и в случае с выдачей Google, расширение CatalyzeX также можно использовать при чтении научных статей.
Или даже на странице Google Scholar.
Наконец, вы можете посетить сайт CatalyzeX, чтобы найти необходимую исследовательскую работу по ИИ и МО.
Это расширение позволяет дата-сайентисту быстро найти реализацию нужного кода, чтобы он мог сосредоточиться на работе.
3. Octotree
Octotree — это расширение для браузера, разработанное специально для упрощения поиска кода на GitHub. Расширение включается автоматически при открытии страницы GitHub и появляется на ней.
Задача расширения проста: оно берет текущую страницу GitHub и создает из нее четкую древовидную структуру, чтобы вы могли быстро ее изучить.
Octotree позволяет мгновенно узнать структуру кода и легко найти нужный фрагмент. Кроме того, Octotree предоставляет несколько дополнительных функций.
- Удобное отображение веток и тегов.
2. Просмотр пул-реквестов.
3. Закладки для страниц GitHub.
Расширение Octotree полезно для дата-сайентиста, поскольку позволяет быстро исследовать страницу GitHub, особенно в части реализации кода.
4. Open in Colab
Open in Colab — это простое расширение для браузера, позволяющее открывать файлы, размещенные на GitHub, непосредственно в Google Colaboratory Notebook.
Обычно файл на странице GitHub необходимо загрузить, чтобы с ним работать. С расширением Open in Colab этого делать не нужно. Возьмем в качестве примера этот файл.
Один щелчок по расширению — и файл готов к использованию в Google Colaboratory.
Это простое расширение позволит вам не заморачиваться с проверкой различных блокнотов и реализаций исследований.
5. BibItNow!
BibItNow — это расширение для удобного цитирования научных работ в различных форматах. Расширение предназначено для специалистов по анализу данных, которым необходимо ежедневно цитировать множество статей.
Используя BibItNow, вы можете автоматически получить конкретную цитату при открытии веб-страницы с научной статьей или документа в формате pdf.
Здесь доступно несколько форматов. Выбираем Bibtex.
В расширенных настройках у вас есть возможность выбрать нужную цитату.
BibItNow — это простое расширение для браузера. Но оно ценно для специалистов по анализу данных, которым приходится читать большое количество научных статей.
Читайте также:
- Факты о веб-сайтах (и почему токенизация стала отличной идеей для этой отрасли)
- 8 способов “настроить” Data-команду на успех. Часть первая
- Интерактивное управление в Jupyter Notebooks
Читайте нас в Telegram, VK и Яндекс.Дзен
Перевод статьи Cornellius Yudha Wijaya: Top 5 Browser Extensions for Data Scientists