Какие десять книг про науку о данных и искусственный интеллект стоит прочитать в 2020

Чтобы стать экспертом в какой-либо области, нужно взять на себя обязательство учиться и быть последовательным в достижении своих целей. И это справедливо для всех профессий, будь то сфера ИИ, инженерии или даже медицины. Получение знаний очень важно для развития навыков, т.к. это поднимает уровень вашей экспертности. Когда был последний раз, когда вы погружались в какую-либо экспертную область?

В отличие от прошлых лет, когда искусственный интеллект был совершенно новой концепцией для многих, сейчас ИИ стал мейнстримом и его обсуждают очень много. Моё личное путешествие в сферу ИИ было наполнено последовательным изучением тем и обучением при помощи разных ресурсов

В отличие от прошлого, когда ИИ был новой концепцией для многих, сейчас этот термин упоминается очень часто и находится в центре многих обсуждений.

Сегодня вы можете стать экспертом в науке о данных, если читаете правильные книги.

И вот список 10-ти лучших книг за 2019–2020 годы в областях: наука о данных, машинное обучение и прикладной ИИ. Добавляйте их себе в список к прочтению.

1. Интерпретируемое машинное обучение

Автор: Christoph Molnar (2019)

Интерпретируемое Машинное Обучение
Как сделать модели машинного обучения лучше интерпретируемыми.

Курс интерпретируемости в Машинном обучении авторства Christoph Molnar фокусируется на интерпретируемости решений и моделей машинного обучения. Усвоение машинного обучения для исследований и разработки продукта таит в себе огромный потенциал, но вот есть недостаток способности прогнозировать, обусловленный компьютерными системами. Он ограничивает полноту имплементированности МО в реальную жизнь. Автор предлагает подробный анализ интерпретируемых моделей от линейной регрессии до деревьев и правил решений.

Интерпретация моделей “черного ящика” — ещё одна важная область, покрытая в книге, где автор предлагает уроки по LIME и значениям Shapley в целях прогнозирования. Molnar идёт глубже в тему накопления локальных эффектов, как части агностических методов в сфере ИИ.

Интерпретируемое машинное обучение фокусируется на критическом анализе для динамического интерпретирования и том, как сделать лучший выбор для интерпретации машинного обучения. 

Вы можете задать такой вопрос: как я могу интерпретировать свои модели с помощью машинного обучения? Molnarотвечает на этот вопрос путём исследования достоинств и недостатков в подходах к интерпретации. Так он даёт читателям понятную картину лучших решений для их проектов.

Исследователи данных сталкиваются с трудностями в процессе интерпретирования их моделей машинного обучения, а благодаря уроку Molnar по структурированным данным вы сможете разобраться в практических применениях интерпретирования, чтобы достичь лучших результатов. Автор держит в уме разнородную природу индустрии науки о данных и своевременно предлагает примеры по интерпретации моделей машинного обучения.

2. Python в аналитике данных

Автор: Wes McKinney (2017)

Python в аналитике данных, 2-е издание
Полные инструкции для манипуляций, обработки, очистки и подготовки датасетов к работе в Python

“Python для анализа данных авторства Wes McKinney” помогает читателям изучить науку о данных с помощью языка программирования Python. Ученики-читатели оценят простоту языка, который использует автор для объяснения технических концепций. Опубликована в 2017-м. Книга идеальна для новичков в области науки о данных —  тех, кто хочет разобраться в научных вычислениях, которые применяются в индустрии. 

Автор покрывает ключевые области науки о данных, включая импортирование, подготовку датасетов и манипуляции при помощи Python. Я восхищаюсь этой книгой за ее гибкость в том, как раскрыты предметные области в Python. Автор делает это так, что большинство читателей захотят открыть еще больше нового для себя в изучении науки о данных в первый раз в своей жизни. McKinney предлагает решения, которые вы можете использовать в решении задач по анализу данных, применяя эффективные методы вместе с популярными пакетами, например, pandas и numpy.

3. Стостраничная книга по машинному обучению

Автор: Андрей Бурков (2019)

Стостраничная книга по машинному обучению авторства Андрея Буркова
Всё, что вам нужно знать о машинном обучении на ста страницах. Самостоятельное обучение (обучение без учителя) и обучение с учителем.

Основанная на теории и практических применениях, эта книга погружает читателей в машинное обучение в упрощённой манере изложения. Автор предлагает базовую информацию про основные темы области машинного обучения, вовлекая их в важные дискуссии, необходимые для улучшения уровня понимания. ИИ является разнородной областью, где машинное обучение — очень важная часть в профессиональном становлении. Автор раскрывает все эти предметы обсуждения в связи с Python. 

С первой до последней страницы Бурков цепляет читателей, приглашая их в постоянное погружение в мир машинного обучения. Если вы ищете книгу, которая даст вам достоверное суждение обо всей области машинного обучения и применение на практике, то это точно ваша книга. Стостраничная книга о МО даёт ресурсы, благодаря которым читатели могут реализовывать решения в реальном мире. В то же время инженеры по машинному обучению также находят её практичной из-за авторского подхода к объяснению статистических и математических концепций.

4. Глубокое обучение с JavaScript: нейронные сети и TensorFlow.js

Авторы: Shanqing Cai, Stanley Bileschi, Eric D. Nielsen и Francois Chollet (2020)

Глубокое обучение с JavaScript
Эта книга должна быть авторитетным источником для читателей, которые хотят изучать МО в паре с применением JavaScript
.

Скажите, вы хотите научиться разрабатывать приложения глубокого обучения без использования языков Python или R, но с JavaScript? Если да, то эта книга для вас, особенно учитывая широту доступной информации о программировании на JavaScript, которая представлена в этой книге. А что насчёт создания приложений глубокого обучения в вашем браузере при помощи JavaScript? Это другая важная область, которая делает глубокое обучение с JavaScript уникальной книгой, т.к. читатели изучают новый инструмент, например, бэкенд на базе Node. 

JavaScript — популярный язык в мире программирования со структурами данных, API и фронтенд-системами. Авторы раскрывают темы на примерах юз кейсов для разработчиков, включая перенос приложений на веб-платформу, обработка языка в браузере и обработка изображений в браузере. Читатели могут также ожидать генеративное глубокое обучение, что подведёт их к созданию текста и генерации изображений — и всё это на JavaScript.

Авторы преподают на примерах для разработчиков (перенос приложений в веб, браузерную обработку языка и изображений).

5. Освоение больших наборов данных с Python: распараллеливание и распространение вашего кода на Python

Автор: John T. Wolohan (2020)

Освоение больших наборов данных с помощью Python
Как понятно и эффективно пройти путь, а также уменьшить количество парадигм для разработчиков на всех уровнях.

Масштабирование МО в продакшне требует внешних мощностей обработки, таких как GPU и TPU. От ветвления, процессов и согласования, освоение больших датасетов с Python научит вас практическим инструментам работы с параллельными и распределёнными системами. Wolohan учит, как начать с простых, маленьких проектов, которые масштабируются в работы с потоками больших данных. Согласно Wolohan, применение функциональных подходов в Python важно для достижения оптимальных результатов. 

Разбирается распределённая технология, чтобы подготовить читателей к большим наборам данных в облачных системах. Если вам интересно, как строятся системы на Python, массивные наборы данных и распределённые модели науки о данных, эта книга будет направлять вас пошаговыми инструкциями. 

Студентов, которые хотят построить огромные модели в науке о данных, эта книга направит по процессам, помогая применять масштабирование в лучшей манере из возможных.

6. Наука о данных на практике с R, (2-е издание)

Авторы: Nina Zumel, John Mount (2019)

Наука о данных на практике с R, второе издание
Полна полезного опыта и практических советов. Очень рекомендую.

Преподносится как учебник по программированию на R, Наука о данных на практике с R показывает практические примеры, которые нужны студентам для понимания науки о данных и применения своих навыков в R,соответственно.

Читатели учатся интерпретировать статистический анализ, рабочие процессы науки о данных и узнают о представлении дизайна.

7. Наука о данных на этапе продакашна

Автор: Ben Weber (2020)

Наука о данных в продакшне

Прогнозные модели очень необходимы любому специалисту по данным, находящемуся в поисках достижения хороших результатов на организационном уровне. Построение масштабируемой модели достаточно трудный процесс, и опытные специалисты по данным могут эффективно разворачивать модели в продакшне. Weber учит методам автоматизации в науке о данных и тому, как специалисты по данным могут взять на себя ответственность за свои рабочие процессы во имя лучших результатов. Понимание данных от начальных и до фаз продакшна — это другой пример, показанный в книге, который предлагает читателям весомые инсайты. 

Такие области, как облачное развёртывание, разработка конечных веб-поинтов и моделей машинного обучения  — дополнительные примеры, раскрытые в книге. Weber учит нисходящему подходу: построить воспроизводимые модели, которые могут нормально масштабироваться на продакшне. От техник PySpark, Pub/Sub и до Kafka.Weber глубоко погружается в неотъемлемые инструменты науки о данных.

Такие области, как развёртывание облачных систем, разработка веб-енд-поинтов и моделей МО — в книге раскрываются дополнительно.

8. Руководство по Python в науке о данных

Автор: Jake Vanderplas (2016)

Руководство по Python в науке о данных
Для многих исследователей Python является инструментом первого класса в основном из-за его библиотек
.

Python — самый распространённый язык программирования среди разработчиков в сфере науки о данных, и после подробного анализа, в который входят Pandas, Scikit-Learn, и NumPy, автор Vanderplas предоставляет все ресурсы, которые вам нужны для понимания данных на фундаментальном уровне. Известный как один из первых настоящих авторов в области науки о данных применительно к Jupyter Vanderplas учит студентов, как эффективно обращаться с данными в pandas.

“Руководство по Python в науке о данных” должно быть у каждого, кто хочет изучать науку о данных, и это часто первая книга, которую я рекомендую новичкам в области. От очистки данных до их преобразований и дизайн-мышления по тому, как разрабатывать модели машинного обучения, базируясь на их данных, Vanderplas предоставляет обширный материал для этих юз кейсов.

Руководство по Python применительно к науке о данных — эта книга должна быть у каждого, кто хочет изучать эту область, а я сам часто рекомендую ее первой новичкам в области.

9. Семь баз данных за семь недель, 2 издание

Авторы: Eric Redmond, Jim Wilson (2018)

Семь баз данных за семь недель, второе издание: Руководство по современным базам данных и динамике NoSQL
Данные становятся больше по размерам и более сложными каждый день, как и ваш выбор по их обработке.

Массивные системы данных требуют огромных баз данных и бд-фреймворков. Исследователям данных должно быть комфортно работать со множественными бд-системами. “Семь бд за семь недель” глубоко погружает читателя в Redis, Neo4J, CouchDB, MongoDB, HBase, Postgres, и DynamoDB. Redmon и Wilson предоставляют системы моделей практических данных, которые моделируют бд систем в 500 компаниях Fortune.

Книга “Семь бд за семь недель” подробно рассказывает о Redis, Neo4J, CouchDB, MongoDB, HBase, Postgres, и DynamoDB.

10. Искусственный интеллект + Python — второе издание.

Авторы: Alberto Artasanchez, Prateek Joshi (2020)

ИИ и Python — второе изданиеРуководство-бестселлер по ИИ вместе с Python, обновлённое для Tensorflow 2.0

“Искусственный интеллект + Python” даёт обзор науки о данных, машинного обучения и ИИ, применяемого в прикладных случаях в целом в индустрии. Авторы фокусируются на студентах, изучающих основы создания пайплайнов машинного обучения. Инструменты разработки ИИ и облака — дополнительные темы, которые вы можете узнать из этой книги.

Artasanchez и Joshi обновили свой бестселлер для TensorFlow 2.0 и для последнего Python 3.9. Студенты погружаются в конструирование признаков и конвейеры данных наряду с такими юз кейсами, как распознавание речи и чат-боты. Ещё авторы ведут студентов к имплементированию и развёртыванию их систем машинного обучения через нейронные сети, глубокое обучение и облачные системы.

Искусственный интеллект с Python, атворы Alberto Artasanchez и Prateek Joshi

У вас есть шанс стать экспертом по науке о данных

Из опыта обучения тысяч студентов в The Carpentries, Galvanize, и General Assembly, я сжал десятки книг в этот список из 10 ресурсов по науке о данных, машинному обучению и ИИ. Будете ли вы учиться при помощи платформ OReilly, Manning, Packt, Leanpub, Pragprog или выберете другие платформы, теперь есть достаточно большой выбор знаний для каждого, чтобы научиться науке о данных.

Читайте также:


Перевод статьи David Yakobovitch: What are the 10 Must Read Data Science and AI Books of 2020