Навигация по ландшафту ИИ в 2024 году: тренды, прогнозы, возможности. Часть 1

Введение

Добро пожаловать в мир возможностей, которые 2024 год несет для ИИ и технологий. Каждый прогноз  —  это окно в будущее, наполненное инновациями, переменами и, что еще важнее, возможностями, подобными плодам промышленной революции середины XX века. 1950-е годы стали свидетелями появления цифровых вычислительных машин, которые изменили экономику и общественные нормы. Сегодня искусственный интеллект играет аналогичную роль, готовя следующую промышленную революцию.

Как и во время послевоенного технологического бума, в 2024 году мы будем переживать трансформацию промышленной сферы и спрос на новые навыки, а также размышлять над серьезными этическими вопросами. Все высказанные здесь мнения являются моими собственными, основанными на личном, коммерческом и научном опыте.


1. Выход генеративного ИИ из пиара на авансцену

Генеративный ИИ, способный переосмыслить экосистему технологий, превращается из распиаренного воздушного шарика, который “вот-вот лопнет”, в основную стратегию, столь же надежную, как современные летательные аппараты.

Переход от экспериментов к внедрению генеративного ИИ приведет к смене парадигмы способов решения проблем и реализации инноваций на крупных предприятиях. Эта коррекция технологического курса сродни волне преобразований, вызванной ранним внедрением облачных технологий, что предполагает аналогичное, если не большее, влияние на ИТ-экосистему.

97% владельцев бизнеса уже убеждены в том, что инструменты генеративного ИИ, такие как ChatGPT, окажут позитивное влияние на их бизнес (Forbes).

Таким образом, ландшафт 2024 года обещает быть таким, в котором генеративный ИИ будет не просто модным трендом, а важнейшей движущей силой технологического прогресса и трансформации бизнеса. Где стратегия ИИ  —  это стратегия.

2. Появление нового поколения нейронных сетей

Сомнения в общих когнитивных способностях архитектур трансформеров, обеспечивающих работу LLM (large language model  —  большая языковая модель), и гонка за AGI (artificial general intelligence  —  общий искусственный интеллект) подстегнули исследовательское сообщество к поиску лучших решений. Мы является свидетелями как новейших достижений, так и разработок в сфере уже существующих технологий.

  • SSM (state space model  —  модель пространства состояний), например Mamba. Эта модель отлично справляется с линейно-временным моделированием последовательностей с выборочными пространствами состояний. Она является альтернативой архитектуре трансформатора, на которой сегодня работают LLM. SSM стала прорывом в области обработки и понимания искусственным интеллектом последовательностей  —  фундаментального аспекта человеческого познания.
  • Нейро-символический ИИ, сочетающий лучшие возможности обучения нейронных сетей с точностью символического ИИ. Подобный гибридный подход обещает более тонкое и продвинутое понимание сложных проблем, позволяющее преодолеть разрыв между человеческим мышлением и эффективностью машин.
  • Согласование целей ИИ с целями человека (AI alignment) с помощью самокорректирующихся моделей. Суть этой инновации в проектировании моделей, способных согласовываться с человеческими ценностями и целями путем адаптации и самокоррекции без постоянного вмешательства человека. Согласованный ИИ  —  шаг вперед на пути к самостоятельной и ответственной форме генеративной работы, исключающей риск масштабных галлюцинаций.

Эти новые архитектуры моделей приближают нас к будущему, в котором возможности искусственного интеллекта соперничают с человеческим разумом и преодолевают ограничения сегодняшнего генеративного ИИ. Исследования пока находятся на ранней стадии, однако будем надеяться, что кто-то сделает решительный шаг и откроет новые горизонты в этой области.


3. Запуск каждой платформой обработки данных своего решения для векторных данных

Поскольку векторные базы данных становятся основой генеративного ИИ, все ключевые игроки сферы обработки данных представят на рынке свои решения. Правда, векторные базы данных  —  не новая концепция: традиционно они не являются частью “современного стека данных” и в прошлом использовались для поисковых систем и других типов машинного обучения.

Однако векторные базы данных являются ключевым требованием для более сложных сфер применения генеративного ИИ, таких как разговорная память, поиск в документационных базах данных (RAG), а также мультимодальных решений, таких как индексация изображений. Неудивительно, что в середине 2023 года наблюдался взрывной рост спроса на мультимодальные модели, ставшие к этому времени более доступными.

Спрос на векторные базы данных после выхода GPT-4 от OpenAI в марте 2023 — Google Trends (в мировом масштабе)

Поскольку платформа Databricks недавно выпустила собственное решение по векторным данным, можно ожидать, что в 2024 году ключевые игроки современного рынка данных, такие как Snowflake, последуют этому тренду. Наверняка его подхватят и смежные поставщики технологий, предоставляя различные функции и сервисы. С 2024 года практически все технологии баз данных будут называться “векторными хранилищами”.

Такой технологический переход, скорее всего, потребует повышения квалификационного уровня старших инженеров по обработке данных и программному обеспечению. Они должны будут лучше разбираться в концепциях векторных индексов, решений для семантического поиска, эмбеддингов и, возможно, даже алгоритмов, таких как BM25.

Не исключено, что мы станем свидетелями приобретения или инвестирования первых современных решений векторного поиска, принятых сообществом генеративного ИИ, таких как Chroma, Weaveate, Pinecone и Qdrant.

“Звезды” Github, поставленные репозиториям векторных баз данных с открытым исходным кодом. Рост рейтингов совпадает с выходом GPT3.5. Источник: Star-History & Github

Фаворитом современного мира векторных хранилищ с открытым исходным кодом является Milvus. Эта база данных зарекомендовала себя как “выбор компании” благодаря своим управляемым сервисам. Однако в последнее время Qdrant добился исключительных успехов с почти экспоненциальным ростом в 2023 году.


4. Тенденция к контролю над цепочкой поставок аппаратного и программного обеспечения

В условиях доминирования искусственного интеллекта все большее значение приобретает полный контроль над цепочкой поставок, позволяющий сохранять ключи к инновациям.

Понимание этого помогло компании NVIDIA  —  лидеру в производстве чипов  —  одержать явную победу в гонке ИИ. Интересно, насколько NVIDIA готова расширить свои горизонты в сфере облачных вычислений, используя собственный опыт в области аппаратного обеспечения для создания интегрированных облачных сервисов ИИ? У NVIDIA уже есть облачный потоковый сервис под названием Geforce Now, предлагающий высококлассную графику по запросу. Такой шаг способен изменить конкурентную среду, обеспечив NVIDIA непосредственное влияние на траекторию развития ИИ.

Цена акций Nvidia за последние 5 лет (NASD:NVDA). Источник: Nvidia Investor Relations

На другой стороне технологического сектора находятся поставщики облачного ИИ, такие как Amazon, и новые игроки на рынке ИИ, такие как Anthropic и Mistral. Их нынешняя зависимость от внешних источников аппаратного обеспечения для операций ИИ поднимает важный вопрос: пойдут ли они по стопам компании OpenAI, которая начала поставлять собственные чипы, и Google с ее облачными TPU (tensor processing unit  —  тензорный процессор) и Coral AI? Подобные стратегии знаменуют сдвиг в сторону самостоятельности и кастомизации аппаратного обеспечения ИИ. Следуя им, крупные поставщики ИИ придут к разработке более специализированных и эффективных решений.

Google Coral — платы для разработки, предназначенные для локального ИИ, и аппаратное обеспечение. Источник: Coral AI

Поскольку каждый, кто заинтересован в аппаратном обеспечении ИИ, стремится к дальнейшему контролю над своей цепочкой поставок, возникает ряд вопросов:

  • Перейдет ли производитель чипов NVIDIA на облачную платформу?
  • Будут ли поставщики облачного ИИ, такие как Amazon и Antrophic, вслед за OpenAI разрабатывать собственные чипы?
  • Выиграют ли производители чипов для мобильных и носимых устройств с ИИ, такие как Qualcomm?

Тенденция к вертикальной интеграции ИИ открывает более широкую перспективу: контроль над аппаратным обеспечением ИИ становится синонимом контроля над будущим технологий. В начале 2024 года мы ожидаем увидеть новых разработчиков специализированных чипов ИИ для обслуживания облачных игроков, государства, поддерживающие производство микропроцессоров, и развитие чипов от OpenAI.


5. 2024 год  —  год носимой электроники и устройств с расширенной реальностью на основе ИИ

В этом году мы станем свидетелями революции в области взаимодействия с технологиями: мир ИИ и носимой электроники объединится с XR-устройствами (XR, extended reality  —  расширенная реальность). Эти устройства  —  не просто гаджеты: они станут продолжением нашего цифрового “я”, органично вписываясь в нашу повседневную жизнь.

Смарт-брошь (AI Pin) от Humane. Источник: Humane

AI Pin (смарт-брошь, созданная Humane на базе процессоров Qualcomm Snapdragon) и Tab перекраивают ландшафт носимых устройств. Эти девайсы позволяют заглянуть в будущее, где носимые устройства больше не будут просто отслеживать показатели здоровья или присылать уведомления. Они призваны улучшить взаимодействие между людьми, предложить помощь искусственного интеллекта в режиме реального времени и обеспечить расширенное восприятие окружающего мира.

Смарт-подвеска (AI Pendant) от Rewind. Источник: Rewind

Смарт-подвеска от Rewind, еще один прорывной продукт, совершил революцию в том, как мы фиксируем и заново переживаем свои воспоминания. Представьте устройство, которое не только записывает переживаемые вами моменты, но и позволяет пересматривать свои воспоминания, лучше понимать их, размышлять над ними.

Но не только новые игроки производят фурор. Такие технологические гиганты, как Apple и OpenAI, осваивают сферу носимой электроники, обещая привнести в нее колоссальные инновационные возможности. Компания Apple, зарекомендовавшая себя как создатель передовых устройств, скорее всего, представит носимые устройства, которые будут легко интегрироваться в ее экосистему в рамках или вместе с гарнитурой расширенной реальности Apple Vision Pro, предлагая непревзойденный пользовательский опыт.

OpenAI, со своей стороны, может использовать собственный опыт в области ИИ при создании носимых устройств, способных донести передовые функции ИИ прямо до кончиков наших пальцев (или запястий). Особенно интересен потенциал носимых устройств, взаимодействующих с моделями генеративного ИИ, такими как ChatGPT, которые предлагают ни на что не похожее сочетание удобства и интеллекта.

Meta  —  еще один ключевой игрок, за которым стоит следить. Выход этой компании на рынок носимых устройств виртуальной реальности уже продемонстрировал нам потенциал цифровых впечатлений. По мере того как Meta будет продолжать внедрять инновации в этой области, можно ожидать появления носимых устройств, которые не только дополняют реальность, но и создают совершенно новые сферы для исследования и взаимодействия с ней.

В 2024 году носимые устройства с искусственным интеллектом выйдут за рамки эпизодически используемой электроники. Они станут персональными компаньонами, цифровыми помощниками и шлюзами в новые реальности. Эти девайсы представляют собой переход к более личным и интерактивным отношениям с технологиями, когда цифровой и физический миры органично переплетаются. В этом году мы будем не просто носить смарт-гаджеты: мы будем жить с ними.


6. Создание экосистемы взаимодействующих агентов ИИ 

Представьте экосистему, в которой взаимодействуют и сотрудничают специализированные агенты, каждый из которых обладает уникальным опытом и базой знаний. В 2024 году мы продолжим наблюдать за развитием “агентуры” ИИ.

Карта рынка агентов ИИ (по состоянию на 23 декабря 2023 года). Источник: Olivia Moore

Мы увидим, как агенты ИИ выйдут за рамки поддержки индивидуальных потребностей, таких как составление электронных писем, техническое сопровождение и заказ продуктов, и превратятся в экосистему, где начнут взаимодействовать с другими агентами ИИ. Эта смена парадигмы тесно связана с концепцией информационных продуктов, которая позволит предприятиям монетизировать своих агентов ИИ так же, как собственные модели и наборы данных. Это будет способствовать созданию новой экосистемы взаимодействующих интеллектуальных агентов.

Человекоподобный робот Optimus Gen 2 от Tesla (декабрь 2023 года)

Мы видим, как производители роботов и человекоподобных систем, такие как Boston Dynamics и Tesla, вынуждены искать решение этой проблемы, поскольку различные роботы должны сосуществовать и локально общаться, решая, как выполнить ту или иную задачу.

Компании, обладающие большим объемом данных в определенных бизнес-вертикалях, такие как Bloomberg (финансы) и LexisNexis (юриспруденция),  —  потенциальные лидеры в этой области. Компания Bloomberg, специализирующаяся на финансовых данных, готова создавать сложных финансовых агентов и уже приступила к разработке собственных LLM, а LexisNexis может использовать свое обширное хранилище юридической информации для создания юридических агентов. Эти агенты, опираясь на глубокие “рвы данных” (критически важную бизнес-информацию), будут не только обслуживать своих непосредственных пользователей, но и станут бесценными ресурсами для других предприятий и систем, обеспечивая работу новой цифровой рабочей силы.

Новые решения в этой сфере наверняка выйдут за рамки цифровой рабочей силы, включив в себя оркестровку, управление и мониторинг агентов. Участники рынка автоматизации цифровых роботизированных процессов, такие как UiPath, еще заявят о себе, как и разработчики роботов-гуманоидов для поточного производства и заводского труда. Опыт масштабирования систем автоматизации и роботизации станет залогом их успеха.


7. Расширение спектра возможностей генеративного ИИ

Искусственный интеллект выйдет за рамки текста, кода, изображения, видео и аудио, обретя новые, более захватывающие возможности в области геномики, 3D-моделирования, способов восприятия.

Генеративный пространственный ИИ для разработки новых городских проектов. Источник

Использование более иммерсивных форм ИИ поможет науке в изучении белковых структур и материалов, а также активирует дополнительные модальности искусственного интеллекта  —  восприятие 3D-пространства, запахов и вкусов. Ожидается, что появление новых возможностей  —  уже на ранних стадиях разработки  —  в очередной раз усилят интерес к генеративному ИИ.

Демонстрация гауссовского распределения: превращение видео в виртуальную 3D-реальность

Внедрение автономных агентов ИИ и мультимодальных моделей в сочетании с достижениями в области носимых устройств и расширенной реальности прокладывает путь к более захватывающему и интерактивному опыту для потребителей.

Только представьте, что ваши мечты воплощаются в виртуальной реальности, а каждая игра предлагает уникальный мир, созданный с учетом ваших представлений.

Благодаря новейшей технологии 3D-моделирования (основанной на гауссовском распределении), позволяющей превратить видео в виртуальную 3D-реальность, мы достигнем новых высот в использовании генеративного ИИ.

Лаборатории A-Lab в Беркли. Робот тестирует новые материалы. Источник: Marilyn Sargent/Berkeley Lab

Наибольшее влияние генеративного ИИ испытают материаловедение и геномика. Модель GNoME, разработанная Google Deepmind, уже использовалась для совершения прорывов в материаловедении. Она помогла в открытии новых кристаллических структур, способствующих созданию более совершенных аккумуляторов и более производительных компьютеров.

Именно в отраслях, связанных с естественными науками, ожидаются самые значительные научные достижения.

Читайте также:

Читайте нас в Telegram, VK и Дзен


Перевод статьи Vincent Koc: Navigating the AI Landscape of 2024: Trends, Predictions, and Possibilities

Предыдущая статьяИндексирование в MySQL: руководство для начинающих
Следующая статья8 приложений и сайтов, за которые стоит заплатить: UX/UI edition