Google внутри компании работает над Gemini, своим конкурентом GPT-4, который, вероятно, почти готов к запуску в прайм-тайм, что позволит Google вскоре получить более сложную версию Bard.
Gemini, в отличие от нынешней большой языковой модели Google PaLM 2, является мультимодальной и может обучаться из различных источников для генерации различных типов данных, таких как текст, изображения и код.
Google начал предоставлять нескольким разработчикам доступ к Gemini для ранних пробных версий, что позволяет им интегрировать API Gemini в свои сервисы и разрабатывать дополнительные приложения и варианты использования.
ChatGPT на данный момент, пожалуй, самое известное имя в отрасли генеративного ИИ. Хотя используемая языковая модель уже значительно опережает конкурентов, Google все еще находится в роли догоняющего, разрабатывая собственную большую языковую модель (LLM). Но если верить этому новому отчету, конкурент Google GPT-4 Gemini быстро продвигается вперед и почти готов к выходу.
Bard в настоящее время является лицом разработки Google в области генеративного искусственного интеллекта — чат-бот уже может многое сделать, но только с помощью правильной команды. Он основан на последней модели большого языка компании PaLM 2, которая сама по себе является шагом вперед по сравнению с версией первого поколения, анонсированной в 2022 году. Однако даже новейший LLM от Google отстает от GPT-4 в одной ключевой области: PaLM 2 не мультимодальный, что ограничивает его возможности за пределами текстового ввода и вывода. Именно здесь на сцену выходит Google Gemini, который сейчас проходит внутреннее обучение. Что отличает его от PaLM 2, так это способность учиться на различных источниках и генерировать различные виды данных, включая текст, изображения, код и многое другое.
Согласно недавнему отчету The Information, Google Gemini достиг важной вехи на пути к более широкому распространению. Так Google начал предоставлять доступ к Gemini нескольким разработчикам. Этот ранний пробный запуск должен помочь им в разработке дальнейших приложений и вариантов использования с API Gemini, работающим под капотом. Эти разработчики, вероятно, со временем внесут глубокую интеграцию Gemini в свои сервисы, как это произошло с Bard. Это дает нам надежду, что рано или поздно у Google появится собственная версия генеративного ИИ, столь же сложная и мощная, как GPT-4.
В отчете так же указывается, что эти сторонние разработчики имеют доступ к довольно ограниченной версии Gemini, в то время как Google все еще тренирует полноценную языковую модель, которая, как утверждается, находится на одном уровне с GPT-4. На данный момент доступно мало информации о различных размерах упаковки Gemini. Даже на I/O в этом году Google лишь вкратце коснулся Gemini и намекнул, что уже наблюдаемые мультимодальные результаты впечатляют. Только время может показать, как скоро Google сможет догнать OpenAI, производителя ChatGPT, поддерживаемого Microsoft.
Google уже предлагает свои инструменты генеративного искусственного интеллекта своим клиентам Cloud через Vertex AI, и ожидается, что Gemini будет предлагаться как часть того же пакета. Другие бизнес-пользователи могут получить доступ к Duet AI, инструменту генеративного искусственного интеллекта Google, встроенному в различные приложения Workspace, за 30 долларов в месяц сверх их текущего плана. Однако стоит отметить, что Duet AI опирается на существующие модели искусственного интеллекта Google, поэтому его возможности ограничены текстовыми запросами, но все же есть несколько инновационных способов использовать его в полной мере.
Иван Ковалев
VIA
iPhone 14 официально уже здесь, чтобы "разгромить" прошлогодний iPhone 13. Но стоит ли следовать ажиотажу, остаться