25.05.2024
1622

ChatGPT и Google Gemini: подробный обзор-сравнение

Андрей Андреев
автор ApiX-Drive
Время прочтения: ~35 мин

До недавнего времени ChatGPT считался бессменным флагманом среди чат-ботов с искусственным интеллектом, однако после появления серьезного конкурента в лице Google Gemini его позиции пошатнулись. Обе системы обладают массой достоинств и претендуют на звание лучшего чат-бота с ИИ на рынке. Учитывая актуальность этой темы, мы подготовили детальный обзор-сравнение СhatGPT и Gemini. Предлагаем вам ознакомиться с ним.

Содержание:
1. ChatGPT
2. Google Gemini
3. Возможности Google Gemini и ChatGPT
4. Отличия Gemini и ChatGPT
5. Стоимость Gemini и ChatGPT
6. Подведем итоги
***

ChatGPT

ChatGPT, выпущенный компанией OpenAI в ноябре 2022 года, сразу стал лидером индустрии чат-ботов с ИИ. Первая его версия была разработана на основе языковой модели GPT-3.5, располагающей широкими возможностями генерации, анализа и обработки естественного языка. Она может писать текст разных типов, тем и объема, переводить его между множеством языков. Кроме того, модель умеет вести диалог с пользователями и отвечать на их вопросы, решать тесты и задачи, писать, проверять и исправлять программный код.

ChatGPT


В марте 2023 года разработчики обновили своего бота до версии GPT 4.0. Это сделало его еще мощнее и функциональнее. Усовершенствованная языковая модель позволила ChatGPT создавать и обрабатывать текст большего объема — до 25 000 слов в одном ответе. Помимо этого, она обрела способность анализировать изображения, точнее распознавать контекст запросов и лучше подстраиваться под стиль диалога. Главным преимуществом ChatGPT 4 стало подключение к интернету, благодаря которому бот начал получать более полную и актуальную информацию для ответов.

В апреле 2023 года появилась следующая версия умного чат-бота – GPT-4 Turbo. Эта модификация обрабатывает до 128 000 токенов, что дает ей возможность анализировать до 300 страниц текста за один запрос. Она поддерживает до 4096 токенов вывода. Ее токены ввода в 3 раза дешевле, а токены вывода в 2 раза дешевле, чем у GPT-4. Доступ к Turbo можно получить только через OpenAI API.

13 мая 2024 года OpenAI представила очередную обновку для своего чат-бота – языковую модель GPT-4o (“o” обозначает “omni”). Разработчики наделили ее способностью рассуждать, а также работать с аудио, видео и текстом. Она может отвечать на входящие аудиоданные в режиме реального времени, генерировать текст, переводить его на разные языки, создавать творческий контент различных видов и информативно отвечать на вопросы пользователей. Новинка понимает эмоции и тон говорящего, обладает чувством юмора. По сути, это голосовой помощник, с которым можно общаться, как с живым человеком.

Google Gemini

Чат-бот Gemini (ранее – Bard) был представлен лабораторией Google DeepMind в декабре 2023 года — позднее, чем продукты конкурентов. Длительная разработка позволила создать мощный многофункциональный ИИ-сервис с потенциалом нового лидера отрасли. Универсальный умный бот работает с текстом, кодом, изображениями, видео и аудио. Его способности позволяют создавать, анализировать, изменять, обобщать и комбинировать контент. Пользоваться им можно практически на любых устройствах, от смартфонов до центров обработки данных.

Gemini


Чат-бот с моделью Gemini 1.0 доступен в трех версиях: Nano, Pro и Advanced. Первая наименее объемна и требовательна к ресурсам, что позволяет запускать ее на мобильных устройствах. Вторая имеет оптимальный баланс мощности и ресурсоемкости, поэтому подходит для широкого спектра задач. Наконец, полнофункциональная версия Gemini Advanced обладает максимальными возможностями и используется для самых сложных и ресурсоемких процессов.

В феврале 2024 года DeepMind выпустила новую версию своего ИИ-бота Gemini 1.5 Pro. Главное ее усовершенствование коснулось понимания контекста. Оно стало более расширенным. Программа с обновленной моделью обрабатывает до 1 миллиона токенов, что позволяет ей анализировать большие тексты, видеоролики и фрагменты кода.

14 мая 2024 года на конференции Google I/O была представлена очередная новинка — Gemini 1.5 Flash. Это компактная мультимодальная модель, разработанная для эффективного масштабирования и выполнения специализированных задач высокой частотности. Она оснащена «прорывным» контекстным окном в размере 2 миллионов токенов и уже предлагается в открытом предварительном доступе через Gemini API на платформе Google AI Studio. Кроме того, обновление получила модель Gemini 1.5 Pro, дебютировавшая в феврале. Ее контекстное окно также расширилось до 2 миллионов токенов. Разработчикам, заинтересованным в этом обновлении, следует зарегистрироваться в листе ожидания.

Gemini 1.5 Flash ориентирована на быстродействие, что делает её идеальной для быстрых клиентских ответов в реальном времени или для оперативной генерации изображений. Gemini 1.5 Pro, обладая большей мощностью, схожа по функциональности с Google 1.0 Ultra и лучше подходит для анализа и резюмирования научных текстов. Обе модели способны обрабатывать текст, изображения и видео.

Возможности Google Gemini и ChatGPT

ChatGPT и Gemini демонстрируют высокую функциональность при выполнении широкого спектра задач. Вместе с тем они имеют некоторые отличия, касающиеся не только методов их решения, но и выдаваемого результата. Проанализируем, как оба чат-бота ищут запрашиваемую информацию, чьи генеративные способности мощнее, чей интерфейс удобнее, а также – как дополнения помогают им расширить свой функционал.

Поиск информации

В качестве источника данных обе нейросети используют загруженные в них датасеты и многочисленные интернет-ресурсы, в том числе веб-сайты, соцсети, статьи и книги. Функция онлайн-поиска поддерживается только платной версией ChatGPT.

Свяжите сервисы между собой без программистов за 5 минут!

У Gemini поиск в интернете доступен в бесплатных версиях Nano и Pro. Кроме того, чат-бот от Google использует комбинированные базы текста и изображений типа LAOIN-5B. Это дает ему дополнительное преимущество.

Генеративные способности

ChatGPT 4 Turbo способен обработать до 300 страниц текста за один запрос. Он легко создает рекламные и художественные тексты, веб-контент, стихи, сценарии и код для программ, описывает изображения, а также обобщает и переводит тексты на 95 языках. Бесплатная версия ChatGPT 3,5 тоже неплохо справляется с генеративными задачами.

ChatGPT: пример генерации


Gemini так же, как и ChatGPT, создает, анализирует и переводит различные форматы текста и кода на 40+ языках. Помимо этого, мультимодальная нейросеть способна генерировать изображения на базе текстовых запросов или других изображений.

Gemini: пример генерации


Интерфейс

ChatGPT предлагает простую минималистичную консоль, не перегруженную избытком деталей. В центре страницы находится диалоговое окно с предлагаемыми вариантами запросов, а на панели слева показаны история чатов и список подключенных расширений. Вверху страницы расположен переключатель между GPT 3.5 и GPT 4, а также режим автоматической очистки истории. Есть отдельные кнопки быстрого доступа для редактирования вопросов, оценки и регенерации ответов.

Интерфейс ChatGPT


Gemini обладает не менее удобным современным интерфейсом со множеством кнопок быстрого доступа. Они позволяют перепроверять выданную чат-ботом информацию, помечать его ответы как “хорошие” или “плохие”, сохранять их как шаблоны, отправлять в Gmail и Google Docs, а также экспортировать в другие форматы. Вся история пользования нейросетью фиксируется в журнале активности.

Интерфейс Gemini


Дополнения

Одна из наиболее перспективных особенностей обоих чат-ботов – дополнения, существенно расширяющие их стандартные возможности. В январе 2024 года OpenAI представила GPT Store – маркетплейс кастомных версий ChatGPT, доступный владельцам платных подписок. Сейчас здесь находится свыше 3 миллионов ИИ-сервисов, разработанных на базе ChatGPT сторонними лицами. Для удобства они распределены по категориям (написание текста, программирование, образование, наука и другие).

Сравнивая Google Gemini и ChatGPT по этому критерию, стоит отметить, что у Gemini тоже есть собственный маркетплейс дополнений для интеграции с сервисами и приложениями Google. Его аддоны напоминают расширения браузера Google Chrome. С их помощью пользователи могут автоматизировать ряд задач и процессов: создавать email-рассылки и презентации, искать информацию в почтовом ящике, получать ИИ-рекомендации о местах или занятиях на основе данных Google Maps и так далее. Дополнения Gemini пока доступны только для Google Apps.

Отличия Gemini и ChatGPT

Мы выяснили, что умные чат-боты от Google и OpenAI похожи друг на друга по ряду параметров, включая функционал, интерфейс и выполняемые ими задачи. Несмотря на это, у них есть ряд существенных отличий:

  • Языковая модель. Это главное отличие между Gemini и ChatGPT. В основе ChatGPT лежат уникальные LLM (GPT-3.5, GPT-4, GPT-4o) с разными возможностями, разработанные OpenAI. При необходимости между ними можно переключаться. Gemini предлагает более широкую линейку LLM. Она состоит из трех версий Gemini 1.0 (Nano, Pro, Advanced) и самой мощной на данный момент Gemini 1.5. Интересно, что все эти модели были созданы Google DeepMind не с нуля, а путем доработки других нейросетей (LaMDA, PaLM 2).
  • Набор данных. Модель Gemini Advanced обладает набором данных с 1.6 триллиона параметров. Для ее обучения был задействован датасет объемом в 1.56 триллиона слов. Лежащая в основе ChatGPT модель GPT-4 имеет порядка 1.5 триллиона параметров. Ее обучали на датасете объемом в 13 триллионов токенов, куда входили отдельные символы, слова и фразы.
  • Самообучение. Это ключевое отличие между ChatGPT и Gemini. Чат-бот от OpenAI самостоятельно обучается в процессе общения с пользователями, понимает контекст и учитывает его в последующих запросах. Возможности бота Google в этом направлении пока весьма ограничены.
  • Пользовательский опыт. Обе системы доступны через веб-интерфейс и мобильные приложения (iOS, Android). ChatGPT дополнительно интегрирован в сервисы Microsoft Windows, включая Word, Excel, PowerPoint и Outlook. Кроме того, его нативная LLM GPT-4 используется в ИИ-ассистенте Microsoft Copilot и интернет-браузере Bing. В отличие от ChatGPT, модель Gemini 1.0 не поддерживает API-интеграции. Такая возможность есть только у новой версии 1.5. Вместе с тем она доступна через приложения Google Docs, Gmail, Google Meet и Google Slides в составе Google One AI Premium.
  • Доступ в интернет. В сравнении ChatGPT и Google Gemini этот критерий – один из самых важных. Во всемирную паутину могут выходить все версии нейросети Gemini. Это выгодно отличает Gemini от ChatGPT, который предусмотрел онлайн-поиск информации исключительно в платных подписках. 
  • Редактирование запросов. Пользователи чат-бота от Google могут вносить изменения в отправленные боту запросы. Продукт OpenAI такой возможности не дает.
  • Работа с изображениями. Gemini располагает нативными инструментами генерации изображений и речи, а также поиска изображений в интернете. У ChatGPT такого нет. Впрочем, последний создает изображения через интегрированную нейросеть DALL-E.

Стоимость Gemini и ChatGPT

Обе платформы предлагают гибкое ценообразование с планами для частных и корпоративных пользователей. В их линейки входят как тарифы с фиксированной ценой (удобные для массовой аудитории), так и детализированные планы с оплатой за выбранную мощность и/или объем ресурсов (удобные для разработчиков). Наличие бесплатного плана – важное преимущество Gemini и ChatGPT.

На данный момент ChatGPT предлагает такие тарифы:

  • Free – бесплатный план с неограниченным доступом к чат-боту на базе GPT-3.5 через веб-интерфейс и мобильное приложение.
  • Plus – план для индивидуальных пользователей. Подписавшись на него, они получают доступ к чат-боту на базе GPT-4, каталогу моделей GPT Store, расширенному анализу данных, интеграции с DALL-E и другим дополнительным функциям. Стоимость – $20 в месяц.
  • Team – план для команд со всеми возможностями плана Plus, а также увеличенным лимитом на сообщения, админ-консолью, функцией разработки и шеринга моделей GPT для своей команды. Стоимость – от $25 в месяц за пользователя.
  • Enterprise – план для компаний, включающий все возможности Team, безлимитный доступ к GPT-4 и связанным инструментам, увеличенную длину запроса, аналитику и ряд дополнительных функций. Стоимость рассчитывается индивидуально и предоставляется по запросу.

Google бесплатно предоставляет базовую версию своего чат-бота для мобильных (Gemini Nano) и настольных (Gemini Pro) устройств. Самую мощную версию бота Gemini Advanced можно получить, оформив платную подписку на премиальный план Google One AI за $19,99 в месяц. Помимо неограниченного доступа ко всем возможностям нейросети, она позволяет использовать Gemini в других сервисах Google. Кроме того, подписчики получают 2 Тб в облаке. При первой покупке Gemini Advanced активируется бесплатный пробный период на 2 месяца. Стоимость предварительного API-доступа к новейшей модели Gemini 1.5 составляет $7 за 1 миллион токенов ввода и $21 – за 1 миллион токенов вывода.

Подведем итоги

Gemini и ChatGPT заслуженно занимают свои места в топе большинства рейтингов представленных на рынке ИИ чат-ботов. Оба сервиса обладают выдающейся мощностью, гибкостью и широкими возможностями в решении разных задач. Однако, сравнив Gemini AI и ChatGPT вместе с нами, вы, наверное, заметили, что у каждого из них есть как сильные, так и слабые стороны. ChatGPT оптимально подходит для компаний и профессионалов, которым нужно универсальное и функциональное средство для генерации контента, анализа данных, взаимодействия с клиентами. Наличие полноценного API обеспечивает ChatGPT глубокую интеграцию со сторонними системами.

Сильная сторона Gemini – пользовательский опыт. Google явно стремилась сделать свой чат-бот максимально удобным для пользователей, и во многом ей это удалось. Тогда как ChatGPT ориентирован на функциональность, Gemini делает акцент на комфорт применения. В этом ему помогают идеально отточенный интерфейс и неограниченный интернет-доступ. После релиза новой версии нейросети Gemini 1.5 она вполне может превзойти ChatGPT и по остальным критериям.

***

Рутинные задачи отнимают у сотрудников много времени? Они выгорают, им не хватает рабочего дня на основные обязанности и важные дела? Понимаете, что единственный выход из этой ситуации в современных реалиях — автоматизация? Попробуйте Apix-Drive бесплатно и убедитесь, что  онлайн-коннектор за 5 минут настройки интеграции удалит из вашей жизни значительную часть рутины и освободит время вам и вашим сотрудникам.