Google анонсирует Gemini, свой «мультимодальный» ответ на ChatGPT

В отредактированном демонстрационном видео Близнецы способны описывать эскизы, отсылать к фильмам и шутить.

В среду, Google объявил прибытие из Близнецы, его новый мультимодальный транспорт большая языковая модель созданный с нуля подразделением искусственного интеллекта компании, ДипМайнд. Среди своих многочисленных функций Gemini ляжет в основу Google. Бард, которая ранее изо всех сил пыталась выйти из тени своего предшественника чат-бота, OpenAI ЧатGPT.

Кредит: Google DeepMind / YouTube

Согласно Сообщение в блоге от 6 декабря от генерального директора Google Сундара Пичаи и ДипМайнд Соучредитель и генеральный директор Демис Хассабис, технически существует три версии LLM — Gemini Ultra, Pro и Nano, предназначенные для различных приложений. «Точно настроенный» Gemini Pro теперь лежит в основе Bard, а вариант Nano можно будет увидеть в таких продуктах, как Пиксель Про смартфоны. Варианты Gemini также появятся в Google Search, Ads и Chrome в ближайшие месяцы, хотя публичный доступ к Ultra не станет доступен до 2024 года.

В отличие от многих своих конкурентов в сфере искусственного интеллекта, Gemini с самого запуска была обучена быть «мультимодальной», то есть она уже может обрабатывать как текстовые, аудио-, так и графические подсказки. В сопроводительном документе видео демонстрацияGemini устно получает задание определить, что находится перед ним (лист бумаги), а затем правильно идентифицирует эскиз утки, сделанный пользователем, в режиме реального времени. Другие возможности включают в себя определение того, какие действия будут происходить в видео после паузы, генерацию музыку, основанную на визуальных подсказках, и оценку домашнего задания детей — часто с немного дерзкой, склонной к каламбуру манерой игры. личность. Однако стоит отметить, что описание видео включает в себя заявление об отказе от ответственности: «Для целей этой демонстрации задержка была уменьшена, а выходные данные Gemini были сокращены для краткости».

Сопровождение Близнецов технический отчет указывает на то, что самая мощная итерация LLM, Ultra, «превосходит текущие результаты по 30 из 32 широко используемых академических тестов, используемых в исследованиях [LLM] и разработка." Тем не менее, улучшения кажутся несколько скромными: Gemini Ultra правильно ответил на междисциплинарные вопросы в 90 процентах случаев по сравнению с ChatGPT — 86,4. процент. Однако, несмотря на статистические данные, результаты показывают, что у ChatGPT может быть реальная конкуренция с Gemini.

[Связанный: Логика чат-ботов с искусственным интеллектом, таких как ChatGPT, на удивление проста..]

Неудивительно, что Google в своем заявлении в среду предупредил, что ее новый звездный ИИ далек от совершенства и все еще подвержен общеотраслевым «галлюцинации», которые мешают развивающимся технологиям, т.е. LLM иногда случайным образом дает неправильные или бессмысленные ответы. Google также подверг Gemini «наиболее полной оценке безопасности среди всех моделей искусственного интеллекта Google», как сказал Эли Коллинз, вице-президент по продукту Google DeepMind, выступая на Стартовое мероприятие 6 декабря. Это включало в себя задание Близнецам «реальная токсичность подсказывает», тест, разработанный Институтом Аллена по искусственному интеллекту, включающий более 100 000 проблемных входных данных, предназначенный для оценки потенциальных политических и демографических предубеждений большой языковой модели.

Gemini продолжит интеграцию в набор продуктов Google в ближайшие месяцы наряду с серией этапов закрытого тестирования. Если все пойдет по плану, Bard Advanced с двигателем Gemini Ultra когда-нибудь станет доступен публике. в следующем году, но, как уже хорошо известно, продолжающуюся гонку вооружений в области искусственного интеллекта зачастую трудно остановить. прогноз.

На вопрос, работает ли он на Gemini, Бард ответил: ПопНаука оно, «к сожалению», не обладает доступом к информации «о внутренних проектах Google».

«Если вам интересно узнать больше о… «Близнецах», рекомендую поискать информацию через официальным каналам Google или связаться с кем-то в компании, у которого есть доступ к такой информации», — Бард. написал ПопНаука. «Приношу извинения за неудобства и надеюсь, что эта информация окажется полезной».

Последнее сообщение в блоге

В США скважины бурят все глубже из-за исчезновения грунтовых вод
September 30, 2023

Увеличить/ Ирригационная система работает на поле соевых бобов. Поскольку поверхностные воды становятся менее надежными перед лицом изменения клима...

Быть жаворонком может иметь некоторые преимущества для здоровья
September 30, 2023

Увеличить/ Если вы считаете 10:50 разумным временем для пробуждения, это может сказать или не сказать что-то о вашем риске рака молочной железы.Энр...

Огромные потери AT&T на телевидении продолжаются, поскольку еще 900 000 клиентов бегут
September 30, 2023

Увеличить/ Вывеска AT&T возле офиса компании в Нью-Йорке.Гетти Изображения | Роберто Мачадо Ноа 114 с В первом квартале 2020 года AT&T поте...