В дождливый вторник в Сан-Франциско руководители компании Apple вышли на сцену в переполненном зале, чтобы представить iPhone пятого поколения. Телефон, который выглядел идентично предыдущей версии, имел новую функцию, о которой вскоре заговорила вся аудитория: Siri, виртуальный помощник.
Скотт Форстолл, тогдашний руководитель отдела программного обеспечения Apple, нажал на кнопку iPhone, чтобы вызвать Siri, и стал задавать ей вопросы. По его просьбе Siri проверила время в Париже («20:16», — ответила Siri), дала определение слову «митоз» («Деление клетки, при котором ядро делится на ядра, содержащие одинаковое количество хромосом», — сказала она) и вывела список из 14 греческих ресторанов с высоким рейтингом, пять из которых находились в Пало-Альто, штат Калифорния.
«Я давно работаю в сфере А.И., и это все еще поражает меня», — сказал г-н Форстолл.
Это было 12 лет назад. С тех пор Siri и конкурирующие помощники с искусственным интеллектом, такие как Amazon Alexa и Google Assistant, далеко не поразили людей. Технология в значительной степени осталась без изменений, а говорящие помощники стали предметом шуток, в том числе в скетче «Saturday Night Live» 2018 года, в котором рассказывалось об умной колонке для пожилых людей.
Сейчас мир технологий восхищается другим видом виртуальных помощников — чат-ботами. Эти боты с поддержкой искусственного интеллекта, такие как ChatGPT и новый ChatGPT Plus от компании OpenAI из Сан-Франциско, могут быстро импровизировать ответы на вопросы, набранные в чате. Люди использовали ChatGPT для решения сложных задач, таких как кодирование программного обеспечения, составление коммерческих предложений и написание художественной литературы.
И ChatGPT, который использует искусственный интеллект, чтобы угадать, какое слово будет следующим, быстро совершенствуется. Несколько месяцев назад он не мог написать правильное хайку; теперь он может сделать это с энтузиазмом. Во вторник OpenAI представила свой движок А.И. нового поколения, GPT-4, на котором работает ChatGPT.
Ажиотаж вокруг чат-ботов иллюстрирует, как Siri, Alexa и другие голосовые помощники, которые когда-то вызывали такой же энтузиазм, растратили свое преимущество в гонке A.I..
За последнее десятилетие продукты столкнулись с препятствиями. Siri столкнулась с технологическими препятствиями, в том числе с неуклюжим кодом, который требовал недель для обновления базовых функций, сказал Джон Бурки, бывший инженер Apple, работавший над помощником. Amazon и Google неправильно рассчитали, как будут использоваться голосовые помощники, что привело к тому, что они стали вкладывать деньги в те области, где технология редко окупалась, говорят бывшие сотрудники. По их словам, когда эти эксперименты провалились, энтузиазм в отношении технологии в компаниях угас.
Голосовые помощники «тупы как камень», — сказал Сатья Наделла, генеральный директор Microsoft, в интервью Financial Times в этом месяце, заявив, что более новые A.I. будут лидировать. Microsoft тесно сотрудничает с OpenAI, инвестировав 13 миллиардов долларов в стартап и внедрив его технологии в поисковую систему Bing, а также в другие продукты.
Выбор редакции
36 часов в Тайбэе, Тайвань
Как заставить дочь принять моего парня спустя восемь лет?
Безопасно ли лечить шею у мануального терапевта?
Apple отказалась от комментариев по поводу Siri. Google заявил, что намерен создать отличного виртуального помощника, который будет помогать людям на их телефонах, в домах и автомобилях; компания проводит отдельное тестирование чат-бота под названием Bard. Компания Amazon заявила, что за последний год число клиентов, пользующихся Alexa, увеличилось на 30 процентов по всему миру, и что она с оптимизмом смотрит на свою миссию по созданию А.И. мирового класса.
Помощники и чат-боты основаны на различных видах А.И. Чат-боты работают на основе так называемых больших языковых моделей, которые представляют собой системы, обученные распознавать и генерировать текст на основе огромных наборов данных, взятых из Интернета. Затем они могут предложить слова для завершения предложения.
В отличие от них, Siri, Alexa и Google Assistant — это, по сути, так называемые системы команд и управления. Они могут понимать ограниченный список вопросов и запросов, таких как «Какая погода в Нью-Йорке?» или «Включи свет в спальне». Если пользователь просит виртуального помощника сделать что-то, чего нет в его коде, бот просто говорит, что не может помочь.
Siri также имела громоздкую конструкцию, из-за которой добавление новых функций занимало много времени, говорит г-н Бурки, которому в 2014 году поручили работу по улучшению Siri. База данных Siri содержит гигантский список слов, включая имена музыкальных исполнителей и названия мест, таких как рестораны, на почти двух десятках языков.
Это превратило ее в «один большой снежный ком», — сказал он. Если кто-то хочет добавить слово в базу данных Siri, добавил он, «оно попадает в одну большую кучу».
Поэтому, казалось бы, простые обновления, такие как добавление нескольких новых фраз в набор данных, потребуют перестройки всей базы данных, что может занять до шести недель, сказал г-н Бурки. Добавление более сложных функций, таких как новые инструменты поиска, может занять почти год. По его словам, это означает, что у Siri нет пути к тому, чтобы стать творческим помощником, как ChatGPT.
По словам бывших руководителей Amazon и Google, Alexa и Google Assistant используют технологии, схожие с технологией Siri, но компаниям не удалось добиться значительного дохода от этих помощников. (В отличие от них, компания Apple успешно использовала Siri для привлечения покупателей к своим iPhone).
После того как в 2014 году Amazon выпустила Echo, умную колонку, работающую на базе Alexa, компания надеялась, что этот продукт поможет ей увеличить продажи в ее интернет-магазине за счет того, что покупатели смогут разговаривать с Alexa для оформления заказов, сказал бывший руководитель Amazon, имеющий отношение к Alexa. Но хотя люди с удовольствием играли с возможностями Alexa отвечать на подсказки о погоде и устанавливать будильники, мало кто просил Alexa заказывать товары, добавил он.
Возможно, Amazon слишком много инвестировала в производство новых видов оборудования, таких как снятые сейчас с производства будильники и микроволновые печи, работающие с Alexa, которые продавались по цене или ниже себестоимости, сказал бывший руководитель.
Компания также недоинвестировала в создание экосистемы, позволяющей людям легко расширять возможности Alexa, подобно тому, как это сделала компания Apple со своим магазином App Store, который способствовал росту интереса к iPhone, сказал этот человек. Хотя Amazon предлагал магазин «навыков», чтобы заставить Alexa управлять сторонними аксессуарами, такими как выключатели, людям было сложно найти и настроить навыки для колонок — в отличие от легкого опыта загрузки мобильных приложений из магазинов приложений.
«У нас никогда не было того момента App Store для помощников», — говорит Каролина Миланези, аналитик по потребительским технологиям исследовательской компании Creative Strategies, которая была консультантом Amazon.
В конце прошлого года подразделение Amazon, работающее над Alexa, стало основным объектом сокращения 18 000 сотрудников, и ряд топ-менеджеров Alexa покинули компанию.
Кинли Пирсолл, представитель Amazon, сказала, что Alexa — это нечто большее, чем голосовой помощник, и «мы с таким же оптимизмом относимся к этой миссии».
Осечки Amazon с Alexa могли сбить Google с пути, считает бывший менеджер, работавший над Google Assistant. Инженеры Google потратили годы на эксперименты со своим помощником, чтобы подражать возможностям Alexa, включая разработку умных колонок и планшетных экранов с голосовым управлением для управления домашними аксессуарами, такими как термостаты и выключатели света. Позже компания интегрировала рекламу в эти домашние продукты, что не стало основным источником дохода.
Со временем Google поняла, что большинство людей используют голосового помощника только для ограниченного числа простых задач, таких как запуск таймеров и воспроизведение музыки, сказал бывший менеджер. В 2020 году, когда Прабхакар Рагхаван, один из руководителей Google, возглавил Google Assistant, его группа переориентировала виртуального помощника в качестве ключевой функции для смартфонов Android.
В январе, когда материнская компания Google сократила 12 000 сотрудников, команда, работающая над операционными системами для домашних устройств, потеряла 16 процентов своих инженеров.
Многие крупные технологические компании сейчас в спешке пытаются придумать ответ на ChatGPT. В прошлом месяце в штаб-квартире Apple прошел ежегодный саммит А.И. — внутреннее мероприятие для сотрудников, на котором они узнали о своей большой языковой модели и других инструментах А.И., сообщили два человека, которые были проинформированы о программе. Многие инженеры, включая членов команды разработчиков Siri, тестировали концепции генерирования языка каждую неделю, сказали люди.
Во вторник компания Google также заявила, что вскоре выпустит инструменты генеративного А.И., которые помогут предприятиям, правительствам и разработчикам программного обеспечения создавать приложения со встроенными чат-ботами и внедрять базовые технологии в свои системы.
В будущем технологии чат-ботов и голосовых помощников объединятся, говорят эксперты в области А.И.. Это означает, что люди смогут управлять чат-ботами с помощью речи, а пользователи продуктов Apple, Amazon и Google смогут просить виртуальных помощников помочь им в работе, а не только в проверке погоды.
«Раньше эти продукты не работали, потому что у нас не было возможности вести диалог на уровне человека», — говорит Аравинд Шринивас, основатель Perplexity, компании, занимающейся разработкой А.И., которая предлагает поисковую систему на базе чатботов. «Теперь у нас есть».
Каталог нейросетей Ailib. Вся информация взята из открытых источников.
Реклама и размещение: [email protected] или t.me/fozzepe