Google разрабатывает всевозможные технологии ИИ, включая универсальную речевую модель, которая является частью попытки создать модель, способную понимать 1000 наиболее распространенных языков мира.
Пока Microsoft и Google спорят о том, чей чатбот с искусственным интеллектом лучше, это не единственное применение машинного обучения и языковых моделей. Наряду со слухами о планах продемонстрировать более 20 продуктов на базе искусственного интеллекта во время ежегодного мероприятия I/O в этом году, Google продвигается к своей цели — созданию языковой модели ИИ, поддерживающей 1 000 различных языков. В обновлении, опубликованном в понедельник, Google поделилась дополнительной информацией об универсальной речевой модели (USM) — системе, которую Google называет «важнейшим первым шагом» в достижении своих целей.
В ноябре прошлого года компания объявила о своих планах по созданию языковой модели, поддерживающей 1 000 наиболее распространенных языков мира, и одновременно представила модель USM. Google описывает USM как «семейство самых современных речевых моделей» с 2 миллиардами параметров, обученных на 12 миллионах часов речи и 28 миллиардах предложений на более чем 300 языках.
USM, который YouTube уже использует для создания закрытых титров, также поддерживает автоматическое распознавание речи (ASR). Оно автоматически определяет и переводит языки, включая английский, мандаринский, амхарский, себуано, ассамский и другие.
На данный момент, по словам Google, USM поддерживает более 100 языков и послужит «фундаментом» для создания еще более обширной системы. Meta работает над аналогичным инструментом перевода с искусственным интеллектом, который пока находится на ранней стадии. Подробнее о USM и о том, как она работает, можно прочитать в исследовательском документе, который Google разместил здесь.
Одним из мест применения этой технологии могут стать очки дополненной реальности, подобные тем, которые Google продемонстрировал в прошлом году на мероприятии I/O. Они смогут распознавать и предоставлять переводы в режиме реального времени, появляющиеся прямо перед глазами. Однако эта технология все еще кажется немного отдаленной, а искажение арабского языка, допущенное Google во время I/O, доказывает, как легко можно ошибиться.
Каталог нейросетей Ailib. Вся информация взята из открытых источников.
Реклама и размещение: [email protected] или t.me/fozzepe