Изменить содержимое

OpenAI анонсировала CriticGPT: новую модель для улучшения точности GPT-4

OpenAI анонсировала CriticGPT: новую модель для улучшения точности GPT-4

OpenAI анонсировала CriticGPT_ новую модель для улучшения точности GPT-4

OpenAI разработала CriticGPT, основанную на GPT-4, для помощи тренерам-людям в проверке программного кода, генерируемого ChatGPT. Модель анализирует код и указывает на потенциальные ошибки, облегчая обнаружение недочетов, которые могли бы остаться незамеченными.

Преимущества CriticGPT

В исследованиях, проводимых OpenAI, аннотаторы предпочли замечания CriticGPT замечаниям людей в 63% случаев с естественными ошибками языковых моделей. Это предпочтение объясняется тем, что CriticGPT генерировала меньше ложных срабатываний и бесполезных замечаний. Совместная работа людей и CriticGPT также привела к созданию более полных отчетов об ошибках, чем при работе только людей. Кроме того, использование CriticGPT помогло снизить уровень галлюцинаций, возникающих при работе только модели.

Обучение CriticGPT

Для разработки CriticGPT использовался большой набор данных с преднамеренно внесенными ошибками. Эксперты модифицировали код ChatGPT, внося ошибки и предоставляя примеры обратной связи, что позволило модели научиться выявлять и критиковать различные типы ошибок.

Новые техники и возможности

Исследователи разработали новую технику Force Sampling Beam Search (FSBS), которая помогает CriticGPT писать более подробные отчеты об ошибках. Этот метод позволяет регулировать степень тщательности поиска проблем и частоту генерации несуществующих ошибок, что можно настраивать в зависимости от конкретных задач.

Интересно, что CriticGPT продемонстрировала свои возможности не только в анализе кода. В экспериментах модель выявила ошибки в 24% случаев в обучающих данных ChatGPT, которые ранее считались безупречными по оценке людей. Эти ошибки позже подтвердились экспертами.

Ограничения и перспективы

Несмотря на успехи, у CriticGPT есть ограничения. Модель обучалась на относительно коротких ответах ChatGPT, что может быть недостаточным для оценки более длинных и сложных задач. Хотя CriticGPT и снижает количество ложных срабатываний, полностью устранить их не удается, и тренеры-люди могут ошибаться в маркировке на основе ложных результатов. Модель эффективнее обнаруживает ошибки, локализованные в определенной точке кода, тогда как ошибки могут быть распределены по нескольким частям ответа, что представляет проблему для будущих версий модели.

Будущие планы

OpenAI планирует использовать модели, подобные CriticGPT, для помощи тренерам в оценке выходных данных языковых моделей, что улучшит инструменты оценки и повысит эффективность работы. Однако даже с помощью ИИ сложные задачи могут быть проблемой для людей.

Ещё в категории

OpenAI GPT-4.5 System Card
Перевод полного отчета о системе GPT-4.5 на русский язык и выводы по нему. Развитие языковых моделей не стоит на месте:...
sam altman
OpenAI, лидер в области искусственного интеллекта, снова удивляет инновационными планами. В этой статье мы расскажем о последнем обновлении дорожной карты,...
o3 mini
OpenAI официально запускает новую модель искусственного интеллекта o3-mini, которая станет доступной уже сегодня.
Прощай 3.5! OpenAI представила модель GPT-4o mini
OpenAI представила свою новейшую модель искусственного интеллекта — GPT-4o mini, которая станет заменой GPT-3.5. Эта модель обещает значительно улучшить качество...
openai_prezentovala_novuyu_model_gpt_5_na_konferenczii_microsoft
На недавно состоявшейся конференции Microsoft генеральный директор OpenAI, Сэм Альтман, представил долгожданную модель GPT-5. Это событие стало важной вехой в...
Новейшая бесплатная модель OpenAI - GPT-4o
OpenAI выпускает новую флагманскую модель генеративного ИИ под названием GPT-4o, которая будет «итеративно» внедряться в продукты компании для разработчиков и...
Музыкальный дебют «Sora»_ ее клип стал главной темой обсуждений в сети
Фантастические образы, ожившее искусство и магия звука — все это воплотилось в новом видеоклипе, созданном при помощи нейросети OpenAI для...
OpenAI_анонсировала_выпуск_GPT_4_Turbo,_модели_искусственного_интеллекта
На первой конференции для разработчиков OpenAI была представлена улучшенная версия языковой модели GPT-4, названная GPT-4 Turbo. Новая модель обладает большей...
OpenAI_провела_свою_первую_конференцию_для_разработчиков
OpenAI, разработчик ChatGPT, провела свою первую конференцию для разработчиков, в которой представила несколько важных новостей. Одним из самых интересных анонсов...
Новую_модель_озвучки_текста_от_OpenAI_можно_попробовать_бесплатно
OpenAI представила несколько API для разработчиков, чтобы они могли использовать новую модель синтеза речи в своих проектах. Одним из таких...
ChatGPT_теперь_может_создавать_изображения_OpenAI_анонсировала_новую
OpenAI радостно объявила о выходе обновления своей генеративной системы искусственного интеллекта, ChatGPT. В своём официальном блоге компания поделилась новостью о...
Open AI анонсировало - ChatGPT4 Vision
Open AI внесли значительные изменения в свою платформу, а именно анонсировали ChatGPT4 Vision. Это обновление привнесет новые мультимодальные функции, которые...