OpenAI анонсировала CriticGPT: новую модель для улучшения точности GPT-4 | Библиотека нейросетей и промтов на русском языке

—

OpenAI анонсировала CriticGPT: новую модель для улучшения точности GPT-4

01.07.24

OpenAI разработала CriticGPT, основанную на GPT-4, для помощи тренерам-людям в проверке программного кода, генерируемого ChatGPT. Модель анализирует код и указывает на потенциальные ошибки, облегчая обнаружение недочетов, которые могли бы остаться незамеченными.

Преимущества CriticGPT

В исследованиях, проводимых OpenAI, аннотаторы предпочли замечания CriticGPT замечаниям людей в 63% случаев с естественными ошибками языковых моделей. Это предпочтение объясняется тем, что CriticGPT генерировала меньше ложных срабатываний и бесполезных замечаний. Совместная работа людей и CriticGPT также привела к созданию более полных отчетов об ошибках, чем при работе только людей. Кроме того, использование CriticGPT помогло снизить уровень галлюцинаций, возникающих при работе только модели.

Обучение CriticGPT

Для разработки CriticGPT использовался большой набор данных с преднамеренно внесенными ошибками. Эксперты модифицировали код ChatGPT, внося ошибки и предоставляя примеры обратной связи, что позволило модели научиться выявлять и критиковать различные типы ошибок.

Новые техники и возможности

Исследователи разработали новую технику Force Sampling Beam Search (FSBS), которая помогает CriticGPT писать более подробные отчеты об ошибках. Этот метод позволяет регулировать степень тщательности поиска проблем и частоту генерации несуществующих ошибок, что можно настраивать в зависимости от конкретных задач.

Интересно, что CriticGPT продемонстрировала свои возможности не только в анализе кода. В экспериментах модель выявила ошибки в 24% случаев в обучающих данных ChatGPT, которые ранее считались безупречными по оценке людей. Эти ошибки позже подтвердились экспертами.

Ограничения и перспективы

Несмотря на успехи, у CriticGPT есть ограничения. Модель обучалась на относительно коротких ответах ChatGPT, что может быть недостаточным для оценки более длинных и сложных задач. Хотя CriticGPT и снижает количество ложных срабатываний, полностью устранить их не удается, и тренеры-люди могут ошибаться в маркировке на основе ложных результатов. Модель эффективнее обнаруживает ошибки, локализованные в определенной точке кода, тогда как ошибки могут быть распределены по нескольким частям ответа, что представляет проблему для будущих версий модели.

Будущие планы

OpenAI планирует использовать модели, подобные CriticGPT, для помощи тренерам в оценке выходных данных языковых моделей, что улучшит инструменты оценки и повысит эффективность работы. Однако даже с помощью ИИ сложные задачи могут быть проблемой для людей.

Ещё в категории OpenAI

OpenAI ChatGPT

28.02.25

Системная карта OpenAI GPT-4.5

Перевод полного отчета о системе GPT-4.5 на русский язык и выводы по нему. Развитие языковых моделей не стоит на месте:...

OpenAI ChatGPT

13.02.25

OpenAI обновляет дорожную карту: нас ждёт от GPT-4.5 (Orion) и GPT-5

OpenAI, лидер в области искусственного интеллекта, снова удивляет инновационными планами. В этой статье мы расскажем о последнем обновлении дорожной карты,...

OpenAI ChatGPT

31.01.25

⚡ OpenAI выпускает o3-mini – мощную нейросеть с бесплатным доступом

OpenAI официально запускает новую модель искусственного интеллекта o3-mini, которая станет доступной уже сегодня.

Прощай 3.5! OpenAI представила модель GPT-4o mini

OpenAI ChatGPT

19.07.24

Прощай 3.5! OpenAI представила модель GPT-4o mini

OpenAI представила свою новейшую модель искусственного интеллекта — GPT-4o mini, которая станет заменой GPT-3.5. Эта модель обещает значительно улучшить качество...

OpenAI

27.05.24

OpenAI презентовала новую модель GPT-5 на конференции Microsoft

На недавно состоявшейся конференции Microsoft генеральный директор OpenAI, Сэм Альтман, представил долгожданную модель GPT-5. Это событие стало важной вехой в...

Новейшая бесплатная модель OpenAI - GPT-4o

OpenAI ChatGPT

13.05.24

Новейшая бесплатная модель OpenAI — GPT-4o

OpenAI выпускает новую флагманскую модель генеративного ИИ под названием GPT-4o, которая будет «итеративно» внедряться в продукты компании для разработчиков и...

Музыкальный дебют «Sora»_ ее клип стал главной темой обсуждений в сети

Sora OpenAI

06.04.24

Музыкальный дебют «Sora»: ее клип стал главной темой обсуждений в сети

Фантастические образы, ожившее искусство и магия звука — все это воплотилось в новом видеоклипе, созданном при помощи нейросети OpenAI для...

OpenAI

08.11.23

OpenAI анонсировала выпуск GPT-4 Turbo, модели искусственного интеллекта с поддержкой 128 тысяч токенов и более доступной ценой в три раза по сравнению с GPT-4

На первой конференции для разработчиков OpenAI была представлена улучшенная версия языковой модели GPT-4, названная GPT-4 Turbo. Новая модель обладает большей...

OpenAI

08.11.23

OpenAI провела свою первую конференцию для разработчиков

OpenAI, разработчик ChatGPT, провела свою первую конференцию для разработчиков, в которой представила несколько важных новостей. Одним из самых интересных анонсов...

OpenAI

08.11.23

Новую модель озвучки текста от OpenAI можно попробовать бесплатно

OpenAI представила несколько API для разработчиков, чтобы они могли использовать новую модель синтеза речи в своих проектах. Одним из таких...

OpenAI

20.10.23

ChatGPT теперь может создавать изображения. OpenAI анонсировала новую функцию

OpenAI радостно объявила о выходе обновления своей генеративной системы искусственного интеллекта, ChatGPT. В своём официальном блоге компания поделилась новостью о...

OpenAI

26.09.23

Open AI анонсировало — ChatGPT4 Vision

Open AI внесли значительные изменения в свою платформу, а именно анонсировали ChatGPT4 Vision. Это обновление привнесет новые мультимодальные функции, которые...