Поддержать команду Зеркала
Беларусы на войне
  1. В ISW пояснили, что может означать затягивание РФ переговоров с Украиной
  2. Одно мгновение — и людей засосало в ловушку на дне моря. Они медленно умирали в темноте, потому что никто не рискнул их спасать
  3. У Джо Байдена диагностировали смертельную болезнь
  4. Синоптики объявили на понедельник неблагоприятное гидрометеорологическое явление. В чем причина?
  5. Сквозь отвратительный лес печали. Письмо команды «Зеркала» руководительницам TUT.BY Марине Золотовой и Людмиле Чекиной
  6. Президентские выборы в Польше: экзитполы показали, кто пройдет во второй тур. Но разрыв между противниками минимальный
  7. Победителем «Евровидения-2025» стал исполнитель Джей Джей из Австрии
  8. К проблемам с картофелем и луком добавились трудности с еще одним популярным товаром. Что случилось на этот раз?
  9. Пресс-секретарь Путина рассказал, при каких условиях возможна его встреча с Зеленским
  10. На рынке труда усиливается проблема, которой недавно озадачился Лукашенко
  11. Силовики взялись «помогать» очередным крупным компаниям — с маски-шоу и задержаниями. Чем опасно такое поведение и почему терпит бизнес


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.