Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Четыре области подняли цены на проезд в общественном транспорте
  2. С молотка снова пытались продать имущество Виктора Бабарико — чем закончился аукцион
  3. «Прям над домом кружил и улетел». В разных концах страны беларусы слышали «жужжащий звук»
  4. Горнолыжный комплекс «Логойск» закрывается
  5. Российские автопоставщики нашли лазейку, которая помогает сильно сэкономить на покупке авто из ЕС. Схема работает через Беларусь
  6. Власти определили три района для ядерного могильника. В одном люди такого соседства не хотят
  7. В Украине задержали беларусского добровольца — бывшего калиновца
  8. Что за ЧП произошло в Гродненском районе? «Зеркало» узнало подробности — есть пострадавший
  9. Лукашенко поручил выпустить литовские фуры из Беларуси
  10. Узнали, что за девушка присутствует на переговорах Коула и Лукашенко
  11. «Так утвердили». Для абитуриентов-2026 во всех медвузах страны отменили платное обучение на врачей
  12. В Минске расширят и продлят несколько улиц
  13. Еще две области подняли цены на проезд в общественном транспорте


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.