Новая нейросеть Opus 4.5 обошла GPT-5.1 сразу в нескольких тестах

Новая нейросеть Opus 4.5 обошла GPT-5.1 сразу в нескольких тестах

Компания Anthropic выпустила Claude Opus 4.5, утверждая, что это лучшая в мире модель искусственного интеллекта для программирования и вычислительных задач. Она набрала 80,9% на SWE-bench Verified, превзойдя конкурентов Gemini 3 Pro и GPT-5.1 Codex Max, и доступна для Android, iOS и на сайте Claude. ОсобенностиПримечательно, что Opus 4.5 впервые превысил порог в 80% на платформе SWE-bench Verified. Для сравнения: Google Gemini 3 Pro получил 76,2%, а OpenAI GPT-5.1 Codex Max – 77,9%.Anthropic также продемонстрировала способность Claude Opus 4.5 успешно проходить сложный внутренний экзамен, который компания использует при отборе инженерного персонала. За два часа тестирования модель набрала более высокий балл, чем любой человек, участвовавший ранее, что подтверждает её превосходство над даже самыми квалифицированными специалистами в ключевых технических областях.Улучшения Claude Opus 4.5 не ограничиваются только программированием. Обладая расширенными возможностями в анализе данных, логике и математике, он эффективно решает широкий спектр повседневных задач, включая углублённые исследования, анализ презентаций и работу с табличными данными. Разработчики отмечают его креативность в по...
18:22, 25.11.2025
Сообщает источник: mobidevices.com  
Рубрика: «Гаджеты»   Поделитесь: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

SteamOS обошла Windows 11 почти во всех играх в тестах на Lenovo Legion Go SSteamOS обошла Windows 11 почти во всех играх в тестах на Lenovo Legion Go S Портал Ars Technica провёл сравнительное тестирование SteamOS и Windows 11 на по ...

Нейросеть GigaChat Сбера сдала сразу два экзамена в Президентской академииНейросеть GigaChat Сбера сдала сразу два экзамена в Президентской академии Команда Сбербанка рассказала о новом достижении фирменной нейросетевой модели. К ...

Очевидцы сообщили сразу о нескольких ДТП с легковушкамиОчевидцы сообщили сразу о нескольких ДТП с легковушками Pro ГородСегодня каналы «ДТП Пенза» и «Сова Пенза Авто» сообщили сразу о несколь ...

Галлямов  Губерниеву после слов о допинг-тестах: Все процедуры прохожу в установленном порядке. В интернете все такие гангстеры, а при встрече сразу Галлямов – Губерниеву после слов о допинг-тестах: «Все процедуры прохожу в установленном порядке. В интернете все такие гангстеры, а при встрече сразу зайчики» Чемпион мира в парном катании Александр Галлямов ответил комментатору и ведущему ...

Марочко: ВС России продвинулись сразу на нескольких улицах в ВолчанскеМарочко: ВС России продвинулись сразу на нескольких улицах в Волчанске ВС России в ходе активных боёв продвинулись сразу на нескольких улицах в юго-зап ...

В коде зарыты ошибки  новая нейросеть вытащит их мгновенноВ коде зарыты ошибки — новая нейросеть вытащит их мгновенно Можно ли доверить поиски уязвимостей не специалистам по безопасности, а… нейросе ...

Что умеет новая нейросеть, разработанная в России  вы будете удивленыЧто умеет новая нейросеть, разработанная в России — вы будете удивлены Скорость и точность — ключевые факторы в разработке медицинских имплантатов. Ран ...

Путин передал под временное управление активы сразу нескольких компанийПутин передал под временное управление активы сразу нескольких компаний Президент России Владимир Путин 13 января подписал указ о передаче российских «д ...

В Барнауле 12 декабря отключат светофоры сразу на нескольких перекрестках. СписокВ Барнауле 12 декабря отключат светофоры сразу на нескольких перекрестках. Список В Барнауле водителей и пешеходов предупредили о временных изменениях в работе го ...

Пляжи сразу нескольких отелей на египетском курорте закрыли из-за агрессивной акулыПляжи сразу нескольких отелей на египетском курорте закрыли из-за агрессивной акулы На курорте Хургада временно закрыли пляжи сразу пяти гостиничных комплексов из-з ...

Провал Qualcomm: новая платформа Qualcomm Snapdragon X2 Plus проиграла старому Apple M4 в первых тестахПровал Qualcomm: новая платформа Qualcomm Snapdragon X2 Plus проиграла старому Apple M4 в первых тестах На этой неделе состоялась официальная премьера однокристальных платформ Qualcomm ...

От атак в Черном море до обысков в раде: Украина оказалась в эпицентре сразу нескольких скандаловОт атак в Черном море до обысков в раде: Украина оказалась в эпицентре сразу нескольких скандалов Украина как будто уверовала, что ей все нипочем, и продолжает искать границы доп ...

Был всего на волоске от лишения премии: как глава областного Минобра закрыл вопрос с капремонтом сразу нескольких объектовБыл всего на волоске от лишения премии: как глава областного Минобра закрыл вопрос с капремонтом сразу нескольких объектов Пресс-служба регионального МинобраКапремонт объектов по линии министерства образ ...

Солнце снова взрывается: после нескольких недель затишья зафиксирована новая вспышка высшего класса XСолнце снова «взрывается»: после нескольких недель затишья зафиксирована новая вспышка высшего класса X На Солнце вновь зафиксированы вспышки высшего класса X: сегодня в 05:49 по моско ...

В Волгограде жители нескольких нескольких улиц остались без отопления и горячей водыВ Волгограде жители нескольких нескольких улиц остались без отопления и горячей воды В Советском районе Волгограда произошла коммунальная авария, в результате которо ...

Доступен звуковой кодек Opus 1.6Доступен звуковой кодек Opus 1.6 После полутора лет разработки организация Xiph.Org, занимающаяся созданием свобо ...

Anthropic представила новую модель Claude Opus 4.5Anthropic представила новую модель Claude Opus 4.5 Компания Anthropic выпустила новую языковую модель Claude Opus 4.5, позиционируя ...

Anthropic обновила модель Opus до версии 4.5, добавив поддержку Chrome и ExcelAnthropic обновила модель Opus до версии 4.5, добавив поддержку Chrome и Excel Теперь расширение Chrome смогут использовать все подписчики Max, а инструмент дл ...

Anthropic выпустила Opus 4.5: работа с Excel, infinite chat и новый уровень безопасностиAnthropic выпустила Opus 4.5: работа с Excel, infinite chat и новый уровень безопасности Компания Anthropic официально представила обновленную версию своего флагманского ...

Инженеры проиграли ИИ: модель Claude Opus 4.5 справилась с заданием Anthropic лучше любого из людейИнженеры проиграли ИИ: модель Claude Opus 4.5 справилась с заданием Anthropic лучше любого из людей Anthropic вчера объявила о выпуске новой флагманской модели искусственного интел ...

WWW.VSMI.DAY Поиск в новостях