Kazakh

OpenAI GPT-5,5 шығарып, Anthropic-тің Claude Opus 4,7-не қарсы бәсекелеседі

  • OpenAI бүгін GPT-5,5 шығарды, компанияның айтуынша, бұл модель эталондық тесттер бойынша Claude Opus 4,7-ден озып тұр.
  • Модель агенттік кодтау, құралдарды қолдану және тапсырмаларды өз бетімен орындауға бағытталған.
  • API бағасы Anthropic тарифтеріне сәйкес, 1 млн енгізу токеніне 5 доллардан басталады.

OpenAI 23 сәуір күні, «Spud» код атауымен GPT-5.5 шығарды, бұл үлгіні автономды, бірнеше қадамды жұмыстар үшін ең қабілетті жүйесі ретінде ұсынды.

Іске қосу ай сайын Anthropic компаниясының Claude Opus 4.7 нұсқасын шығарғанынан бір апта өткен соң орын алды, екі алдыңғы қатарлы үлгіні тікелей салыстыруға мүмкіндік берді.

GPT-5.5 агенттік жұмысқа және кодтауға бағытталған

GPT-5.5 адам тарапынан үздіксіз бақылаусыз, жоспарлап, орындап, тексеріп, құралдар арқылы қайталап жұмыс істеу үшін жасалған. OpenAI оны келесіше сипаттайды: «нағыз жұмыс пен агенттерге күш беретін жаңа интеллект класы».

X желісіндегі жаңалықтарымызды бақылаңыз — ең соңғы ақпараттарды бірінші болып алу үшін

«Біз итерациялық енгізуді жақтаймыз; GPT-5.5 уже ақылды үлгі болғанымен, алдағы уақытта тез жетілдірулер болады деп күтеміз. Итерациялық енгізу біздің қауіпсіздік стратегиямыздың маңызды бөлігі, агентті ЖИ төзімділігі командалық ойын ретінде дамығанда, әлем сонда ең мықты қаруланады деп сенеміз», — деп жазды Сэм Альтман өзінің жазбасында.

Үлгі қазір ChatGPT Plus, Pro, Business және Enterprise қолданушыларына ұсынылады. Сондай-ақ қуаттырақ Pro нұсқасы бар. API бағаcы — миллион кіріс токеніне 5 доллардан, миллион шығыс токеніне 30 доллардан басталады, контекст терезесі — бір миллион токен.

OpenAI өз бенчмарктеріне сәйкес, GPT-5.5 бірнеше агенттік тапсырмалар бойынша Claude Opus 4.7-ден озып тұр. Terminal-Bench 2.0 бойынша ол 82,7 %-ға, ал Opus 4.7 — 69,4 %-ға жетті.

FrontierMath 1-3 деңгейлерінде үлгі 51,7 %-ға, ал қарсыласы — 43,8 %-ға жетті. Алғашқы тәуелсіз тесттер кодтау мен білім жұмысы бағаларында сондай үрдісті көрсетті.

Claude Opus 4.7 әлі де алда қай салада?

Anthropic моделі зерттеу мақалалары, заңдық және қаржылық қисынды шешу, нұсқауларды орындау тұрақтылығы салаларында тәуелсіз сарапшыларға сәйкес әлі басым.

Opus 4.7 жоғары айқындықтағы көру қабілетіне ие: 3,75 мегапиксельге дейін, бұл алдыңғы үлгіден үш еседей көп.

Компьютермен жұмыс барысында үлгілер арасындағы алшақтық азайды: GPT-5.5 OSWorld-Verified бойынша 78,7 %-ға, ал Opus 4.7 — 78,0 %-ға жетті.

Әрі екі үлгі браузерлік бенчмарктерде кезекпен көшбасшылық етеді — GPT-5.5 Pro 90,1 %-бен алда, Opus — 79,3 %-да.

2026 жылы ЖИ жарысы үдейді

Қатарынан іске қосулар ауқымды заңдылықты көрсетеді: биыл OpenAI бірнеше GPT-5.x нұсқаларын шығарды, Anthropic болса Claude үлгісін бірнеше рет жетілдіріп келді.

Google-дың Gemini 3.1 Pro сол корпоративтік нарыққа бақталасуда.

Кодерлер екеуінің арасында таңдау жасағанда, шешім пайдаланылу мақсатына қарай қабылдануы ықтимал. GPT-5.5 — агенттік автоматтандыру мен ұзақ көкжиекті кодтау үшін күштірек байқалады.

Claude Opus 4.7 дәлдікке талап етілетін аналитикалық процестерге жақсырақ сай келеді. OpenAI жариялаған сандарды тәуелсіз бенчмарктер растай ма, жоқ па, алдағы күндері айқындала түседі.

YouTube-арнамызға жазылыңыз — жетекшілер мен журналистердің сараптамасын тікелей эфирде көру үшін


BeInCrypto ұсынған криптовалюта нарығына қатысты ең соңғы талдауды оқу үшін мында басыңыз.

Жауапкершіліктен бас тарту

Біздің веб-сайттағы барлық ақпарат Trust Project нұсқаулығына сәйкес адал ниетпен және тек жалпы ақпарат беру мақсатында жарияланады. Біздің веб-сайттағы ақпаратқа сүйеніп қабылданған кез келген шешімге оқырманның өзі жауапты болады. Қосымша ақпаратты біздің Пайдалану шарттары, Құпиялылық саясаты және Жауапкершіліктен бас тарту ескертпесі беттерінен оқи аласыз.