2024. március 6. 11:01

A GPT-4-et is felülmúlja az Anthropic új Claude modellje

Több mint kétszer drágább a Claude 3 Opus által generált szöveg, mint amennyit az OpenAI GPT-4 Turbo kimenetéért kell fizetni, de az Anthropic állítása szerint fejlettségben sikerült felülmúlnia a legnagyobb riválisokat is.

A hároméves Anthropic startup bejelentette Claude 3 nevű nagy nyelvi modellcsaládját, amellyel állítása szerint az OpenAI GPT-4 modelljét is lekörözi. A legújabb modellcsalád három taggal érkezik: köztük a legerősebb az Opus, ami az Anthropic API-ján keresztül férhető hozzá Claude Pro előfizetéssel a fejlesztők és a felhasználók számára. A Sonnet az Anthropic ingyenes webes chatbotját működteti, a legkisebb modell, a Haiku pedig még nem érhető el.

A matematikai, kódgenerálási és érvelési képességeket mérő akadémiai benchmark méréseken az Opus magasabb pontszámot ért el a GPT-4-nél és a Gemini Ultra-nal is a fejlesztők jelentése szerint. Az Anthropic egyenesen odáig megy, hogy szerinte az Opus közel emberi szinten ért és old meg összetett feladatokat, az általános intelligencia határterületét súrolva. Az Anthropic szerint a Claude 3 Opus tíz mérésben múlta felül a GPT-4-et, beleértve az MMLU-t (egyetemi szintű tudás), a GSM8K-t (matematika), a HumanEval-t (kódolás) és a HellaSwagot (általános tudás). Az előzések egy része rendkívül kicsi előny: az egyetemi tudássszintet mérő teszten az Opus 86,8 százalékkal előzte meg az OpenAI technológiájának 86,4 százalékát. Érvelésben viszont közel 15 százalékot vert az OpenAI jelenleg elérhető legerősebb nagy nyelvi modelljére, és kódolásban is jóval előrébb tart.

A kisebb méretű Sonnet és Haiku némileg gyengébbek, de a GPT-3.5-öt még megelőzik, a Google Gemini Ultra és Prót azonban nem. A Claude 3 bemenet terén multimodális: bár képes feldolgozni és értelmezni a képeket, de generálásukra nem képes, illetve nem tudja kezelni az audio- vagy videobemeneteket, ellentétben a ChatGPT-vel vagy a Geminivel.

Mivel az Opus elsősorban azok számára készült, akiknek magas szintű megértést kínáló modellre van szükségük a tudományos kutatásokhoz, vagy összetett jelentések elemzéséhez, ezért borsosabb árú, 15 dollárba kerül egy millió tokenre nyúló bemeneti prompt feldolgozása, és 75 dollárba egymillió token generálása kimenetre. Az OpenAI 10 és 30 dollár közötti díjat számít fel egymillió token feldolgozásáért és generálásáért a GPT-4 Turbo szolgáltatás esetében.

sszehasonlítás

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Ősszel 6 alkalmas, 18 órás Kafka és CI/CD alapozó képzéseket indít a HWSW. Most early bird kedvezménnyel jelentkezhetsz!

Kafka és CI/CD alapozó online képzéseket indít a HWSW! Ősszel 6 alkalmas, 18 órás Kafka és CI/CD alapozó képzéseket indít a HWSW. Most early bird kedvezménnyel jelentkezhetsz!

A fejlesztők szerint érdemi előrelépést sikerült elérni olyan téren, hogy az Opus, a Sonnet és a Haiku lényegesen kisebb valószínűséggel utasít vissza nem kártékony promptokat az előző modelleknél, amelyek túlságosan érzékenyek voltak a szolgáltatás szabályzatára.

A Sonnet a vállalati felhasználókat célozza, akiknek információk keresésére, marketingszövegek írására vagy kódgenerálásra van szükségük. A nagy skálájú telepítésekre optimalizált modell 3 dollárba, lletve 15 dollárba kerül egy millió token kezeléséhez bemeneten és kimeneten. A legkisebb méretű, főleg tartalmak moderálására, fordításra és ügyfélszolgálati feladatokra szánt haiku ennél is olcsóbb lesz, mindössze 0,25 dollárba kerül, és 1,25 dollárba kerül egy millió token feldolgozása és generálása.

A tavaly 5 milliárd dollárra becsült Anthropic szeptemberben jelentette be a Claude 2 chatbot első fogyasztóknak szánt előfizetői szintjét, amit a ChatGPT ígéretes riválisaként mutatott be, egy szemléletes összehasonlítással: míg a ChatGPT 3000 ezer szó összegzésére képes, addig a Claude 2 esetében ez 75 ezer szó, mivel az alatta dolgozó nyelvi modell kontextus-ablaka több tokenből áll. A cég más téren is fűződik az OpenAI-hoz, lévén annak volt kutatási vezetői alapították 2021-ben, az ötlet mögé pedig beállt a többek közt befektetőként a Google, a Zoom, a Salesforce, a Sound Ventures is, eddig összesen 2,7 milliárd dolárrral.

Szeptemberben egy másik fontos esemény is történt: az Amazon ekkor jelenetette be, hogy összesen négymilliárd dollárt lapátolhat az Anthropicba, amivel erősebb pozíciót vívhat ki magának a Microsoft, a Meta, a Google és az Nvidia által uralt szektorban. Az e-kereskedelmi óriás első körben 1,25 milliárd dollárért vásárol kisebbségi részesedést a vállalkozásban, illetve stratégiai együttműködést kötött a startuppal. Az ügylet részeként az Amazon közölte arra vonatkozó szándékát, hogy a későbbiekben akár összesen 4 milliárd dollárra (kb. 1,47 ezer milliárd forint) növelheti a befektetéseket. A Claude 3-at az Amazon a Bedrock felhőplatformon fogja hosztolni.

A GPT-4-et is felülmúlja az Anthropic új Claude modellje

Több mint kétszer drágább a Claude 3 Opus által generált szöveg, mint amennyit az OpenAI GPT-4 Turbo kimenetéért kell fizetni, de az Anthropic állítása szerint fejlettségben sikerült felülmúlnia a legnagyobb riválisokat is.

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Már több pénze van a Foxconnak szerverből, mint iPhone-ból

Az AI technológiai és munkaerőpiaci hatásai az informatikában (2025)

5G: A Telekom továbbra is fedésben, a Yettel pedig sebességben bajnok

A GPT-4-et is felülmúlja az Anthropic új Claude modellje

Több mint kétszer drágább a Claude 3 Opus által generált szöveg, mint amennyit az OpenAI GPT-4 Turbo kimenetéért kell fizetni, de az Anthropic állítása szerint fejlettségben sikerült felülmúlnia a legnagyobb riválisokat is.

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Már több pénze van a Foxconnak szerverből, mint iPhone-ból

Az AI technológiai és munkaerőpiaci hatásai az informatikában (2025)

5G: A Telekom továbbra is fedésben, a Yettel pedig sebességben bajnok

Végleges az új Pebble órák dizájnja

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Elrajtolt a YouTube AI-alapú életkor-ellenőrzőjének tesztje

Végleges az új Pebble órák dizájnja

Elrajtolt a YouTube AI-alapú életkor-ellenőrzőjének tesztje

Magenta AI-jal érkezett a Telekom új saját márkás készüléke