Szerző: Dömös Zsuzsanna

2024. július 31. 14:38

Elérhetővé vált az OpenAI fejlett hangasszisztense

Egyelőre a ChatGPT Plus szűkebb felhasználói köre próbálhatja ki az Advanced Voice Mode-ot, aminek az elérhetőségét fokozatosan terjeszti ki a cég a következő hónapok során.

A fizetős ChatGPT Plus szolgáltatás előfizetőinek szűk köre már kipróbálhatja az OpenAI új hangasszisztensét, az Advanced Voice Mode-ot, aminek a rajtja kissé mostohán indul, lévén ennek kapcsán rúgta össze a port a cég és Scarlet Johansson, aki nehezményezte, hogy a  „Sky” fantázianévre keresztelt beállítás túlságosan hasonlít az ő hangjára.

Az OpenAI májusban mutatta be az újgenerációs GPT-4o (omni) modellt, ami „natívan multimodális", tehát képes tartalmat generálni, vagy parancsokat értelmezni hang, szöveg vagy kép formájában, és minden bemeneti módszernél jelentősen javulni tudott az elődjéhez képest, valós időben, késleltetés nélkül tud kommunikálni kamerakép, írott szöveg és élő beszéd alapján is. 

alpha

Ollé, lesz SYSADMINDAY!

Duna melletti szabadtéri helyszínen idén is megrendezzük a hazai Sysadmindayt, az IT-üzemeltetők világnapját. Standup, IT security meetup, szakmázás, barátok, még több sörcsap.

Ollé, lesz SYSADMINDAY! Duna melletti szabadtéri helyszínen idén is megrendezzük a hazai Sysadmindayt, az IT-üzemeltetők világnapját. Standup, IT security meetup, szakmázás, barátok, még több sörcsap.

Kiemelhető újdonság, hogy miként képes kezelni a modell az audióbemenetet, ez egyben a legrémisztőbb is: a hangasszisztensi funkció valós időben, gyakorlatilag késleltetés nélkül reagál, a fejlesztők elmondása szerint átlagosan körülbelül 320 ezredmásodperc alatt. Egy 2009-es tanulmány szerint ez hasonló az emberek közt zajló beszélgetések alatt mért reakcióidőhöz, és jelentősen rövidebb, mint a korábbi modelleknél tapasztalt tipikus 2-3 másodperces késés.

A hangasszisztenst alfaverzióban júniusban tervezte kiadni az OpenAI, végül egy hónappal elhalasztotta a bevezetését, mivel az még fejlesztésre szorult. A funkció idő közben új szűrőket is kapott, amelyek felismernek és blokkolnak bizonyos zenei vagy más, szerzői jog által védett hanganyagok generálására irányuló kéréseket. Az ősz folyamán minden ChatGPT Plus felhasználó megkapja az új módot, ami négy különböző preset hangján szólalhat meg.

Derítsd ki, hol tartasz a felhőérettségben a Devertix Cloud Readiness felmérésével, mellyel átfogó képet kaphatsz vállalatod felkészültségéről. Töltsd ki 3 perces, ingyenes felmérőnket!

a címlapról

Hirdetés

Ollé, lesz SYSADMINDAY!

2025. július 4. 09:31

Duna melletti szabadtéri helyszínen, a Budapest Gardenben idén is megrendezzük a hazai Sysadmindayt, az IT-üzemeltetők világnapját. Standup, IT security meetup, kvízek, szakmázás, barátok, még több sörcsap.