:

Szerző: Dömös Zsuzsanna

2024. július 31. 14:38

Elérhetővé vált az OpenAI fejlett hangasszisztense

Egyelőre a ChatGPT Plus szűkebb felhasználói köre próbálhatja ki az Advanced Voice Mode-ot, aminek az elérhetőségét fokozatosan terjeszti ki a cég a következő hónapok során.

A fizetős ChatGPT Plus szolgáltatás előfizetőinek szűk köre már kipróbálhatja az OpenAI új hangasszisztensét, az Advanced Voice Mode-ot, aminek a rajtja kissé mostohán indul, lévén ennek kapcsán rúgta össze a port a cég és Scarlet Johansson, aki nehezményezte, hogy a  „Sky” fantázianévre keresztelt beállítás túlságosan hasonlít az ő hangjára.

Az OpenAI májusban mutatta be az újgenerációs GPT-4o (omni) modellt, ami „natívan multimodális", tehát képes tartalmat generálni, vagy parancsokat értelmezni hang, szöveg vagy kép formájában, és minden bemeneti módszernél jelentősen javulni tudott az elődjéhez képest, valós időben, késleltetés nélkül tud kommunikálni kamerakép, írott szöveg és élő beszéd alapján is. 

alpha

Az AI és a nagy full-full-stack trend

Az AI farvizén számos új informatikai munkakör születik, vagy már ismert munkák kapnak új nevet és vele extra elvárásokat is.

Az AI és a nagy full-full-stack trend Az AI farvizén számos új informatikai munkakör születik, vagy már ismert munkák kapnak új nevet és vele extra elvárásokat is.

Kiemelhető újdonság, hogy miként képes kezelni a modell az audióbemenetet, ez egyben a legrémisztőbb is: a hangasszisztensi funkció valós időben, gyakorlatilag késleltetés nélkül reagál, a fejlesztők elmondása szerint átlagosan körülbelül 320 ezredmásodperc alatt. Egy 2009-es tanulmány szerint ez hasonló az emberek közt zajló beszélgetések alatt mért reakcióidőhöz, és jelentősen rövidebb, mint a korábbi modelleknél tapasztalt tipikus 2-3 másodperces késés.

A hangasszisztenst alfaverzióban júniusban tervezte kiadni az OpenAI, végül egy hónappal elhalasztotta a bevezetését, mivel az még fejlesztésre szorult. A funkció idő közben új szűrőket is kapott, amelyek felismernek és blokkolnak bizonyos zenei vagy más, szerzői jog által védett hanganyagok generálására irányuló kéréseket. Az ősz folyamán minden ChatGPT Plus felhasználó megkapja az új módot, ami négy különböző preset hangján szólalhat meg.

Október 13-án 6 alkalmas, 18 órás CI/CD alapozó képzést indítunk. Az élő képzések órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról

roszkoszmosz

20

Saját Starlink-riválist indít Oroszország

2025. szeptember 17. 13:43

Az első indítások idén év végén jöhetnek, 2035-re valósulhat meg a teljes, országos lefedettség, beleértve az Észak-sarkvidéket.