A december eleji bejelentés során az Nvidia kiemelten beszélt új kártyája compute képességeikről, tehát az általános gyorsításról, azon belül is a gépi tanulásról. A legújabb Titan ugyanis a játékosok helyett sokkal inkább a kvázi amatőr kutatókat célozza. Ebből adódóan a kártya végrehajtási képességeit nem limitálta az Nvidia, az egyszeres pontosság mellett 13,8, kétszeres mellett pedig 6,9 TFLOPS-ra képes.

Titánok harca

Előbbit, tehát az egyszeres pontosságot tekintve ez 14 százalékos előrelépést jelent a kvázi előd Titan Xp-hez képest, a konkurens AMD Radeon Vega Frontier Edition kártyához viszonyítva pedig körülbelül 5 százalékos az előny. Dupla pontosság mellett lényegesen nagyobb a különbség, a Titan V 6,9 TFLOPS-os számítási teljesítménye mellett valósággal eltörpül az ilyen téren kifejezetten gyengének számító Titan Xp 0,38 TFLOPS-os, vagy az említett Radeon 0,7 TFLOPS-os tempója.

Az AnandTech-nek lehetősége adódott, hogy gyakorlatban is megmérje a fenti képességeket. Ehhez első körban a HPC-s környezetben előszeretettel alkalmazott GEMM (General Matrix Multiply), tehát a mátrixszorzásos képességeket vette górcső alá a magazin, amely sajnos a feljebb említett Radeon kártyát nem tette be a tesztbe, csak korábbi Titánokkal mért az oldal. A kapott eredmények önmagukért beszélnek, a Titan V faképnél hagyja az elődöket, igaz ezek a grafikai megjelenítéshez fontos egyszeres pontosságot leszámítva felépítésükből adódóan nem képesek igazán gyors végrehajtásra.

Ezért érdemes az egyszeres pontosságot alapul véve egymás mellé állítani a kártyákat, azokon belül is az újdonságot és a Titan Xp-t. Ebben a relációban a Titan V 23 százalékkal gyorsabb kvázi elődjénél, amely annak fényében számít kifejezetten acélosnak, hogy papíron csupán 14 százalék különbség van a két kártya között (12,1 vs 13,8 TFLOPS). A különbséget a két kártya hatékonyságában kell keresni, a mért 13,4 TFLOPS-os tempó ugyanis kiemelkedő mutatóról árulkodik, ez ugyanis az elméleti maximum érték 97 százaléka.

Érdemes még kiemelni a Tensor magokkal gyorsított félpontosságú tempót. A magokból 640 darab aktív egység került a GV100 GPU-ba, segítségükkel pedig jelentősen gyorsíthatóak bizonyos műveletek, ám ezért cserébe a CUDA magokhoz viszonyítva sokkal kevésbé rugalmasak. A Tensor mag elsősorban 4x4 mátrix műveletekben (pl. MAD) erős, például épp mátrixok összeszorzásánál. Az Anandtech ezzel 97,5 GFLOPS-os eredményt kapott, amely nem sokkal marad el az elméleti maximum 110 GFLOPS-tól, ez pedig a Tensorok nélküli mérésnél 3,7-szer erősebb.

Több más mérés mellett a SiSoft Sandra OpenCL-alapú pénzügyi analízis tesztjét is lefuttatta az AnandTech. A közismert Monte Carlo szimuláció alatt is tetemes előnyt hozott össze a Titan V, amely még egyszeres pontosság mellett is 70 százalékot vert elődjére. Itt érdemes megemlíteni, hogy duplapontosságra váltva az egyszeres eredmény felénél alacsonyabbra esett a tempót, amelynek okát egyelőre homály fedi, vélhetően a rendszer egyik szűk keresztmetszete rejtheti a választ.

A Folding@Home teszt az egyik, amelyben nincs minden esetben egyértelmű előnye a Titan V-nek. A mérések szerint egyszeres pontosság mellett nagyjából a Titan Xp tempóját hozza a kártya, tetemes különbség csak duplapontosságra váltva jön elő, amely az Xp egyik nyilvánvalóan gyenge pontja.

No és a Crysis fut rajta?

Bár az Nvidia mindmáig mélyen hallgat a GV100 GPU grafikus képességeiről, az AnandTech kihasználva a lehetőséget néhány játéktesztet is lefuttatott a Titan V-n. A kivétel nélkül 4K felbontásban, maximális grafikai részletesség mellett elvégzett tesztek alatt viszonylag nagy volt a szórás, így az elsősorban játékra kihegyezett Titan Xp-hez képest volt ahol csupán 7 százalékkal volt gyorsabb a Titan V, Doom alatt viszont 35 százalékos volt az ugrás, az átlag pedig 15 százalék környékén alakult. Különösebb driveres optimalizációk hiányában ez jó eredménynek tekinthető, ugyanakkor az Xp-hez viszonyított, potom 1800 dolláros felárat egyértelműen nem éri meg az új kártya, már amennyiben valaki kizárólag játékokban gondolkodna.