2013. február 8. 08:40

Interakció: a triciklitől az ember-gép szimbiózisig

Könnyen elképzelhető, hogy a számítástechnika jövője sokkal inkább fog különbözni a jelentől, mint a parancssori értelmező az okostelefonok érintőképernyőjétől. A kulcsszó pedig visszanézve nem a felhő, a social networking vagy valami hasonló lesz, hanem az interaktivitás, és jövő történészei ennek megfelelően fogják megírni. Pontosabban: elmondani, és a gépek majd szépen lejegyzik helyettük.

Az egér és a tricikli

Kezdetben persze korántsem volt világos, hogyan és min keresztül juthatunk el az interaktivitásig. Amikor az amerikai Douglas Engelbart azt vizsgálta az 1960-as években, hogy milyen lenne a legkönnyebben használható beviteli eszköz, akkor kipróbált a fényceruza és a joystick mellett olyan megoldásokat is, ahol a felhasználó a térdével; meg egy olyat is, ahol az orrával irányította volna a képernyőn a kurzort. Aztán persze a ma is használatos az egér győzött.

De Engelbart nem állt meg itt, hanem az egeret kiegészítette egy olyan kütyüvel is, amelyet „keyset device”-nak nevezett, és amely leginkább egy ötbillentyűs zongorára hasonlított. A billentyűket bal kézzel kellett nyomkodni, miközben az egeret a jobbal rángatjuk. A koncepció alapja az a meggyőződés volt, hogy mint ahogy a kerékpárral is gyorsabban lehet haladni mint a triciklivel, amikor már megtanultuk használni, ugyanígy az emberek is örömmel fognak obskúrus ujjmozgásokat elsajátítani azért, hogy utóbb gyorsabban dolgozhassanak.

Ebben azonban Engelbart még akkor is tévedett, és a felhasználók még akkor sem voltak hajlandóak az efféle trükköket elsajátítani, ha lényegében valóban mindegy, hogy a qwerty-billentyűn dolgozunk-e vagy az „ujjzongorán” (mármint ha már tényleg rászántuk az időt, és megtanultuk használni).

A mágikusnak tűnő tudomány

Arthur C. Clarke, a sci-fi író és mérnök, aki nem mellékesen először tett közzé tudományos tanulmányt geostacionárius telekommunikációs műholdról, egy alkalommal úgy fogalmazott, hogy „bármely kellőképpen fejlett technológia megkülönböztethetetlen a mágiától”. Vagyis: egyszerűen csak működik, és nem kell foglalkoznunk vele, hogy miként. Aminél nyilván lényegesen fárasztóbb, ha mindenféle bonyolult mozgássorokat kell elvégeznünk a célunk eléréséhez: miközben például ezt a cikket írom, természetesen én is a keyboardot püfölöm, de ismét csak természetesen nem ez a célom, hogy az ujjaimat mozgassam, hanem a majdani, kész szöveg. Viszont egyelőre nem igazán megy máshogy.

De innentől kezd kirajzolódni a szemünk előtt egy ideális számítástechnika. Michio Kaku amerikai fizikus szerint a nem is olyan távoli jövőben maga a „komputer” szó is el fog tűnni az angol nyelvből (meg, gondolom, a miénkből is), ugyanis mivel mindenütt jelen lesz, ugyanúgy nem fogjuk észrevenni, mint ahogy arra sem kapjuk fel a fejünket, ha egy lakásba belépve van villany. Ám az, hogy a számítástechnika „láthatatlanná válik”, csupán a történet egyik fele. A másik fele pedig az, hogy ezt a láthatatlanná válást azt teszi lehetővé, hogy nem nekünk kell majd megmondanunk, hogy mit csináljon.

Érzelmi konfiguráció

A tajvani Hooman Samani még egy lépéssel tovább menve kitalálta a lovotikát (love+robotika), és azt a meglehetősen ambiciózus célt tűzte maga elé, hogy az ipari és a különböző társadalmi feladatokat ellátó, például az időseket gondozó robotok mellett legyenek olyanok is, melyek alkalmasak arra, hogy szeressük őket – ők pedig viszontszeressenek. Az egyik, általa kifejlesztett prototípus az emberihez hasonló „hormonrendszerrel” van felszerelve, és ha becézgetjük, akkor jól érzi magát. És eközben mi is jól érezzük magunkat: mintha a kutyánkat simogatnánk.

Ami már csak azért is izgalmas a témánk szempontjából, mert nyilván szívesebben vagyunk együtt egy olyan kutyával, amely rajong értünk – és az is nyilvánvaló, hogy ha rajong értünk, akkor lelkesebben fogja végrehajtani az utasításainkat. Douglas Adams Galaxis útikalauz stopposoknak című kultkönyvében szerepel egy ajtó, amely rettenetesen örül, ha igénybe veszik a szolgáltatásait, és keresztülmennek rajta, és akár azzal a gondolattal is eljátszhatunk, hogy a jövőben a „beépített szeretet” is alaptartozékká válik majd.

Ami azonban legalább két dologban különbözni fog az ember és ember közötti érzelmektől. Egyfelől semmi szükség rá, hogy a kenyérpirító nekiálljon féltékenykedni, ha a gofrisütőt választom; másfelől pedig egy viszonylag egyszerű feladatokat ellátó berendezésnek viszonylag egyszerű érzelmek is bőven elegek lesznek. De ha fontos a számunkra; sokat használjuk; bonyolult feladatokat lát el; sok múlik a működésén, akkor persze legyenek összetettek és kifinomultak a viselkedési mintái. Egy lábtörlőhöz rendszerint máshogy viszonyulunk mint a kedvenc laptopunkhoz, és annak az "érzelmi konfigurációjának” idomulnia kell majd ehhez.

Amennyiben pedig szabadjára engedjük a fantáziánkat, úgy az is eszünkbe juthat, hogy ezek az érzelmes kütyük egymással kapcsolatban sem lesznek közömbösek, és miközben kerülendő, hogy marják egymást, mint az irigy kutyák a kennelben, aközben ki tudja, egyszer talán majd lájkolni fogják egymás akkutöltöttségi állapotát a Facebookon. Ja igen, és arról se feledkezzünk el, hogy a gép érzelmeinek megléte minden bizonnyal vissza fog hatni arra is, ahogyan mi viszonyulunk a használati tárgyainkhoz. Minden bizonnyal jobban fogunk kötődni hozzájuk; úgy siratjuk meg az elvesztésüket, mint egy kedvenc háziállatét, és így tovább.

Hogyan mondjam el neked, amit nem lehet?

A lovotikával persze nagyon is előre siettem, ugyanis hosszú ideig még az egyirányú, az embertől gép felé tartó kommunikáció is komoly nehézségekkel járt. Nem véletlenül terjedt a számítástechnikai szakemberek között az a mondás, mely szerint a programozás jobb esetben is két ellenséges faj kommunikációja, és ezen a problémán először a John Backus által az 1950-es évek végére kifejlesztett FORTRAN segített, ahol a betűszó annyit jelent, hogy FORmula TRANslation. Értsd: a gépnek címzett mondanivalót az ember (értsd: programozó) számára érthető képletekhez közeli alakban kezeli. Amivel én sajnos nem sokra mennék, de a hatás így is azonnali és átütő volt. A UNIX-ot megalkotó Ken Thompson szerint a FORTRAN nélkül a korai programozók 95 százaléka sosem állt volna a munkába – ugyanis nem lettek volna rá képesek. Mások pedig egyenesen a tranzisztor feltalálásához hasonlóan fontosnak tartják a FORTRAN-t.

De ezzel azért korántsem oldódott meg minden probléma. Ott volt például a SAGE (Semi-Automatic Ground Environment), amely a változatosság kedvéért nem programnyelv, hanem a Pentagon hidegháborús atomrakéta-megfigyelő programja, és ahol a szó szoros értelmében életfontosságú lett volna minél gyorsabban hozzájutni az információkhoz. Mármint, hogy tényleg megkezdődött-e szovjet támadás, vagy sem. Viszont bár a munkaállomások még beépített hamutartóval is fel voltak szerelve (ami jól mutatja, hogy az még mennyire más kor volt), J. R. Licklider amerikai kutató arra figyelt fel, hogy az emberek munka közben az energiájuk túlnyomó részét arra fordítják, hogy megpróbálnak „gondolkodási pozícióba jutni”, azaz megpróbálják megérteni, hogy éppen mit mond nekik a gép.

De ez miért is ne lehetne fordítva, és miért nem a gép próbál meg alkalmazkodni hozzánk ahelyett, hogy mi küszködnénk? És miért is ne inkább segítene minket ahelyett, hogy korlátozná a lehetőségeinket? Úgyhogy Licklider még valamikor 1960-ban, évekkel Engelbart előtt meg is írta az „ember-gép szimbiózisról” szóló tanulmányát, amelyben mindezt kifejti, és ez az egész egyáltalán nem mellékesen rávilágít egy nagyon fontos szabályra is. Arra, hogy a számítástechnika eddig története szerint amikor változik (bővül) a felhasználók köre, akkor amellett, hogy változik, hogy mire használják a számítógépeket, az is változik, hogy ezt milyen interfészen keresztül/milyen formában teszik.

Amikor immár nem csupán programozók, hanem a SAGE-nél dolgozó szakemberek is kapcsolatba kerültek a komputerekkel, azonnal új megoldásokra volt szükség. Amikor megjelentek a személyi számítógépek, akkor a sikerükhöz nem csak az kellett, hogy programozáson kívül másra is lehessen használni őket, hanem az is, hogy a jó öreg parancssort valami más váltsa fel – mint ahogy ugyanez az átmenet játszódott le a szövegalapú, ftp-ző internettől a grafikus webre való áttéréskor, miután a világhálóra felhasználók tömegei zúdultak rá. És ezzel összhangban bízvást számíthatunk arra is, hogy a jövő valóban mindenütt jelen lévő számítástechnikája teljesen új megoldásokat fog előtérbe helyezni.

Gyors számítástechnika és lassú user

Kissé elnagyoltan azt mondhatjuk, hogy az IT története három korszakra osztható. Az elsőben kizárólag az expertek használják a számítástechnikát mindenféle, a kívülállók számára hátborzongatóan bonyolultnak tűnő megoldásokon keresztül. A FORTRAN (meg általában a programozás mint olyan is) ide tartozik. Ez a kor nagyjából a parancssor háttérbe szorulásával zárult le. Persze nem arról van szó, hogy ma már senki sem ír programokat (éppen ellenkezőleg); de ha valakit a laptopja fölé görnyedve látunk, akkor átlagosan nem arra fogunk számítani, hogy éppen C++-ban kódol.

A második korszak zászlóshajói az Apple nyomdokain haladva a Windows és a Google: mindkettőjük gyakorlatilag mindenki számára elérhetővé tesz egy (többé-kevésbé) jól használható felületen keresztül egy olyan, jól körülhatárolt területet, mint a fájlmozgatás, a szövegszerkesztés vagy az internetes keresés. Ami nem jelenti azt, hogy a régi módszerek egy ideig még nem élnek tovább: Linux alatt nekem ma is sok mindent gyorsabb és egyszerűbb parancssorból megoldani. És ezt nem öncélúan említem itt, hanem azért, mert a nagy váltások idején egy ideig még tovább élnek a régi eszközök és megoldások, mivel a számítástechnika lényegesen gyorsabban tudna fejlődni, mint ahogy mi, a felhasználók alkalmazkodni tudunk hozzá (amire nem árt emlékezni, ha fejlesztésbe fogunk).

Az AI produktivitás mértékegysége: a jó nagy kérdőjel

A fejlesztői produktivitás mérése az őskor óta foglalkoztatja az emberiséget, a téma az AI miatt pedig újra reneszánszát éli.

Az AI produktivitás mértékegysége: a jó nagy kérdőjel A fejlesztői produktivitás mérése az őskor óta foglalkoztatja az emberiséget, a téma az AI miatt pedig újra reneszánszát éli.

A harmadik korszak pedig feltehetően az lesz, hogy a számítástechnika nem csupán mindenkinek elérhető, hanem mindenütt is. Azaz az igazi kihívást nem az fogja jelenteni, hogy a felhasználó boldoguljon el egy felhőalapú szolgáltatással, hanem az, hogy miként építsünk ki egy olyan rendszert, amelyben mindenütt számítástechnika van. És amennyiben ez tényleg alapvető váltást jelent, akkor nyilván nem lesz elég a hagyományos ember-gép kommunikációban használt interfészek olyan, kissé megbütykölt verziója, mint az érintőképernyő.

A jövőbe nyíló ajtó

Ha úgy nézzük, kevés mulatságosabb dolog van, mint egy, a távoli jövőbben játszódó sci-fi, ahol az ember odalép az ajtóhoz, és bepötyögi a számkódot. Ugyanis ez esetben még mindig mi fogalmazzuk meg a gép (az ajtó) számára érthető formában, hogy kik vagyunk és mit akarunk ahelyett, hogy az tenne némi erőfeszítést a felismerésünkre és megértésünkre. Mivel számunkra a beszéd, a gesztusok meg az arckifejezések: a felhúzott szemöldök és rosszalló homlokráncolás a kommunikáció természetes eszközei, ezért ismét csak számunkra az lenne az egyszerűbb, ha ezzel fejezhetnénk ki magunkat, tehát miért is ne azt várnánk el a jövő számítástechnikájától, hogy ezeket értse meg?

Végső soron ugyanis a fentebbiek értelmében az lenne a cél, hogy nekünk nem hogy mindenféle parancssorokkal és keyset device-okkal ne kelljen küszködnünk, de egyáltalán semmilyen erőfeszítést ne kelljen tennünk azért, hogy létrejöjjön az „ember-gép szimbiózis”. Vagyis mintha csak egy másik emberrel közölnénk, hogy mit akarunk.

Ami persze szép elképzelés, de ha megvalósul, akkor valószínűleg mindenféle továbbgyűrűző hatásai is lesznek, ami Susan Greenfield angol agykutató szerint akár a személyiség fogalmának teljes átértékeléséhez is elvezethet. Jelenleg ugyanis úgy gondolunk magunkra, hogy vagyunk mi, meg van tőlünk elkülönülve a környezet – mintha csak egy háromdimenziós dobozba lennénk behelyezve, ahol egyfelől ott van a doboz; másfelől meg én, és ez ugye két különböző dolog. Jelenleg mi hatunk a környezetünkre, hogy történjen valami: megérintünk egy ikont az érintőképernyőn vagy lenyomunk egy kilincset.

A jövőben viszont egy interaktív környezet ugyanúgy együtt fog működni velünk és folyamatosan reagálni fog a szándékainkra, mint most a kezünk – amit nem tekintünk önmagunktól különálló dolognak. Az eredmény tehát az lesz, hogy Greenfield megfogalmazásával élve „te magad sem leszel jól elkülöníthető entitás”. És ezen a ponton egyelőre meg is állhatunk, hiszen ki tudja (vagy legalább ki tudja elképzelni), hogy egy ilyen, tőlünk ennyire különböző embernek milyen elképzelései, tervei, céljai lennének.

Én nem, az biztos.

Dr. Galántai Zoltán jövőkutató

Interakció: a triciklitől az ember-gép szimbiózisig

Az AI produktivitás mértékegysége: a jó nagy kérdőjel

Az AI produktivitás mértékegysége: a jó nagy kérdőjel

Erősödnek a neocloudok, de azért még az AWS a nyerő

Rendet tenne Európa a felugró sütiablakoknál

Interakció: a triciklitől az ember-gép szimbiózisig

Az AI produktivitás mértékegysége: a jó nagy kérdőjel

Az AI produktivitás mértékegysége: a jó nagy kérdőjel

Erősödnek a neocloudok, de azért még az AWS a nyerő

Rendet tenne Európa a felugró sütiablakoknál

Kínai chipgyártó eszközök importját tiltja az USA

AirDrop-kompatibilisek lettek a Pixel 10-ek

Alaposabban ránéz az EU az Amazon és a Microsoft felhőire

Kínai chipgyártó eszközök importját tiltja az USA

AirDrop-kompatibilisek lettek a Pixel 10-ek

Alaposabban ránéz az EU az Amazon és a Microsoft felhőire