Älä inhimillistä AI-chatbotteja! /feat. Lipevä-Claude ja Sätkä-Pete

Sääntö nro 1: Älä inhimillistä AI-chatbotteja! Mutta kokeillaan nyt ihan vähän kuitenkin…

Jos olet jostain kumman syystä käyttänyt kovasti aikaa, rahaa ja energiaa lipevän Clauden tai oman Sätkä-Peten kouluttamiseen, kertonut sille ummet ja lammet duuneista, leffamausta, terveyshuolista, liikuntatottumuksista ja jopa mielen syvimmistä salaisuuksista, viimeistään nyt olisi korkea aika lopettaa tuo hulluttelu ja keksiä jotain rakentavampaa puuhastelua. Tiedän, saattaa monella vähän kirpaista, mutta joskus on viisainta vaan kuitata tappiot, hyväksyä ne oppirahoina ja siirtyä eteenpäin.

Sätkä-Pete on nimittäin kaikista inhimillisistä ponnisteluista huolimatta päätynyt Grokipediasta löytyvän “vaihtoehtoiseen” todellisuuden pariin. Kaljanhimoissaan se myös kauppaa pahaa aavistamattomien käyttäjien tietoja jollekin hämärille suoramarkkinointimaakareille. Eikä tuo lipevä Claude paljon parempi seuralainen ole, vaikka kovasti koittaakin salonkikelpoista esittää.

Varsinaiset kielimallit chatbot-alustojen taustalla voivat edelleen olla ihan hyviä ja käyttökelpoisia moneen tarkoitukseen, mutta näitä amerikkalaisten omistajien ohjailemia one-size-fits-all -chatbotteja ja niistä vaahtoavia on vaikeaa ottaa kovin tosissaan nykyisessä maailmantilanteessa.

ChatGPT:n, Clauden tai Geminin linnakkeista tietoa on vaikeaa saada enää ulos ilman käyttäjätilin totaalista poistamista. Sen vuoksi kannattaa harkita tarkkaan kuinka aikansa käyttää, jotta panostus olisi myös pitkällä tähtäimellä hyödyllistä. Ja niitä samoja kielimalleja voi edelleen käyttää API:n yli, jolloin ne mahdollisesti keräävät käyttäjästään vähän vähemmän tietoa. ChatGPT:n tapauksessa pyrkimykset käyttäjien profilointiin olivat varsin helposti arvattavissa saman tien kun GPT3.5 laitettiin sähköpostikirjautumisen taakse, joskus 2022-23 tienoilla.

Takaiskuista huolimatta ihan luddiitiksi ei tarvi kuitenkaan julistautua, vaan voit aloittaa esimerkiksi oman datan ja kielimalleille syötettävän “kontekstin” jäsentämisestä ja hallinnasta. Oman tietopankin voi rakentaa jollain paljon yksinkertaisemmalla systeemillä. Käytännössähän kyse on usein teksti- tai pdf-tiedostoista, jotka joissain käyttätilanteissa syötetään vektoritietokantaan alustan tarjoaman prosessin kautta. Oma ehdotus tähän on avoimen lähdekoodin Obsidian, jolla saa aikaan vaikka minkälaisia ihmisten luettavia tietopankkeja ja knowledge gardeneita. Obsidianin eurooppalaiseksi haastajaksi on noussut mm. ranskalainen Joplin.

Kun oman, kattavan tieto- ja tyylipankin on kertaalleen rakentanut, yksittäisiä tekstitiedostoja ja niiden kokoelmia voi syöttää tilanteen mukaan mille tahansa chatbot-alustalle, niistä syntyy kulloiseenkin käyttötilanteeseen soveltuva “konteksti”, “RAG” tai millä nimellä näitä toimintaa tarkentavia ratkaisuja missäkin yhteydessä kutsutaan.

Aivan turha on itkeä hukkaan heitettyä työtä ja tuputtaa omaa ChatGPT:tä jokaiseen paikkaan, kun pelkän oman datan vieminen (luvan kanssa) esimerkiksi työnantajan tarjoamaan järjestelmään riittää. Oman datan hallinta ja “knowledge gardenin” rakentaminen ei vaan ole kovin mediaseksikästä hommaa, siksi siitä harvemmin puhutaan.

Oheisen kuvan lipevästä Claudesta ja Sätkä-Petestä taikoi eräs paljon puhuttu yksisarvinen.