Lontoon yliopistossa tutkijat ovat kehittäneet tietokoneohjelman, algoritmin, joka pystyy havaitsemaan valheita kirjoitetusta tekstistä kuten sähköposteista, deittiprofiileistä ja viisumihakemuksista. Algoritmi analysoi sanojen ja sanamuotojen käyttöä, tekstin rakennetta ja sisältöä.

Algoritmi laadittiin vertailemalla kymmeniä tuhansia sähköposteja, niin valheellisia kuin tosia. Vertailussa paljastui, että ihmiset, jotka valehtelevat, käyttävät vähemmän itseensä viittaavia persoonapronominejä kuten sanoja  ”minä” ja ”minun”, mutta viljelevät tekstissään paljon tarpeettomia adjektiivejä eli sanoja kuten esimerkiksi ”loistava” ja ”mahtava”. Syyt minä ja minun sanojen välttämiseen voivat olla se, että valehtelija haluaa luoda psykologista etäisyyttä itsensä ja valheellisen viestin välille  ja samalla yrittää sumentaa viestin merkityksen tarpeettomilla adjektiiveillä. Myös erittäin hyödyllinen tapa paljastaa valhe kirjoitetusta tekstistä on etsiä poikkeavia, epämääräisiä ja vältteleviä sanontoja kuten ”melko varma”, ”ehkä”, ”luultavasti” tai vakuuttavia harhautuksia "ollakseni rehellinen" ja "inhoan kertoa teille". Lisäksi vilpilliset henkilöt usein yli argumentoivat ja sisällyttävät viesteihin enemmän imartelua, koska he haluavat vaikuttaa miellyttäviltä ja sympaattisilta.

Algoritmi havaitsee paremmin valheita verrattuna keskivertoihmiseen. Tutkijoiden mukaan keskivertoihminen tunnistaa vain 54 prosenttia valheista, kun taas algoritmi pystyy erottamaan peräti 70 prosenttia.

Algoritmin hyöty:

Algoritmit avaavat uuden mahdollisuuden huijausten ja petosten ennaltaehkäisemiseksi. Ohjelmisto auttaa organisaatioita löytämään ja ennalta luokittelemaan potentiaalisesti vilpilliset viestit. Viranomaiset ja yritykset pystyvät selvittämään petoksen ja huijauksen uskottavuutta ja yksilöimään valehtelevat yksilöt. Algoritmin käytännön vaikutukset liiketoimintaan ovat laaja-alaisia. Asiakas ei välttämättä aina ole oikeassa, ja ohjelmistot auttavat yrityksiä arvioimaan, venyttävätkö asiakkaat totuutta omaksi hyväkeen ja yritykset voivat myös päättää haluavatko he jatkaa liiketoimintaansa kyseisen henkilön kanssa.

Pohdintaa

Algoritmin virheen mahdollisuus on n. 30% eli pienenä riskinä on, että joku rehellinen viesti tulkitaan epärahelliseksi tai päinvastoin. Olemmeko valmiita ottamaan tämän riskin. Emme voi koskaan täysin 100% varmoja, että meille kerrotaan totuus.  Valheenpaljastuksen perimmäisenä ongelmana on kuitenkin se, ettei ole olemassa mitään luotettavaa johtolankaa, joka varmasti paljastaisi valehtelun.

Erillisessä tutkimuksessa Michiganin yliopiston tutkijat opettivat tietokoneita havaitsemaan valheita oikeussali-videoiden avulla. Koneen oppimisalgoritmi pystyi tunnistamaan jopa 75 prosenttia valheista. Herääkin kysymys, että voisikohan algoritmejä hyödyntää myös muilla foorumeilla ja muissa asiayhteyksissä. Äkkiseltään tulee mieleen ainakin politiikka ja työnhaku. Miten mahtaisi miltei ajantasainen puheenvuorojen ja vastineiden algoritmianalyysi purra eduskuntasalissa?

Avainsanat: algoritmi, valheiden pajastuminen

Lähde:

Ludwig, S. &  van Laer, T. & De Ruyter, K. & Friedman, M. (2015). Untangling a Web of Lies: Exploring Automated Detection of Deception Cues in Online Claims within B2B Incentive Programs, SSRN Electronic Journal. Journal of Management Information systems, 33(2), 511-541. DOI: 10.2139/ssrn.2576197

NewScientist (2015).  Lie-detecting algorithm can spot a guilty face. Haettu: https://www.sciencedirect.com/journal/new-scientist/vol/228/issue/3046