Online leugens detecteren

Een van de vele grote leugens van het 'leave'-kamp

Een van de vele grote leugens van het ‘leave’-kamp

In de recente Brexit-campagnes werd de Britse bevolking overspoeld door talloze leugens die de beide kampen de wereld instuurden. Jammer genoeg werden de Britten er zich pas na de uitslag langzaam maar zeker van bewust hoe ze door politici domweg waren bedot.

Maar zo dom was dat niet echt. Mensen hebben het in gemiddeld 54% van de gevallen door dat een online bewering een leugen is, wat nauwelijks beter is dan toeval. Maar dit cijfer kunnen we binnenkort met behulp van een app mogelijk optrekken tot maar liefst 70%.

Daar zorgt academicus Tom Van Laer samen met enkele collega’s voor. Samen onderzoeken ze taalkundige signaalwoorden om tienduizenden e-mails waarvan geweten is dat het leugens zijn te vergelijken met mails die wel de waarheid vertellen. Op basis van die vergelijking hebben ze een tekstanalytisch algoritme ontwikkeld dat bedrog kan detecteren. Het algoritme werkt op drie niveaus:

1. Woordgebruik

We gebruiken andere woorden wanneer we liegen dan wanneer we de waarheid vertellen. Wie liegt maakt veel minder gebruik van persoonlijke voornaamwoorden (ik, jij, hij/zij) maar meer bijvoeglijke naamwoorden zoals subliem, fantastisch en onbevreesd.

Op die manier nemen leugenaars enerzijds afstand van hun eigen woorden en leiden ze anderzijds met overbodige beschrijvingen de aandacht af van de leugen.

2. Structuur

Wanneer leugenaars hun mail schrijven, vermijden ze elke vorm van spontaneïteit om betrapping te verhinderen. Daarom maken ze consequent gebruiken van cognitieve proceswoorden zoals omdat, weten en zou moeten. Het algoritme detecteert het typische gebruik van dit soort woorden in leugens.

3. Verschil tussen mails

leugen_politiekWie mails uitwisselt en daarbij leugens wil verkondigen, maakt steeds meer gebruik van dezelfde woorden die ook door de bestemmeling wordt gebruikt. Ze kopiëren met andere woorden de woordenschat en syntax van de bestemmeling om zo geloofwaardiger over te komen. Ook dat wordt door het algoritme gedetecteerd.

Een nuttig algoritme is pas leuk als je er ook concreet iets mee kunt doen. Dat is met deze technologie absoluut het geval.
Consumentenorganisaties kunnen een leugenscore geven aan dubieuze reclame. Studententhesissen en academische artikels kunnen beter worden onderzocht. Maar we kunnen ook politieke blogs en verklaringen onderwerpen aan een soort leugentest.
Verzekeringsmaatschappijen kunnen verklaringen van ongevallen grondiger bekijken. De lijst is eindeloos.

Het wordt dan ook boeiend om de ontwikkeling van deze technologie verder te volgen. Maar wie er niet wil op wachten, kan met bovenstaande informatie en de gegevens uit het onderzoek zelf al een heel eind raken om met meer dan 50% nauwkeurigheid zelf te beslissen of hij een online bericht gelooft of niet.

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s