Svarta svanar och Big Data

Det har rapporterats om kontroversiella och fantastiska resultat med Big Data-analyser. Som att kvinnor som byter från parfymerad till oparfymerad hudkräm några månader senare får blöjreklam. Praktiskt eller kränkande – som sagt, välj själv. De etiska ställningstagandena till hur mycket information vi egentligen vill lämna ifrån om oss är en diskussion för sig men Big Data lider även av andra problem.

Big Data är stora kvantiteter information som sparas och processas maskinellt.  Facebook, Twitter, Google, Apple och många andra av de företag som exploderat i storlek på bara några år arbetar just med Big Data och konsumenter. De exploaterar maskinellt upptäckta samband och tjänar ofattbara summor pengar på att rikta reklam och erbjudanden anpassade till just dig.

Man kan förstå det med exempelvis Ica-kortet:
All information om vad du handlar och frivilligt väljer att registrera genom att dra Ica-kortet sparas. Inte bara artiklarna, utan även datum och klockslag, hur länge du var inne i butiken, vädret utanför, när du är född och tusentals andra variabler. Använder du dessutom en scanner inne i butiken kommer den även att registrera i vilken ordning du köper varorna, hur länge du pausar vid en hylla (som för att välja mellan olika varor), om du ångrar dig och avscannar någonting.
Mängden data som samlas in om dig är alldeles för stor för att en människa skulle klara att processa information. Förmodligen skulle en hel vetenskap kunna byggas upp kring bara en enda persons köpbeteende. I stället får automatiserade algoritmer leta mönster. Datorn behöver inte förstå mönstren, den skall bara hitta dem. Allt förstås för att jag som konsument skall ”få en bättre köpupplevelse”, det vill säga handla mer och ”hitta till varor som intresserar mig”, det vill säga handla mer.

Utöver etiken – vad är då problemet? Ta självkörande bilar som exempel. Google-bilen, Volvos och Teslas självkörande bilar – samtliga bygger de enkelt uttryckt på principen att de får köra väldigt många mil och samla in väldigt stora datamängder. Tanken är att algoritmerna varit med om varje möjlig situation och lärt sig hur de skall hanteras.
Men det är ju inte sant. Bilarna kommer att utsättas för svarta svanar, det vill säga situationer som inte kunnat förutsägas. Som att ett flygplan störtar på vägen. Eller att en igelkott och en katt springer ut samtidigt på vägbanan. Eller något av tiotusentals miljoners miljarder andra möjligheter som kanske bara inträffar en endaste gång i världshistorien.
En människa är fenomenal på att improvisera, att hitta en lösning på ett problem som hen inte varit med om tidigare, medan datorer är usla på det.
Nu är jag den förste som är anhängare av självkörande bilar: Datorer är långt bättre bilförare än människor. Däremot måste vi förstå begränsningarna. Datorer är (nästan) ofelbara om vi ger dem rätt instruktioner, men det kommer vi inte att göra, så därför kommer det att ske olyckor även med självkörande bilar. De kommer att bli färre, men vi skall vara medvetna om att de kommer att ske.

Ett annat exempel är när du söker på Google eller en annan sökmotor. De flesta söksträngar genererar alltför många träffar för sökaren skall titta igenom alla. I de flesta fall stannar hen på den första sidan av sökresultat (åtminstone gör undertecknad det). Sökmotorn arbetar med statistik och mest sannolikt letar du ju efter det som de flesta andra som sökt med liknande sökfras letat efter.
Men därmed blir sökmotorn en förstärkare av redan starka varumärken – desto fler någon söker på ”gympaskor”, får upp Nike och klickar på Nike, desto mer övertygade blir algoritmerna om att det är just Nike du vill ha om du söker på den frasen.

Big Data förmår inte heller att hantera svarta svanar. Det är bra att lära sig av sina misstag och att använda historisk statistik för att förutsäga extremt väder, jordbävning, för att köra bilar, larma om personer som är på väg in i spelmissbruk och med lite större tvekan att upptäcka och kartlägga köpbeteenden hos konsumenter eller avgöra försäkringspremier och återbetalningsförmåga av banklån.

Däremot är det ett misstag att tro att Big Data kommer att klara allt. Algoritmerna kommer inte att kunna förutsäga allt som kan hända under en bilfärd – människor kommer att dö för att den sjävkörande bilar kommer att hamna i situationer som inte gick att förutsäga. Likadant kommer Big Data-baserade beslut att dra felaktiga slutsater om vem som kan att betala av ett lån, vem som hamnar i spelmissbruk, vem som är intresserad av blöjreklam eller vem som är intresserad att läsa den här notisen..

/David Armini

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *