Varför är Data så viktig för fungerande AI?

11 februari, 2020

Ge en man en fisk och du föder honom för en dag. Lär en man att fiska och du föder honom för hela livet. Så kan du också se på traditionell programmering jämfört med AI (Artificiell Intelligens). Traditionell programmering fungerar bara utifrån de förutsättningar som den programmerats för. En AI-lösning byggs för att ständigt förbättra sig själv genom att lära sig från data. AI har alltså förutsättningen att ständigt bli bättre utan att programmeringen ändras.

Det AI vi kan realisera idag är inte nytt utan något som har använts sedan 50-talet. Men det är först de senaste åren som det verkligen tagit fart. En milstolpe för utvecklingen av AI var 2016 när Google-ägda DeepMinds program AlphaGo lyckades slå världsmästaren i brädspelet Go i 4 av 5 spelomgångar.

Varför var detta så fantastisk? Redan 1997 lyckades IBMs Deep Blue superdator slå Garry Kasparov, världsmästaren i schack, men i schack finns det ungefär 35 möjliga drag i varje omgång, jämfört med 200 drag i Go. Det innebär att en match i Go innehåller fler möjliga kombinationer än antalet atomer i universum. Anledningen till att Go länge betraktats som ett för svårt problem för AI att knäcka var att tekniken inte varit tillräckligt mogen. Hur lyckades då DeepMind med något som ingen annan gjort?

Brädspelet i en park i New York. Foto Peter Torstensson

AlphaGo använder en utveckling av AI som kallas för djupinlärning samt en sökalgoritm där den går igenom tidigare spelade Go matcher. AlphaGo tränades upp genom att köra miljontals matcher både mot programmerade Go spelare men också riktiga Go mästare. I ett parti använder AlphaGo det drag som ger den största chansen att vinna baserat på nästkommande serie av drag med störst chans för ett vinnande parti. I matchen 2016 använde AlphaGo innovativa drag som människan inte tidigare sett vilka den lärt sig genom sin repetition av spelet.

För AI är data bränslet

För att algoritmen ska förbättra sig behöver den kunna läsa in data. Det kan vara en adress i ett speciellt format, bilder med specifika punkter synliga eller datum i ett visst format.

För att komma igång med AI kan ett första steg vara att märka upp er data. Sedan träna er AI-modell att tolka data. När er modell är klar kan ni applicera den i produktion med tillgång till mer data för den att förbättra sig på. För att få ut det mesta av er AI-lösning bör ni även kontinuerligt utvärdera om det går att justera modellen för att få ett ännu bättre resultat.

AI förbättringscykeln: Identifiera ditt data set >märk upp träningsdata >träna modellen > applicera i produktion > utvärdera.

För att detta ska fungera behöver många gånger data städas upp samt förvaltas för att AI-lösningen ska fungera efter att lösningen är implementerad. Att inte förvalta sin data är även en av de vanliga fallgroparna med traditionell programmering.

Eftersom AI är självlärande så kommer den att förbättra sig utifrån hur belöningsstrukturen är programmerad, det kräver att lösningen övervakas då den kan förändra vad den levererar över tid. IBM försökte för några år sen att ha en chatbot (Tay) programmerad att prata med slang som en tonåring. Boten skulle lära och förbättra denna förmåga desto mer den interagerade med människor. Idén var att den över tid skulle prata mer naturligt och bättre förstå vad människor frågade den. Tyvärr tog det ca 24 timmar för internet trollen att överösa den med tillräckligt negativ input för att den skulle börja uttrycka sig olämpligt vilket gjorde att IBM strax därefter fick stänga ner Tay.

Ett annat vanligt förekommande exempel är att använda AI som selektering i rekryteringsprocessen. Där kandidaterna guidas genom fördefinierade frågor och baserat på hur hen svarar så kommer den grupperas och graderas utifrån den viktning som AI:n är inställd mot. Resultatet blir att rekryteraren själv inte behöver sortera kandidaterna utan kan fokusera på de kandidater som bäst motsvarar de satta förväntningarna.

Data som resurs för att förutspå framtiden

Data är snabbt på väg att bli vår generations mest värdefulla resurs och en växande yrkesgrupp i dag är data scientist. Denna roll kan ses som en utveckling av BI (Business Intelligence) men den kanske största skillnaden mellan dessa två yrken är att en BI-analytiker arbetar med att beskriva vad som har hänt som ett underlag till att kunna fatta rätt beslut för framtiden medan en Data Scientist försöker förutspå hur framtiden kommer att se ut.  Ett exempel från e-handeln är att fokusera på historiska data för att visa produkter som andra köpt till eller tittat på för den produkt du sökt. Nästa steg är att förutspå vad ditt nästa köp är baserat på en större mängd data och liknade profiler som din. För att sedan ge dig ett riktat erbjudande som skapar ditt nästa köp.

Google ökade sina annonsintäkter exceptionellt redan under tidigt 2000-tal genom att rikta annonser baserat på användarens historik vilket gav dem en för den tiden otrolig click-rate på sina annonser. Detta var möjligt eftersom de kunde använda de stora mängder data som generats av användarna av Googles sökmotor. Idag uppskattar man att 90 % av den data som finns tillgänglig genererades under de två senaste åren. Att som Google lära sig utnyttja den data som är tillgänglig kommer vara en nyckel till framgång och överlevnad för många företag.

Av Daniel Rödjemyr

Dela artikel
Facebook
LinkedIn
E-post