AI och möjligheterna inom bildtolkningsteknik

Publicerad 29 jun 2017 Truls and Espen

Artificiell intelligens gör det möjligt att analysera och tolka stora mängder bilder snabbt och effektivt. En dator kan genom maskininlärning lära sig att utföra olika uppgifter, som att identifiera specifika personer i bilder, bedöma medicinska tillstånd eller hjälpa en självkörande bil att hålla sig på vägen.

”När en dator lär sig att utföra enklare uppgifter automatiskt kan vi människor istället fokusera på mer komplicerade uppgifter. AI kan underlätta mycket för oss,” förklarar Truls Fretland, dataanalytiker på Knowit.

Bildtolkningsteknik kan användas för att utföra mer generiska uppgifter, som att utifrån ansiktsuttryck i bilder eller video tolka känslor, eller att läsa text inom en bild. Det går idag att fotografera ett lösenord på en router och få ens mobiltelefon att automatiskt ansluta till det nätverket, eller att översätta en kinesisk meny till engelska genom sin mobilkamera.

”Genom att mata in en stor mängd bilder med och utan ansikten lär man en dator att förstå hur ett ansikte ser ut. Datorn lär sig genom exempel istället för genom förprogrammerade regler. Det är som att den löser en stor matematisk ekvation. Det är den processen som kallas maskininlärning – att lära en dator att känna igen mönster i tillhandahållna exempel, och sedan få den att utföra samma uppgift på nya bilder.”

Truls & Espen, facial analysis

Förprogrammerade modeller för bildtolkning finns redan tillgängliga, bland annat Googles Cloud Vision API and Microsofts Computer Vision API. Företag kan utgå från samma byggstenar som används i dessa API:er och sedan bygga vidare på dem för att lära en dator att utföra mer specifika uppgifter som innebär en större affärsnytta för dem.

"Jag pratade med en radiolog på ett sjukhus om den stora mängd röntgenbilder de går igenom dagligen, de flesta av dem standardfall. Bildtolkning skulle kunna hjälpa till att avgöra de enklare fallen, vilket skulle ge läkarna mer tid att fokusera på svårare och mer komplicerade fall.”

En dator kan lära sig att tolka medicinska bilder, som att avgöra från en röntgenbild om ett ben är brutet eller inte, eller att tolka från en bild om en hudförändring tyder på möjlig hudcancer.

Truls & Espen, image analysis

IBM kallar AI i kombination med hyperimaging en av fem innovationer som kommer att förändra våra liv inom fem år och ge oss ”superhero vision”. Med hjälp av AI och dataanalys kommer vi kunna se mer än vi gör med blotta ögat.

”En självkörande bil kommer att kunna upptäcka ett rådjur som står på vägen i tung dimma eftersom den kombinerar det synliga ljuset med olika elektromagnetiska spektrum som den känner av via olika sensorer. En människa bakom ratten hade missat rådjuret.”

Idag används redan instrument som ser mer av det elektromagnetiska spektrumet, som röntgenmaskiner inom vården eller på flygplatser, och tekniken som hjälper flygplan att landa i tjock dimma. Tekniken sägs inom en snar framtid göras tillgänglig i allas vår vardag genom olika bärbara och prisvärda enheter. Med så kallad superhero vision kommer vi bland annat själva kunna se om läkemedel är äkta eller inte, eller direkt kunna avgöra näringsinnehåll och livsmedelssäkerhet i mat.

”Redan idag kan branscher som är beroende av mänsklig tolkning av bilder och video dra nytta av bildtolkningsteknik. Allt från övervakning, där det idag är människor som måste hålla koll på flera övervakningsskärmar, till jordbruk, där AI kan användas tillsammans med drönare för att upptäcka sjukdomsutbrott bland växterna ute på fält eller för att beräkna den förväntade skörden.”

Truls Fretland menar att företag med hjälp av bildtolkningsteknik kan bli mer effektiva och få mer tillförlitliga resultat från bildanalys, oavsett om man använder förprogrammerade algoritmer eller om man lär en dator att utföra mer specifika uppgifter för att stötta ens företag.

"Datorer blir inte trötta. En person som tittar på och tolkar 10 000 bilder om dagen kan bli mindre noggrann mot eftermiddagen. En dator kan analysera bilder dygnet runt. AI och bildtolkning kan frigöra tid från människor så att vi kan fokusera på mer intressanta uppgifter istället.”

Truls mood analysis

För mer information kontakta gärna Truls Fretland, tfret@knowit.no eller Espen Tjønneland, etj@knowit.no

För mer information om våra erbjudanden, läs här!

Vill du arbeta med oss, läs mer om alla våra lediga jobb här!

Till toppen