Jagten på det perfekte visionssystem

Thomas B. Moeslund

Presse/medie

Beskrivelse

Siden visionsteknologiens barndom har automatisk palleplukning, kaldet bin picking, været et eftertragtet, men hidtil uopnåeligt mål Af Sebastian Swiatecki red@ing.dk, søndag 24. okt 2004 kl. 02:00 Det lyder lettere end det er. At få synsstyrede robotter til at tage masseproducerede emner op fra en uordnet bunke, og placere dem korrekt med den rigtige side opad. Øvelsen kaldes bin picking og fordelene ved det er blandt andet, at det kan være med til at minimere EGA, Ensidigt Gentaget Arbejde. Hertil kommer, at lønomkostningerne kan bringes ned, i en tid hvor ufaglært arbejdskaft til at fodre produktionsudstyr kan købes langt billigere ude i verden. Automatsystemer til bin picking kan fastholde produktion i Danmark, der ellers vil blive dømt ulønsom. Elektronikingeniør og visionspecialist, Peter Bank Nielsen skitserer i Vandposten, et internt blad fra Grundfos, nogle elementer, der gør bin picking vanskelig. Han mener dog, at målet er inden for rækkevidde. Barsk problemstilling Komponenter i en palle ligger i alle vinkler og i flere lag, og derfor er bin picking en 3D teknik. Grundfos har allerede en maskine, der griber løberskovle, og placerer dem i en svejsemaskine. Men her ligger skovlene på et bord i samme plan, når robotarmen griber dem, og robotten arbejder derfor kun i 2D. Komponenter i en palle stiller helt andre krav, og rustfrit stål stiller ekstra store krav. Det er blankt, og det giver refleksioner, så kameraet i visiondelen kan blive forvirret. En japansk robotproducent er kommet med en løsning med en cyklustid på 15 sekunder. Men det er ikke hurtigt nok for Grundfos. Robotten må ned på en cyklustid på under 10 sekunder, for at det kan betale sig at investere i teknologien. Grundfos ønsker et standardkoncept – en standardplatform med få ændringer i softwaren vil være det ideelle. »Kan vi finde en løsning med en hurtig robot og visionteknologi på et højt stade, så kan vi uden tvivl langt bedre klare os i konkurrencen med lavtlønslande. Dette er en interessant tanke i disse tider, hvor der tales så meget om udflytning af arbejdspladser,« siger Peter Bank Nielsen fra Grundfos. Flere store udfordringer Fra den erfarne del af visionbranchen peger Jørgen Læssøe , JLI Vision A/S på, at der har været skrevet lærde universitetsartikler om bin picking i hvert fald siden 1985, uden at problemet er blevet løst. Årsagen er, at man hverken kan opnå kontrolleret belysning eller kontrolleret baggrund, hvilket normalt er det første en visionspecialist sørger for. Problemet er, at bin-emner skygger for hinanden, overlapper hinanden, og giver kaotisk belysning og lysreflekser. »Visionsystemer er optiske måleapparater med nogen intelligens. De kan på ingen måde hamle op med mennesker, når det drejer sig om komplekse scener. De kan derimod måle meget nøjagtigt, men det er der jo ikke behov for til bin picking,« fastslår Jørgen Læssøe. Spørgsmålet er, om generel bin picking i virkeligheden ikke er en uløselig opgave for et visionsystem. Fordi der ikke er nok ordnet visuel information at gribe fat i for den type af software, som det er muligt at lave i dag. Man kan sammenligne sværhedsgraden med fritekst talegenkendelse. Opgaven går ud på at diktere fritekst tale til en computer uden brug af tastatur, med forventning om, at systemet nedskriver det man siger korrekt. En ultimativ teknologibarriere ser ud til at være, at mange lyde i talesprog, i praksis udtales stort set ens, selv om de repræsenterer måske 20 vidt forskellige ord. Disse ensartede lyde kan mennesker uden videre udrede, fordi vi forstår betydningssammenhængen grundet vores store diffuse, erfaringsbaserede intelligens. Det kan software ikke. Så når lyde, der betyder forskellige ord, udtales ens, skal softwaren i gang med at gætte. Verdens bedste engelsksprogede talegenkendere fejltolker derfor fortsat mange ord, hvor mennesker uden problemer fatter almindeligt talesprog korrekt. Spørgsmålet er, om der må intelligens til, før man kan få en generel visionplatform til at plukke emner ud af en kaotisk blanding af lys, konturer, skygger og reflekser i en bin. Skyggerne står i vejen Fra afdeling for Computer Vision og Medieteknologi på Aalborg Universitet siger lektor ph.d. Thomas Moeslund om problemstillingen: »At gå fra 2D til 3D er svært på grund af den ekstra dimensionalitet, men et andet stort problem er occlusion. Det vil sige, at nogle objekter skygger for andre. Dels kan man ikke være sikker på, hvilke pixels i billedet, som kommer fra hvilket objekt, og dels ændrer occlusioner lysforholdene ved at kaste skygger nogle steder og ikke andre steder. Som feltet ser ud i dag, er lysforhold det helt store problem. Faktisk vil kun ganske få af industriens visionsystemer virke, hvis ikke lyset var kontrolleret,« siger han. I forhold til fritekst talegenkendelse peger Thomas Moeslund på, at det er afgørende vigtigt, at systemet ved, hvilken lydstreng, der skal genkendes. Hvornår man skal starte og slutte sin talegenkender. Noget der ikke bliver lettere af, at ordene overlapper hinanden. Hvilket kan sidestilles med, at objekterne overlapper hinanden i en bin. Efterlyser bedre og mere effektivt system Thomas Moeslund vurderer, at det må være muligt at knække nøden med brug af kendte visiondiscipliner, såsom detektion af kanter, flader og struktur. Samt bedre brug af emnets underliggende 3D cad model. Han foreslår også, at man tager en lidt bredere ingeniørhat på, idet problemet allerede kan løses med ad hoc-tilgange i form af transportbånd og rysteanordninger, så objekterne bliver præsenteret for kameraet et ad gangen og kun i 2D. Hvilket dog netop er det Grundfosartiklen peger på, at man allerede kan. Hvorfor man alligevel efterlyser noget, der er bedre og mere effektivt. Det vil sige ægte bin picking, såsom med en synsstyret robot, der uden for meget træning stilles foran en palle, hvor den begynder at plukke emner korrekt, hurtigt og sikkert hver gang. Uden løn, overarbejdsbetaling, fravær og andet der hører mennesker til.

Periode	24 okt. 2004

Mediedækning

Titel	Jagten på det perfekte visionssystem
Mediets navn/udløb	Ingeniøren
Varighed/længde/størrelse	Telefonisk interview med Sebastian Swiatecki red@ing.dk
Dato	24/10/2004
Producer/forfatter	Thomas B. Moeslund
Personer	Thomas B. Moeslund

Se alle 1

Se færre