Kuidas masin nägemine on automatiseerimine

Masinavisioon on paljude tehnoloogiate sulandumine, mis võimaldavad tööstuslikke või muid automatiseeritud seadmeid tuletada piltidest käsitletava keskkonna täpsema mõistmise. Ilma masina nägemisetarkvarata poleks erineva värviväärtuste ja tonaalse intensiivsusega digitaalsed pildid midagi muud kui lihtne, ühendamata pikslite kollektsioon sellisesse seadmesse. Masinavisioon võimaldab arvutil (tavaliselt ühendatud masinakontrolleriga) sellistel piltidel servade ja kujude tuvastamiseks, et võimaldada kõrgema taseme protsessoril eelnevalt määratletud sihtobjekti ära tunda. Selles mõttes ei piirdu pildid nähtava spektri fotopiltidega; Need võivad sisaldada ka pilte, mis on saadud infrapuna-, laser-, röntgen- ja ultrahelisignaalide abil.

Tööstuskeskkonnas on üsna tavaline, et masina nägemise rakendused tunnevad ära materjali prügikastide segadusse paigutatud paljude osade konkreetseid osi. Siin aitab masina nägemine robotit valida ja kohapeal õiged osad automaatselt korjata. Muidugi, kui kõik osad on korralikult paigutatud kaubaalusele samasse orientatsiooni, oleks neid pildistamise tagasiside abil suhteliselt lihtne ära tunda. Võimsad masina nägemise algoritmid suudavad aga ära tunda objektid, mis asuvad kaamerast erinevatel vahemaadel (ja seetõttu ilmuvad kujutiseanduril erineva suurusega piltidena), aga ka objektid, mis pole kaameraga samas suunas suunatud.

Kõige keerukamad masina nägemissüsteemid on võimaldanud tekkivaid kujundusi, mis on palju keerukamad kui osade korjamine prügikastidest; Näiteks ei pruugi olla keerukamat identifitseerimist kui isesõitva auto.

machine vision

Masinavisiooniga seotud tehnikad

Mõiste masina nägemine on mõnikord reserveeritud viidates keerukamatele ja tõhusamatele matemaatilistele meetoditele, mis võimaldavad piltidelt teavet kaevandada. Seevastu kirjeldab mõiste arvutinägemine tavaliselt moodsamaid, arvutuslikult nõudlikke süsteeme, sealhulgas musta kasti lähenemisviise, mis kasutavad masinõpet või tehisintellekti (AI). Kuid masina nägemist saab kasutada ka kõikehõlmava terminina, mis sisaldab kõiki piltidelt kõrgetasemelise teabe eraldamise meetodeid; Sel juhul kirjeldab arvutvisioon selle aluseks olevat toimimisteooriat.

Tehnikad, mis võivad piltidelt kõrgetasemelist tähendust kaevandada. Teadusringkondades peetakse selliseid tehnikaid sageli masina nägemisest erinevaks. Tegelikkuses on need kõik erinevad viisid masina nägemise rakendamiseks ... ja need kattuvad paljudel juhtudel.

Digitaalne pilditöötlus on digitaalse signaalitöötluse vorm, mis hõlmab pildi täiustamist, taastamist, kodeerimist ja tihendamist. Eelised analoogpiltide töötlemise ees on nii müra ja moonutuste kui ka saadaolevate algoritmide paljusus. Kuu pinna esimeste lähivõtete korrigeerimiseks kasutati ühte esimesi piltide suurendamise tüüpi. Selle protsessi käigus kasutati nii fotogrammeetrilist kaardistamist kui ka mürafiltreid ja tehti parandusi geomeetriliste moonutuste jaoks, mille põhjustas pildikaamera joondamine Kuu pinnaga.

Digitaalse pildi suurendamine hõlmab tavaliselt kontrasti suurendamist ja võib -olla ka geomeetrilisi parandusi nurkade ja läätse moonutuste vaatamiseks. Tihendamine saavutatakse sageli keerukate signaalide lähendamisega koosinusfunktsioonide kombinatsioonina-Fourier-teisenduse, mida tuntakse diskreetse koosinus teisenduse (DCT) nime all. JPEG-failivorming on DCT kõige tavalisem rakendus. Pildi taastamine saab müra ja hägususe eemaldamiseks kasutada ka Fourier -teisendust.

Fotogrammemeetria kasutab piltidest mõõtmiste eraldamiseks mingisugust funktsiooni äratundmist. Need mõõtmised võivad sisaldada 3D -teavet, kui erinevatest kohtadest on saadud mitu sama stseeni pilti. Kõige lihtsamad fotogrammeetrilised süsteemid kasutavad skaalat pildi kahe punkti vahelise vahemaa mõõtmiseks. Selleks on sageli vaja lisada pildile teadaolev võrdlusskaala.

Funktsioonide tuvastamine võimaldab arvutil pildi servi, nurki või punkte ära tunda. See on esimene samm, mis on vajalik fotogrammemeetria ja objektide ja liikumise äratundmiseks. Blobi tuvastamine identifitseerib servadega piirkonnad, mis on serva- või nurga tuvastamiseks liiga siledad.

Mustrituvastust kasutatakse konkreetsete objektide äratundmiseks. Kõige lihtsamal juhul võib see tähendada konveierilindil täpselt määratletud konkreetse mehaanilise osa leidmist.

3D rekonstrueerimine määrab objekti 3D -kuju 2D -pildist. Seda funktsiooni saab realiseerida fotogrammeetriliste meetodite abil. Sel juhul määratakse ühiste tunnuste kõrgused (määratud erinevate vaatluspunktide piltides) triangulatsiooni abil. 3D -rekonstrueerimine on võimalik ka 2D -piltide abil; Siin selgitab tarkvara ka servade või varjutatud alade geomeetrilisi suhteid.

Inimesed saavad kuubikuid rekonstrueerida, töötledes neid oma ajus joonejoonistusega - kasutades sfääride rekonstrueerimiseks varjutatud ringisid. Varjutus näitab pinna kalle. See tuletusprotsess on aga palju keerulisem, kui võib arvata, kuna varjutamine on ühemõõtmeline parameeter, samas kui kalle toimub kahemõõtmelisel juhul. See võib põhjustada mitmetähenduslikke olukordi - fakt, mida kinnitab füüsiliselt võimatute objektide kujutamise kunst.

Kuidas masina nägemise ülesanded järjestatakse

Paljud masina nägemissüsteemid sisaldavad ülaltoodud tehnikaid järk-järgult, alustades madala taseme toimingutest ja liikudes seejärel kõrgema tasemega toiminguteni. Madalaimal tasemel salvestatakse kõik pildi pikslid suure ribalaiuse andmetena. Seejärel tunnistab iga toiming järjestuses pildifunktsioonid ja esindab huvipakkuvat teavet suhteliselt väikese andmetega.

Esimene on pildi suurendamise ja taastamise madala taseme toimimine, millele järgneb funktsioonide tuvastamine. Seega saab mitme anduri kasutamise korral madala taseme toiminguid teha üksikute andurite jaoks spetsialiseerunud hajutatud protsesside abil. Kui funktsioonid on tuvastatud üksikutel piltidel, saab läbi viia täpsema fotogrammeetria - nagu iga objekti tuvastamise või muu ülesande puhul, mis tugineb mitme pildi ja andurite kombineeritud andmetele.

Otsesed arvutamise ja õppimisalgoritmid

Masina nägemise korral on otsene arvutamine programmeerija määratletud matemaatiliste funktsioonide kogum. Need funktsioonid võtavad sisendeid, näiteks pildi piksli väärtused ja toodavad väljundeid, näiteks objekti serva koordinaadid. Seevastu õppimisalgoritmid ei kirjuta otseselt inimesed, vaid neid koolitatakse näite andmekogumites, mis seostavad sisendeid soovitud väljunditega. Selle tulemusel kasutatakse õppimisalgoritme mustade kastidena. Enamik sellist masinõpet kasutab nüüd arvutamiseks kunstlike närvivõrkude põhjal sügavat õppimist.

Tööstuslike rakenduste lihtne masinõpe kipub otsese arvutamise põhjal olema usaldusväärsem ja arvutuslikult nõudlik. Muidugi on piirangud, mida saab otsese arvutamise kaudu saavutada. Näiteks ei tohiks kunagi loota, et ta on vajalikke nägusid, et ära tunda nõutud täpsemad äratundmisharjumused, eriti mitte videomaterjalidest rahvarohketes avalikes ruumides. Seevastu masinõpe saab selliste rakendustega oskuslikult hakkama. Seetõttu pole üllatav, et masinõpet kasutatakse üha enam madala taseme masina nägemise toiminguteks, täpsemalt pildi suurendamiseks, taastamiseks ja funktsioonide tuvastamiseks.

Täiustatud õpetamismeetodid (mitte algoritmid)

Süvaõppe tehnikate kasvav keerukus on teinud selgeks, et parandada ei pea mitte õppimisalgoritmid ise, vaid pigem algoritmide koolitamise viis. Ühte täiustatud koolitusprotseduuri nimetatakse andmekeskseks arvutinägevuseks. Siin võtab sügav õppimissüsteem vastu väga jõulise treeningkomplekti, mis koosneb tuhandetest, miljonitest või isegi miljarditest piltidest - ja salvestab seejärel sünteesitud teabe, mis on igast pildist eraldatud algoritmide abil. Need algoritmid õpivad tõhusalt, sidudes need töötavate näidetega, ja viitavad seejärel "vastuseraamatule", et kontrollida, kas õiged väärtused on tuletatud.

Digitaalse mustrituvastuse kohta on olemas vana ettevaatlik lugu. USA sõjavägi kavatses kunagi kasutada masina nägemist sihtmärgi äratundmiseks ja kaitsetöövõtja meeleavaldus tuvastas usaldusväärselt nii USA kui ka Venemaa tanke. Igasuguseid erinevaid tanke saab õigesti eristada, üksteise järel tarnija õhust fotodest. Pentagoni enda pildiraamatukoguga uuesti testimisel andis süsteem pidevalt valesid vastuseid. Probleem oli selles, et kaitsetöövõtjate pildid kujutasid kõik Ameerika tanke kõrbes ja Venemaa tanke rohelistel põldudel. Erinevate paakide tuvastamise asemel tuvastas süsteem erinevat värvi tausta. Millised on tunnustuskriteeriumid? Õppimisalgoritmid nõuavad töötamiseks hoolikalt kureeritud koolitusandmeid.

Järeldus: ohutu visioon robotitööde kohta

Masinavisioon pole enam nišitehnoloogia. Praeguses sõitudes on tööstussektor masin nägemise juurutamise suurim kasvupiirkond. Selle valdkonna kõige silmapaistvam areng on see, kuidas masina nägemine on nüüd ohutussüsteemid, st tööstustes, st süsteemid, mis kõlavad häiret või annavad hääleteatisi, kui töötaja siseneb tööalale ilma kiivri, maski või muude sobivate kaitsevarustuseta. Masina nägemist saab kasutada ka süsteemides, mis hoiatavad masinate liikumisel, näiteks kahveltõstukid, pääsevad personalile liiga lähedale.

Need ja sarnased masina nägemissüsteemid võivad mõnikord asendada tööstusrobotite ümber raskeid kaitsemeetmeid, et muuta toimingud tõhusamaks. Masinavisioonisüsteemid võivad ka asendada või täiustada ohutussüsteeme, mis põhinevad valves, mis peatavad masinaid alati, kui töötaja tuvastatakse töökambrisse sisenemisel. Kui masina nägemine jälgib tehase põrandat tööelemendi ümber, on selle raku robotitel potentsiaal inimeste lähenedes järk -järgult aeglustada.

Kuna tööstuskeskkondade kujundamine areneb nii, et mahutab koostööroboteid ja muid töörakude seadmeid, mis võimaldavad taimepersonalil turvaliselt ringi kõndida (isegi seadmete töö ajal), muutuvad need ja muud masina nägemispõhised süsteemid taimeprotsesside tavalisemaks osaks.

Kuidas masin nägemine ajab automatiseerimist