Thursday, November 24, 2016

Робот-гар ба "нинжа" гар

Сайн муу хоёр мэдээ байна, сайнаас нь эхлэдэг жишигтэй билүү?

Хог хаягдал ялгагч робот

Испани улсын саяхан байгуулагдсан компьютерийн хараа, хиймэл оюун ухаан, роботын технологи хөгжүүлдэг Садако Техноложис гарааны компани нь хиймэл оюун ухаан, компьютерийн харааны технологийн хөгжил, дэвшлийг ашиглан хог хаягдал ялган боловсруулах үйлдвэрийг автоматжуулж, бүтээмжийг нь сайжруулсан Wall-B робот-гар бүтээлээр “Дэлхийн шилдэг роботын гарааны компани” шагнал, мөн "NVidia's Early Stage Challenge" уралдаанд түрүүлж 100,000$ шагналуудыг гардан авчээ.

Тэгэхээр уг роботын эдийн засгийн үр ашиг, тоон үзүүлэлтийг нь сонирхоё, тус компанийн танилцуулгад нь дурдсанаар дэлхий дээр жилд 1.9 тэрбум тонн хог хаягдал үүсдэгээс 13%-ыг нь дахин боловсруулахаар ялган авч чаддаг байна. Үлдсэн 87% нь шатаагдах юм уу, шууд хаягддаг.

Ганц ширхэг ийм робот-гар нь 1ш хаягдал материалыг ~3 секундэд ялгах чадвартай ба жилд нийт 1.8 сая ширхэг хаягдал материал буюу 200 тонн хаягдалыг дамжлага дээрээс шүүн авч чадна. Энэ нь ойролцоогоор 100,000 еврогийн үнэ бүхий хаягдалыг хог болж шатахаас авч үлддэг гэнэ.


Өөрөөр хэлбэл, уг робот-гар нь камерийн тусламжтайгаар ундааны хуванцар сав, лааз гэх мэт дахин боловсруулагддаг хаягдал (хоёрдогч түүхий эд) материалуудыг хүнтэй адил түвшинд ялган таньж чаддаг компьютерийн хараа, хиймэл оюун ухаан, робот инженерчлэлийн технологийн дэвшлийг ашигласан гэсэн үг юм.

За муу мэдээ нь,

Хог хаягдал ялгагч хүмүүс

Манай нийслэл хотын Цагаан давааны хогийн цэг гэж байдаг ба тэнд сардаа 30 мянган тонн хог хаягддаг гэхээр жилд 260 мянган тонн хог хаягдана.


Өмнөх жишээнээс гол ялгаа нь энд хоёрдогч түүхий эд материалыг робот биш "нинжа" гэж нэрлэгдэх хүмүүс очиж түүн, ялгадаг байна. Хог хаягдлын менежмент нь тусдаа асуудал тул сөхсөнгүй, энд зөвхөн технологийн нүдээр харж байгааг ойлгож байгаа биз ээ. Мөн эдгээр хоёрдогч түүхий эдийг ялгаж хөдөлмөрлөж буй нинжа хүмүүсийг ч буруутгах гэсэнгүй. Харин ч нэгэнт хаягдаж байгаа зүйлсийг хүнд хэцүү орчин нөхцөлд, эрүүл мэндээ эрсдэлд оруулан байж авч үлдэн амьдралаа залгуулж байгаа нь сайн хэрэг.

Гол нь хог хаягдал ангилж буй дээрх хоёр гар (arm)-ын ялгааг харуулахаар хичээсэн болно. Тэд болон бидний ялгааны талаар ганцхан жишээ авахад ийм байна.

"Engineers turn dreams into reality" by Hayao Miyazaki



цааш унших...

Monday, November 21, 2016

Компьютерийн хараа (Computer Vision)

Гарааны бизнес, технологийн ертөнц, энтрепрёнершип гэсэн үгс сүүлийн үед их таарч байгаа байх. Энэ тухай мэдээлэл дундаас дараах хэдэн мэдээг онцловол,

- Украйны Looksery царай таних, нүүр хувиргах технологийн гарааны компанийг гэрэл зураг хуваалцах Snapchat компани өнгөрсөн онд худалдан авчээ. Уг арилжаа Украины түүхэнд хамгийн том технологийн наймаа болжээ.


- Беларусын Masquerade буюу MSQRD нүүр хувиргадаг хамгийн эрэлттэй аппыг Фэйсбүүк худалдаж авчээ. Минск хотод болсон Hackathon тэмцээнд компьютерийн программист гурван залуусын 48 цагийн дотор аппын анхны загвараа хийж, улмаар хөрөнгө оруулагчдаас 1 сая ам. долларыг татаж авсанаар уг гарааны компаниа эхлүүлсэн байна.



Энэ гарааны компаниудыг тус бүр ~150 сая орчим ам. доллараар авч, гэхдээ гол нь эдгээр шинэлэг, гоё аппуудын цаадах технологийг нь илүү сонирхоё.

Технологи, шинжлэх ухаан хоёрыг нэг зоосны хоёр тал гэх нь бий. Тиймээс зоосны сүлдтэй тал буюу компьютерийн шинжлэх ухаан, бүр нарийвчлавал компьютерийн хараа (computer vision, товчоор CV), тэр дундаа нүүр царайг таних (facial recognition) алгоритмуудтай товч танилцая.

Компьютерийн хараа
CV нь математик, алгебр, дүрслэх геометр, оптик физик, магадлалын онол, статистик, загварчлал, хиймэл оюун ухаан, машин сургалт, зураг дүрслэл, программчлал гэсэн олон ШУ-ны мэдлэг ололт дээр суурилдаг бөгөөд тухайн судлаач эрдэмтэдээс эдгээр салбарын чамгүй мэдлэг, ур чадвартай байхыг шаарддаг тул харьцангуй түвэгтэй гэгдэх салбар юм. Гэхдээ их сонирхолтой шүү ;-) 

(Зургийг Стэнфордын их сургуулийн “CS131: Computer Vision: Foundations and Applications” хичээлээс авч ашиглав)

Компьютерт бүхий л мэдээлэл, өгөгдөл 2тын тоололын системээр дүрслэгддэг тул бидний харж буй зураг, дүрсүүдийг дан тоонууд хэлбэрээр хардаг, таньдаг гэж ойлгож болно.


(Зургийг “Learning OpenCV Computer Vision in C++ with the OpenCV Library 2nd edition, 2016” номноос авч ашиглав)

Дээрх жишээ зурагт машины дүрслэлийн 10тын тоололын хувилбарыг харуулав.
Хүн аливаа бодит юмсыг нүдээр харж, түүний дүрслэл нь тархинд очиж буудагтай адил компьютерт камераар харж, түүний дүрслэл нь тоонуудад хувирч боловсруулагдана. Эндээс харахад компьютерийн хараа (CV) нь байгаль дээрх бодит юмсыг компьютер руу хөрвүүлж, буулгадаг буюу компьютер графикийн урвуу үйлдэл ч гэж ойлгож болно.


(Зургийг Стэнфордын их сургуулийн “CS131: Computer Vision: Foundations and Applications” хичээлээс авч ашиглав)

Компьютерт зураг дүрслэл нь бодит тоон утгаас тогтсон матриц хэлбэртэй байх ба матрицийн нэг элемент бүр нь харгалзан өнгөний тоон утга (pixel)-тай байна. Жишээ нь, хар цагаан өнгөнөөс тогтсон саарал (grayscale) зураг нь 8 бит бүхий цэг (pixel)-үүдээс бүтнэ.

(Зургийг Стэнфордын их сургуулийн “CS131: Computer Vision: Foundations and Applications” хичээлээс авч ашиглав)
Өнгөт зураг нь RGB гэсэн 3н матрицаас тогтох ба тухайн зургийг хэмжээсээр өөрчлөх (scale), эргүүлэх (rotate), тодролыг өөрчлөх (brightness) үйлдлүүд нь матрицуудыг үржүүлэх, нэмэх, бодит тоогоор хуваах зэрэг математикийн үйлдэл болно.

Одоо бага зэрэг хүндрүүлье, 
Зураг гэдэг нь компьютерт матриц хэлбэртэй байдаг гэдгийг мэдсэн, тэгвэл аливаа A матрицийг UΣVT гэсэн 3н матрицийн үржвэрт задлаж болох ба үүнийг Singular Value Decomposion (SVD) гэнэ. U, V – нь эргүүлэх (rotation), Σ – нь хэмжээс өөрчлөх (scaling) матрицууд.

Уг U – матрицийн багануудыг Principal Component гэх бөгөөд (U*Σ) үржвэр матрицын эхний баганыг VT матрицийн эхний мөрөөр үржүүлсэн нь эхний principal component элемент болох ба үүнийг Apartial – эх A матрицийн нэг хуваагдал буюу нэмэгдэхүүн матриц гэнэ. Иймд бүх Apartial матрицуудын нийлбэрт эх A матриц өөрөө гарна.


(Зургийг Стэнфордын их сургуулийн “CS131: Computer Vision: Foundations and Applications” хичээлээс авч ашиглав)

Эдгээр Apartial матрицууд нь эх зургийн тойм бүдүүвчийг хурдан, хялбархан гаргаж ирдэг тул практикт ихээхэн том хэмжээтэй зурагтай ажиллах, зураг боловсруулах алгоритм зэрэг ажиллагааны гол суурь болдог. Үүнийг  Principal Component Analysis (PCA) гэнэ.
Дээрх жишээ зурагт, нийт 300н principal component -ын зөвхөн эхний 100н утгаас тогтсон матрицаар эх зургийг тоймлон дүрслэж байгааг харуулж байна.

Царай илрүүлэх, таних
Тэгэхээр зураг, видео дундаас эхлээд хүний царай байгаа хэсгийг олж ирүүлнэ, дараа нь нүд, ам, хамар зэрэг зүйлсийг зөв олох хэрэгтэй.

Царайг илрүүлэх олон алгоритм байдаг, тэдгээрээс 2001 онд  Paul Viola, Michael Jones нарын боловсруулсан Viola-Jones алгоритмыг жишээ авая.
Энэ нь хүний нүүрний онцлог шинж чанар дээр тулгуурлаж таньдаг, нүдний төв хэсэг нь эргэн тойрны хэсгээс илүү бараан, хамарын дунд хэсэг бусад хэсгээс илүү цайвар өнгөтэй гэх мэтчилэн бараан цайвар цэгүүдийн ялгаатай байгаа хэсгийг тооцоолно. Алгоритмыг дэлгэрэнгүй тайлбарах нь хэт мэргэжлийн тал руу хэлбийх тул ингээд орхиё ;-) Гэхдээ энэ арга нь харьцангуй бага тооцоолол хийж, хурдан хугацаанд нүүрийг олдог боловч нүүр хажуу тийш их эргэсэн, гэрэлтүүлэг муутай үед сайн ажилладаггүй муу талуудтай.

Царайг нэгэнт илрүүлээд байршлыг нь олсон хойно, одоо түүн дээр ажиллах хэрэгтэй. Өөрөөр хэлбэл таны нүүрний өө сэвийг арилгаж, нүд үсний өнгийг өөрчлөх, зомби эсвэл төмөр хүний багтай болгож нэмэлт зураг давхарлаж харуулах гэх мэт үйлдлүүдийг хийхийн тулд нүд, ам, хамар зэргийн байршил, координатыг олно.

Хүний нүүр царайг нийт 68 цэг байршуулан хэмжих (face landmark estimation) алгоритмыг 2014 онд Vahid Kazemi, Josephine Sullivan нар боловсруулсан байна. Жишээ пайтон кодыг эндээс авч ажиллуулж үзэж болно. Ингээд зураг, видеоноос хүний нүүрийг олж, ялгаж авсан хойно одоо шинэлэг юу хийж, яах нь дараачийн өөр асуудал боллоо.




Компьютерийн шинжлэх ухаан, технологийг "зоосны сүлдтэй талаас" нь товчхон сонирхууллаа ;-)


"Engineers turn dreams into reality" by Hayao Miyazaki



цааш унших...

blogger templates | Make Money Online