Title: Rekonstrukce pózy lidské ruky z hloubkového obrazu
Other Titles: Depth-based hand pose estimation
Authors: Herbig, Milan
Advisor: Krňoul Zdeněk, Ing. Ph.D.
Referee: Hrúz Marek, Ing. Ph.D.
Issue Date: 2016
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/23643
Keywords: regrese;odhad parametrů;rekonstrukce pózy;3d model;strojové učení;konvoluční neuronová síť
Keywords in different language: regression;parameter estimation;pose reconstruction;3d model;machine learning;convolutional neural network
Abstract: Téma práce je zaměřeno na aplikaci state-of-the-art konvolučních neuronových sítí za účelem rekonstrukce pózy lidské ruky z hloubkových dat pořízených kamerou Microsoft Kinect v2. V práci se věnuji současným metodám a přístupům k rekonstrukci pózy, problémům spojeným s trénováním neuronových sítí, tvorbě trénovacích dat, jejich normalizaci a konečně návrhu samotné architektury neuronové sítě pro účely regrese pózy lidské ruky. V závěru diskutuji dosažené výsledky. Výstupem práce je jednak navržená architektura konvoluční neuronové sítě a jednak natrénovaný model. Zároveň jsem vytvořil modul pro snímání a segmentaci hloubkových dat z kamery včetně modulu pro vizualizaci výsledků rekonstrukce. Celý systém běží v reálném čase s využitím výpočtů na grafické kartě.
Abstract in different language: This thesis explores possibilities and contributions of state-of-the-art convolutional neural networks to hand pose estimation problem. Hand pose is estimated from depth images recorded by Microsoft Kinect v2 depth camera. Current hand estimation methods and neural networks in general are discussed. The focus is set on problems during neural network training, data creation and normalization. Whole chapter is devoted to regression convolution neural network model design. Finally, observed results are discussed in the last chapter. This work produces both proposed and trained neural network model. Also, for real-word testing and demonstration purposes, both segmentation and visualization modules were developed. It is worth noting that whole pipeline runs in real time on GPU.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KKY)

Files in This Item:
File Description SizeFormat 
dipl_prace_final.pdfPlný text práce9,75 MBAdobe PDFView/Open
herbig-v.pdfPosudek vedoucího práce799,1 kBAdobe PDFView/Open
herbig-o.pdfPosudek oponenta práce664,35 kBAdobe PDFView/Open
herbig-p.pdfPrůběh obhajoby práce437,35 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/23643

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.