Práce se zabývá tvorbou modelu neuronové sítě pro rozpoznávání nahoty - odhalených lidských postav - v multimediálních souborech. V práci je uveden výstup z provedeného průzkumu open-source i komerčních projektů, které se zabývají problematikou rozpoznávání nahoty či obecné formy pornografie v multimediálních souborech, tedy tzv. NSFW (not safe for work - nikoliv bezpečné pro práci) detektory či klasifikátory. Výsledný model byl vytvořen zejména pro specifické účely Policie České republiky, pro použití v rámci vyšetřování trestných činů souvisejících s problematikou obecné pornografie, kde bylo vzhledem k velkému množství multimediálních souborů potřebné navržení a implementace techniky automatizovaného vyhodnocení z hlediska přítomnosti pornografického obsahu. Při tvorbě bylo využito volně dostupných nástrojů a technologií z oblasti umělé inteligence a strojové-ho učení, konkrétně konvolučních neuronových sítí stechnikami hlubokého učení. Použité modely byly srovnány a aktuální dosažená přesnost se pohybuje kolem 42 %, respektive 76 %.
Anotace v angličtině
This thesis deals with the creation of a neural network model for nudity detection, i.e. de-tection of exposed human bodies, in multimedia files. The thesis presents the output from the survey of open-source and commercial projects which deal with the issue of detection of nudity or general form of pornography in multimedia files, so-called NSFW (not safe for work) detectors or classifiers. The final model has been created mainly for the specific pur-poses of the Police of the Czech Republic, to be used in the investigation of criminal offen-ses related to issues of general pornography. Given the large number of multimedia files, it was necessary to design and implement the techniques of automated evaluation in terms of the presence of pornographic content. During this process, freely available tools and tech-nologies of artificial intelligence and machine learning were used, specifically convolution neural networks with deep learning techniques. The models employed have been compared and the current achieved accuracy is around 42 % and 76 %, respectively.
Práce se zabývá tvorbou modelu neuronové sítě pro rozpoznávání nahoty - odhalených lidských postav - v multimediálních souborech. V práci je uveden výstup z provedeného průzkumu open-source i komerčních projektů, které se zabývají problematikou rozpoznávání nahoty či obecné formy pornografie v multimediálních souborech, tedy tzv. NSFW (not safe for work - nikoliv bezpečné pro práci) detektory či klasifikátory. Výsledný model byl vytvořen zejména pro specifické účely Policie České republiky, pro použití v rámci vyšetřování trestných činů souvisejících s problematikou obecné pornografie, kde bylo vzhledem k velkému množství multimediálních souborů potřebné navržení a implementace techniky automatizovaného vyhodnocení z hlediska přítomnosti pornografického obsahu. Při tvorbě bylo využito volně dostupných nástrojů a technologií z oblasti umělé inteligence a strojové-ho učení, konkrétně konvolučních neuronových sítí stechnikami hlubokého učení. Použité modely byly srovnány a aktuální dosažená přesnost se pohybuje kolem 42 %, respektive 76 %.
Anotace v angličtině
This thesis deals with the creation of a neural network model for nudity detection, i.e. de-tection of exposed human bodies, in multimedia files. The thesis presents the output from the survey of open-source and commercial projects which deal with the issue of detection of nudity or general form of pornography in multimedia files, so-called NSFW (not safe for work) detectors or classifiers. The final model has been created mainly for the specific pur-poses of the Police of the Czech Republic, to be used in the investigation of criminal offen-ses related to issues of general pornography. Given the large number of multimedia files, it was necessary to design and implement the techniques of automated evaluation in terms of the presence of pornographic content. During this process, freely available tools and tech-nologies of artificial intelligence and machine learning were used, specifically convolution neural networks with deep learning techniques. The models employed have been compared and the current achieved accuracy is around 42 % and 76 %, respectively.
Proveďte řešerši v oblasti automatizovaného rozpoznávání nahoty v multimediálních souborech.
Proveďte řešerši v oblasti používaných metod pro rozpoznávání odhalených postav.
Připravte vhodný dataset pro klasifikaci a rozpoznávání odhalených postav.
Navrhněte vhodný model umělé neuronové sítě pro rozpoznávání odhalených postav a síť natrénujte.
Proveďte zhodnocení úspěšnosti navržené metody.
Zásady pro vypracování
Proveďte řešerši v oblasti automatizovaného rozpoznávání nahoty v multimediálních souborech.
Proveďte řešerši v oblasti používaných metod pro rozpoznávání odhalených postav.
Připravte vhodný dataset pro klasifikaci a rozpoznávání odhalených postav.
Navrhněte vhodný model umělé neuronové sítě pro rozpoznávání odhalených postav a síť natrénujte.
Proveďte zhodnocení úspěšnosti navržené metody.
Seznam doporučené literatury
GOODFELLOW, Ian, BENGIO, Yoshua, COURVILLE, Aaron (2016). Machine learning basics. Deep learning [online]. MIT Press. 2016. Dostupné také z: https://www.deeplearningbook.org/.
RAMSUNDAR, Bharath a Reza Bosagh ZADEH. TensorFlow for deep learning: from linear regression to reinforcement learning [online]. Beijing: O'Reilly Media. 2018. ISBN 9781491980422.
ROSEBROCK, Adrian. Starter Bundle. In: Deep Learning for Computer Vision with Python. PyimageSearch.com. 2017.
ROSEBROCK, Adrian. Practitioner Bundle. In: Deep Learning for Computer Vision with Python. PyimageSearch.com. 2017.
KAR, Krishnendu. Mastering Computer Vision with TensorFlow 2.x. Packt Publishing. 2020. ISBN 978-1-83882-706-9.
RASCHKA, Sebastian a Vahid MIRJALILI. Python machine learning: machine learning and deep learning with Python, scikit-learn, and TensorFlow . Second edition. Birmingham: Packt, 2017, xviii, 595 s. ISBN 978-1-78712-593-3.
CHOLLET, François. Deep learning v jazyku Python: knihovny Keras, Tensorflow . Praha: Grada Publishing, 2019, 328 s. Knihovna programátora. ISBN 978-80-247-3100-1.
Seznam doporučené literatury
GOODFELLOW, Ian, BENGIO, Yoshua, COURVILLE, Aaron (2016). Machine learning basics. Deep learning [online]. MIT Press. 2016. Dostupné také z: https://www.deeplearningbook.org/.
RAMSUNDAR, Bharath a Reza Bosagh ZADEH. TensorFlow for deep learning: from linear regression to reinforcement learning [online]. Beijing: O'Reilly Media. 2018. ISBN 9781491980422.
ROSEBROCK, Adrian. Starter Bundle. In: Deep Learning for Computer Vision with Python. PyimageSearch.com. 2017.
ROSEBROCK, Adrian. Practitioner Bundle. In: Deep Learning for Computer Vision with Python. PyimageSearch.com. 2017.
KAR, Krishnendu. Mastering Computer Vision with TensorFlow 2.x. Packt Publishing. 2020. ISBN 978-1-83882-706-9.
RASCHKA, Sebastian a Vahid MIRJALILI. Python machine learning: machine learning and deep learning with Python, scikit-learn, and TensorFlow . Second edition. Birmingham: Packt, 2017, xviii, 595 s. ISBN 978-1-78712-593-3.
CHOLLET, François. Deep learning v jazyku Python: knihovny Keras, Tensorflow . Praha: Grada Publishing, 2019, 328 s. Knihovna programátora. ISBN 978-80-247-3100-1.
Přílohy volně vložené
-
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Diplomant seznámil komisi s výsledky své diplomové práce. Poté byly prezentovány posudky vedoucí a oponentky diplomové práce. Poté byla vedena rozprava během které byly položeny následující dotazy:
Diplomová práce se zabývá odhalováním obnažených postav. V rámci praktické části vlastní návrh, který bude využíván především na Oddělení analytiky a kybernetické kriminality Policie ČR. Navržený model je rovněž srovnán s komerčně dostupným softwarovým nástrojem, kdy diplomant dosáhl mnohem vyšších hodnot přesnosti. Práce je zpracována kvalitně a má dosah nejen v oblasti řešení kriminality odděleními Policie ČR, ale také v komerční sféře. Lze například filtrovat nežádoucí snímky na veřejných platformách pro sdílení dat. (doc. Komínková Oplatková)
Vytvořený model byl natrénovaný pomocí architektury Yolov5 a nástroje PyTorch. Jeho výstupem je detekce pěti stanovených obnažených částí lidského těla s procentuálním vyjádřením odhadu detekovaných tříd, ať už v textové nebo grafické podobě. Tímto byl tedy hlavní cíl práce ve smyslu rozpoznávání odhalených postav naplněn.
1. Jak se liší schéma obecného klasifikátoru od klasifikátoru pro rozpoznávání odhalených postav? Oba pojmy v práci používáte.
2. Byla již vytvořená aplikace někde prakticky nasazena? Pokud ano, tak kde a s jakým výsledkem. (prof. Volná)
Dělal jste rešerši existujících řešení a jak jste přišel na skutečnost, že podobné řešení není. Můj dotaz je zda vaše metoda je lepší než metody, který používají defaultně servery pracující s obrázky. Nebo se jedná o bezpečnostní důvody, kdy nemůžete předat vaše data? (dr. Bližňák)
Jakým způsobem se zadávají data do vaší aplikace? (dr. Sysala)
Jaké formáty obrázků podporuje vaše aplikace? Podporuje i videa? (doc. Gazdoš)
Diplomant pohotově reagoval a všechny otázky správně zodpověděl.