Portál UTB - Prohlížení

Prohlížení (S025)

Hlavní nabídka Prohlížení IS/STAG

Najít Kvalifikační práce

Tisk/export:

Export dat do formátu PDF - který můžete pohodlně vytisknout...

Tento odkaz můžete zkopírovat a použít například jako záložku prohlížeče pro zobrazení aktuální pozice v Prohlížení IS/STAG.

Osobní čísla studentů se zobrazují pouze přihlášenému uživateli.

Nalezené termíny, počet: 1

Stránkování výsledků vyhledávání

Nalezeno 1 záznamů Tisk Export do Xls URL na seznam

Příjmení (rod. přijm.)	Jméno	Název	Stav práce		Vedoucí/školitelé	Oponenti	Typ práce	Dat. obhaj.	Název
Student	Typ práce	-	-	-	-	-	-	-	-	-	-
Brückner	Michal	Učení posilováním v umělých neuronových sítích Q-algoritmus			Komínková Oplatková Zuzana	Volná Eva	diplomová	04.06.2021	Učení posilováním v umělých neuronových sítích Q-algoritmus
Michal Brückner	diplomová	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX

Informace o kvalifikační práci Učení posilováním v umělých neuronových sítích Q-algoritmus

Základní údaje

Anotace
Dokument, ke kterému přistupujete, podléhá autorskému zákonu. Jeho porušením se můžete vystavit trestnímu postihu!
Jméno	Brückner Michal
Akad. rok	2020/2021
Zadávající pracoviště	AUIUI
Datum obhajoby	4. 6. 2021
Typ práce	diplomová
Stav práce	Dokončená práce s úspěšnou obhajobou (DUO).
Úplnost vyplnění požadovaných údajů	- Všechny požadované údaje o této VŠKP jsou vyplněny.
Hlavní téma	Učení posilováním v umělých neuronových sítích - Q-algoritmus
Hlavní téma v angličtině	Reinforcement Learning in Artificial Neural Nets - The Q-algorithm
Název dle studenta	Učení posilováním v umělých neuronových sítích Q-algoritmus
Název dle studenta v angličtině	Reinforcement Learning in Artificial Neural Nets - The Q-algorithm
Souběžný název	-
Podnázev	-
Vedoucí	Komínková Oplatková Zuzana, prof. Ing. Ph.D.
Oponent	Volná Eva, prof. RNDr. PaedDr. PhD.
Anotace	V této práci je srozumitelnou formou popsána problematika zpětnovazebního učení, především v poslední době velmi populární Q-algoritmus. Úvodní část je věnována historii použití umělé inteligence v počítačových hrách. Dále je popsán princip fungování posilovaného učení a neuronových sítí. Praktická část práce se věnuje vysvětlení a implementaci konkrétního algoritmu.
Anotace v angličtině	In this diploma thesis, the matter of reinforcement learning is described in an understanda-ble manner. Especially the Q-algorithm, which is nowadays very popular. Introductory part is related to the history of the use of artificial intelligence in the computer games. Further-more, the principle of functioning of reinforcement learning and related neural networks is described. Practical part of the thesis explains and shows the implementation of a specific algorithm.
Klíčová slova	Umělá inteligence, Zpětnovazební učení, Q-učení, Hluboké Q-učení, Neuronové sítě, Konvoluční neuronové sítě, Gomoku
Klíčová slova v angličtině	Artificial intelligence, Reinforcement learning, Q-learning, DQN, Neural networks, CNN, Gomoku
Rozsah průvodní práce	58 s.
Jazyk	CZ
V této práci je srozumitelnou formou popsána problematika zpětnovazebního učení, především v poslední době velmi populární Q-algoritmus. Úvodní část je věnována historii použití umělé inteligence v počítačových hrách. Dále je popsán princip fungování posilovaného učení a neuronových sítí. Praktická část práce se věnuje vysvětlení a implementaci konkrétního algoritmu.
Anotace v angličtině
In this diploma thesis, the matter of reinforcement learning is described in an understanda-ble manner. Especially the Q-algorithm, which is nowadays very popular. Introductory part is related to the history of the use of artificial intelligence in the computer games. Further-more, the principle of functioning of reinforcement learning and related neural networks is described. Practical part of the thesis explains and shows the implementation of a specific algorithm.
Klíčová slova
Umělá inteligence, Zpětnovazební učení, Q-učení, Hluboké Q-učení, Neuronové sítě, Konvoluční neuronové sítě, Gomoku
Klíčová slova v angličtině
Artificial intelligence, Reinforcement learning, Q-learning, DQN, Neural networks, CNN, Gomoku
Zásady pro vypracování	Proveďte rešerši v oblasti použití metod umělé inteligence v počítačových hrách. Seznamte se s problematikou učení posilováním v umělých neuronových sítích. Zaměřte se především na Q-algoritmus a implementujte jej do zvoleného typu počítačové hry. Edukativním způsobem objasněte rozdíl mezi učením bez Q-algoritmu a s Q-algoritmem. Připravte názornou prezentaci k dané tématice.
Zásady pro vypracování
Proveďte rešerši v oblasti použití metod umělé inteligence v počítačových hrách. Seznamte se s problematikou učení posilováním v umělých neuronových sítích. Zaměřte se především na Q-algoritmus a implementujte jej do zvoleného typu počítačové hry. Edukativním způsobem objasněte rozdíl mezi učením bez Q-algoritmu a s Q-algoritmem. Připravte názornou prezentaci k dané tématice.
Seznam doporučené literatury	COMI, Mauro, 2019. How to teach an AI to play Games: Deep Reinforcement Learning. Medium [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/how-to-teach-an-ai-to-play-games-deep-reinforcement-learning-28f9b920440a ANON., nedatováno. [1802.06225] A Deep Q-Learning Agent for the L-Game with Variable Batch Training [online] [vid. 2019-11-28]. Dostupné z: https://arxiv.org/abs/1802.06225 MNIH, Volodymyr, Koray KAVUKCUOGLU, David SILVER, Alex GRAVES, Ioannis ANTONOGLOU, Daan WIERSTRA a Martin RIEDMILLER, 2013. Playing Atari with Deep Reinforcement Learning. arXiv:1312.5602 [cs] [online]. [vid. 2019-11-28]. Dostupné z: http://arxiv.org/abs/1312.5602 SURMA, Greg, 2019. Cartpole - Introduction to Reinforcement Learning (DQN - Deep Q-Learning). Medium [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/cartpole-introduction-to-reinforcement-learning-ed0eb5b58288 ANON., nedatováno. Atari - Solving Games with AI (Part 1: Reinforcement Learning) [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/atari-reinforcement-learning-in-depth-part-1-ddqn-ceaa762a546f HABIB, Nazia, 2019. Hands-On Q-Learning with Python: Practical Q-learning with OpenAI Gym, Keras, and TensorFlow. B. m.:Packt Publishing. ISBN 978-1-78934-580-3. LAPAN, Maxim, 2018. Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more. Birmingham Mumbai: Packt Publishing. ISBN 978-1-78883-424-7.
Seznam doporučené literatury
COMI, Mauro, 2019. How to teach an AI to play Games: Deep Reinforcement Learning. Medium [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/how-to-teach-an-ai-to-play-games-deep-reinforcement-learning-28f9b920440a ANON., nedatováno. [1802.06225] A Deep Q-Learning Agent for the L-Game with Variable Batch Training [online] [vid. 2019-11-28]. Dostupné z: https://arxiv.org/abs/1802.06225 MNIH, Volodymyr, Koray KAVUKCUOGLU, David SILVER, Alex GRAVES, Ioannis ANTONOGLOU, Daan WIERSTRA a Martin RIEDMILLER, 2013. Playing Atari with Deep Reinforcement Learning. arXiv:1312.5602 [cs] [online]. [vid. 2019-11-28]. Dostupné z: http://arxiv.org/abs/1312.5602 SURMA, Greg, 2019. Cartpole - Introduction to Reinforcement Learning (DQN - Deep Q-Learning). Medium [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/cartpole-introduction-to-reinforcement-learning-ed0eb5b58288 ANON., nedatováno. Atari - Solving Games with AI (Part 1: Reinforcement Learning) [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/atari-reinforcement-learning-in-depth-part-1-ddqn-ceaa762a546f HABIB, Nazia, 2019. Hands-On Q-Learning with Python: Practical Q-learning with OpenAI Gym, Keras, and TensorFlow. B. m.:Packt Publishing. ISBN 978-1-78934-580-3. LAPAN, Maxim, 2018. Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more. Birmingham Mumbai: Packt Publishing. ISBN 978-1-78883-424-7.
Přílohy volně vložené	CD ROM
Přílohy vázané v práci	-
Převzato z knihovny	Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby	Diplomant odprezentoval před komisí hlavní cíle a výsledky své diplomové práce. Následně byl student seznámen s posudky vedoucího a oponenta diplomové práce. Diplomant postupně odpověděl na otázky oponenta práce. Komise vznesla k obhajobě následující dotazy a připomínky: 1) Doc. Prokopová vznesla formální připomínky ke způsobu prezentace. 2) Doc. Šenkeřík: Jaké další hry se dají použít s Vaším algoritmem? 3) Doc. Šenkeřík: Jakým způsobem byl řešen bod č. 5 zadání Vaší práce? Na základě dotazu Doc. Šenkeříka komise konstatovala, že bod číslo 5 zadání diplomové práce je splněn formou příloh uložených v systému IS/STAG a také součástí přiloženého CD/DVD. Na kladené dotazy diplomant reagoval dostatečně.
Soubor s průběhem obhajoby

Prohlížení - Portál UTB

Navigace první úrovně

Prohlížení (S025)

Hlavní nabídka Prohlížení IS/STAG

Najít Kvalifikační práce

Nalezené termíny, počet: 1

Stránkování výsledků vyhledávání

Informace o kvalifikační práci Učení posilováním v umělých neuronových sítích Q-algoritmus