V této práci je srozumitelnou formou popsána problematika zpětnovazebního učení,
především v poslední době velmi populární Q-algoritmus. Úvodní část je věnována historii použití umělé inteligence v počítačových hrách. Dále je popsán princip fungování posilovaného učení a neuronových sítí. Praktická část práce se věnuje vysvětlení a implementaci konkrétního algoritmu.
Anotace v angličtině
In this diploma thesis, the matter of reinforcement learning is described in an understanda-ble manner. Especially the Q-algorithm, which is nowadays very popular. Introductory part is related to the history of the use of artificial intelligence in the computer games. Further-more, the principle of functioning of reinforcement learning and related neural networks is described. Practical part of the thesis explains and shows the implementation of a specific algorithm.
V této práci je srozumitelnou formou popsána problematika zpětnovazebního učení,
především v poslední době velmi populární Q-algoritmus. Úvodní část je věnována historii použití umělé inteligence v počítačových hrách. Dále je popsán princip fungování posilovaného učení a neuronových sítí. Praktická část práce se věnuje vysvětlení a implementaci konkrétního algoritmu.
Anotace v angličtině
In this diploma thesis, the matter of reinforcement learning is described in an understanda-ble manner. Especially the Q-algorithm, which is nowadays very popular. Introductory part is related to the history of the use of artificial intelligence in the computer games. Further-more, the principle of functioning of reinforcement learning and related neural networks is described. Practical part of the thesis explains and shows the implementation of a specific algorithm.
Proveďte rešerši v oblasti použití metod umělé inteligence v počítačových hrách.
Seznamte se s problematikou učení posilováním v umělých neuronových sítích.
Zaměřte se především na Q-algoritmus a implementujte jej do zvoleného typu počítačové hry.
Edukativním způsobem objasněte rozdíl mezi učením bez Q-algoritmu a s Q-algoritmem.
Připravte názornou prezentaci k dané tématice.
Zásady pro vypracování
Proveďte rešerši v oblasti použití metod umělé inteligence v počítačových hrách.
Seznamte se s problematikou učení posilováním v umělých neuronových sítích.
Zaměřte se především na Q-algoritmus a implementujte jej do zvoleného typu počítačové hry.
Edukativním způsobem objasněte rozdíl mezi učením bez Q-algoritmu a s Q-algoritmem.
Připravte názornou prezentaci k dané tématice.
Seznam doporučené literatury
COMI, Mauro, 2019. How to teach an AI to play Games: Deep Reinforcement Learning. Medium [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/how-to-teach-an-ai-to-play-games-deep-reinforcement-learning-28f9b920440a
ANON., nedatováno. [1802.06225] A Deep Q-Learning Agent for the L-Game with Variable Batch Training [online] [vid. 2019-11-28]. Dostupné z: https://arxiv.org/abs/1802.06225
MNIH, Volodymyr, Koray KAVUKCUOGLU, David SILVER, Alex GRAVES, Ioannis ANTONOGLOU, Daan WIERSTRA a Martin RIEDMILLER, 2013. Playing Atari with Deep Reinforcement Learning. arXiv:1312.5602 [cs] [online]. [vid. 2019-11-28]. Dostupné z: http://arxiv.org/abs/1312.5602
SURMA, Greg, 2019. Cartpole - Introduction to Reinforcement Learning (DQN - Deep Q-Learning). Medium [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/cartpole-introduction-to-reinforcement-learning-ed0eb5b58288
ANON., nedatováno. Atari - Solving Games with AI (Part 1: Reinforcement Learning) [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/atari-reinforcement-learning-in-depth-part-1-ddqn-ceaa762a546f
HABIB, Nazia, 2019. Hands-On Q-Learning with Python: Practical Q-learning with OpenAI Gym, Keras, and TensorFlow. B. m.:Packt Publishing. ISBN 978-1-78934-580-3.
LAPAN, Maxim, 2018. Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more. Birmingham Mumbai: Packt Publishing. ISBN 978-1-78883-424-7.
Seznam doporučené literatury
COMI, Mauro, 2019. How to teach an AI to play Games: Deep Reinforcement Learning. Medium [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/how-to-teach-an-ai-to-play-games-deep-reinforcement-learning-28f9b920440a
ANON., nedatováno. [1802.06225] A Deep Q-Learning Agent for the L-Game with Variable Batch Training [online] [vid. 2019-11-28]. Dostupné z: https://arxiv.org/abs/1802.06225
MNIH, Volodymyr, Koray KAVUKCUOGLU, David SILVER, Alex GRAVES, Ioannis ANTONOGLOU, Daan WIERSTRA a Martin RIEDMILLER, 2013. Playing Atari with Deep Reinforcement Learning. arXiv:1312.5602 [cs] [online]. [vid. 2019-11-28]. Dostupné z: http://arxiv.org/abs/1312.5602
SURMA, Greg, 2019. Cartpole - Introduction to Reinforcement Learning (DQN - Deep Q-Learning). Medium [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/cartpole-introduction-to-reinforcement-learning-ed0eb5b58288
ANON., nedatováno. Atari - Solving Games with AI (Part 1: Reinforcement Learning) [online] [vid. 2019-11-28]. Dostupné z: https://towardsdatascience.com/atari-reinforcement-learning-in-depth-part-1-ddqn-ceaa762a546f
HABIB, Nazia, 2019. Hands-On Q-Learning with Python: Practical Q-learning with OpenAI Gym, Keras, and TensorFlow. B. m.:Packt Publishing. ISBN 978-1-78934-580-3.
LAPAN, Maxim, 2018. Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more. Birmingham Mumbai: Packt Publishing. ISBN 978-1-78883-424-7.
Přílohy volně vložené
CD ROM
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Diplomant odprezentoval před komisí hlavní cíle a výsledky své diplomové práce. Následně byl student seznámen s posudky vedoucího a oponenta diplomové práce. Diplomant postupně odpověděl na otázky oponenta práce.
Komise vznesla k obhajobě následující dotazy a připomínky:
1) Doc. Prokopová vznesla formální připomínky ke způsobu prezentace.
2) Doc. Šenkeřík: Jaké další hry se dají použít s Vaším algoritmem?
3) Doc. Šenkeřík: Jakým způsobem byl řešen bod č. 5 zadání Vaší práce?
Na základě dotazu Doc. Šenkeříka komise konstatovala, že bod číslo 5 zadání diplomové práce je splněn formou příloh uložených v systému IS/STAG a také součástí přiloženého CD/DVD.
Na kladené dotazy diplomant reagoval dostatečně.