Cílem této bakalářské práce je představení technologií Big Data a jejich možné využití v praxi. Hlavním cílem této práce v teoretické části je poskytnout přehled v oblasti Big Data a NoSQL databází pro všechny začátečníky. V praktické části je detailně představen Apache Hadoop a projekty s ním svázané. Součástí práce jsou postupy, jak dané technologie nainstalovat včetně příkladů a scénářů použití.
Anotace v angličtině
This bachelor's thesis presents Big Data technologies and their possible real-world use cases and applications. The main goal of this thesis is to provide the first introduction to Big Data and NoSQL databases for newcomers. In practical part, Apache Hadoop and its surrounding projects are presented in detail. Integral part of this thesis is light cookbook how to install particular technologies itself with functional demo examples of possible use cases and scenarios.
Klíčová slova
Big Data, NoSQL, CAP teorém, Apache Hadoop, HDFS, YARN, MapReduce, Apache Hadoop Ecosystem, Spark, Pig, Hive, Sqoop
Klíčová slova v angličtině
Big Data, NoSQL, CAP Theorem, Apache Hadoop, HDFS, YARN, MapReduce, Apache Hadoop Ecosystem, Spark, Pig, Hive, Sqoop
Rozsah průvodní práce
151 s. (239 038 znaků)
Jazyk
AN
Anotace
Cílem této bakalářské práce je představení technologií Big Data a jejich možné využití v praxi. Hlavním cílem této práce v teoretické části je poskytnout přehled v oblasti Big Data a NoSQL databází pro všechny začátečníky. V praktické části je detailně představen Apache Hadoop a projekty s ním svázané. Součástí práce jsou postupy, jak dané technologie nainstalovat včetně příkladů a scénářů použití.
Anotace v angličtině
This bachelor's thesis presents Big Data technologies and their possible real-world use cases and applications. The main goal of this thesis is to provide the first introduction to Big Data and NoSQL databases for newcomers. In practical part, Apache Hadoop and its surrounding projects are presented in detail. Integral part of this thesis is light cookbook how to install particular technologies itself with functional demo examples of possible use cases and scenarios.
Klíčová slova
Big Data, NoSQL, CAP teorém, Apache Hadoop, HDFS, YARN, MapReduce, Apache Hadoop Ecosystem, Spark, Pig, Hive, Sqoop
Klíčová slova v angličtině
Big Data, NoSQL, CAP Theorem, Apache Hadoop, HDFS, YARN, MapReduce, Apache Hadoop Ecosystem, Spark, Pig, Hive, Sqoop
Zásady pro vypracování
Zpracujte literární rešerši na dané téma.
Proveďte popis jednotlivých vybraných technologií.
Vypracujte pro ně praktické návody k instalaci a konfiguraci.
Vytvořte funkční sady demonstračních příkladů pro nejběžnější použití daných technologií.
Proveďte celkové zhodnocení a závěr.
Zásady pro vypracování
Zpracujte literární rešerši na dané téma.
Proveďte popis jednotlivých vybraných technologií.
Vypracujte pro ně praktické návody k instalaci a konfiguraci.
Vytvořte funkční sady demonstračních příkladů pro nejběžnější použití daných technologií.
Proveďte celkové zhodnocení a závěr.
Seznam doporučené literatury
ERL, Thomas, Wajid KHATTAK a Paul BUHLER. Big data fundamentals: concepts, drivers \& techniques. Vancouver, BC: Service Tech Press, \matsymb{lbrack}2016\matsymb{rbrack}. ISBN 978-0-13-429107-9.
WALKER, Russell. From big data to big profits: success with data and analytics. New York, NY: Oxford University Press, \matsymb{lbrack}2015\matsymb{rbrack}. ISBN 978-0199378326.
HARRISON, Guy. Next generation databases: NoSQL, NewSQL, and Big Data. New York, NY: Apress, \matsymb{lbrack}2015\matsymb{rbrack}. ISBN 978-148421330.
SITTO, Kevin. Field guide to Hadoop. USA: O\symbol{39}Reilly, \matsymb{lbrack}2015\matsymb{rbrack}. ISBN 978-1491947937.
VOHRA, Deepak. Practical Hadoop ecosystem: a definitive guide to Hadoop-related frameworks and tools. New York, NY: Apress, \matsymb{lbrack}2016\matsymb{rbrack}. ISBN 978-1484221983.
Seznam doporučené literatury
ERL, Thomas, Wajid KHATTAK a Paul BUHLER. Big data fundamentals: concepts, drivers \& techniques. Vancouver, BC: Service Tech Press, \matsymb{lbrack}2016\matsymb{rbrack}. ISBN 978-0-13-429107-9.
WALKER, Russell. From big data to big profits: success with data and analytics. New York, NY: Oxford University Press, \matsymb{lbrack}2015\matsymb{rbrack}. ISBN 978-0199378326.
HARRISON, Guy. Next generation databases: NoSQL, NewSQL, and Big Data. New York, NY: Apress, \matsymb{lbrack}2015\matsymb{rbrack}. ISBN 978-148421330.
SITTO, Kevin. Field guide to Hadoop. USA: O\symbol{39}Reilly, \matsymb{lbrack}2015\matsymb{rbrack}. ISBN 978-1491947937.
VOHRA, Deepak. Practical Hadoop ecosystem: a definitive guide to Hadoop-related frameworks and tools. New York, NY: Apress, \matsymb{lbrack}2016\matsymb{rbrack}. ISBN 978-1484221983.
Přílohy volně vložené
-
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Student obsáhle prezentoval svoji rozsáhlou práci. Na závěr prezentace byly přečteny posudky vedoucího a oponenta. Následovala rozsáhlá diskuze v rámci které byly položeny následující dotazy:
Ing. Michal Bližňák, Ph.D. :1. Jaké jsou výhody (jsou-li) instalace Hadoop ekosystému na vlastních serverech?
2. Vzal jste v úvahu také náklady na správu serverů?
Ing. Radek Šilhavý, Ph.D.: Většina vaší práce je složena z teroretické rešerše a téměř zde nejsou žádné příklady, případy užití a ukázkové aplikace. Myslíže, že by nebylo vhodné přídat praktické ukázky pro demonstraci navržených postůpů a technologií?