Bakalářská práce je rozdělená na teoretickou a praktickou část. V teoretické části se nachází vypracována obecná literární rešerše na téma Big Data, podávající základní přehled o tomto oboru, identifikaci oblastí, kde se tento přístup prakticky uplatňuje, včetně obecného popisu, jakým způsobem. Dále zahrnuje proces zpracovávání dat, včetně vyjmenování užívaných souborových systémů, databázových systémů, programovacích modelů a analytických metod. Praktická část podává porovnání současného stavu cloud computingových služeb od
firmy Amazon, Google a Microsoft a v poslední části je představena současná verze technologie
Apache Hadoop, jeho implementace a provedení benchmarkového testu TeraSort.
Anotace v angličtině
The bachelor thesis is divided into theoretical and practical part. The theoretical part consists of literature research on the topic of Big Data, providing general overview of the field and identifying areas this approach is practiced, including description of its practised ways. It further includes the process of data processing, as well as enumeration of file systems, database systems, programming models and analytical methods. The practical part include comparison of cloud computing services developer by Amazon, Google and Microsoft companies and in the last part is presented the current version of Apache Hadoop technology, its implementation and performance of the benchmark test TeraSort.
Klíčová slova
Big Data, Big Datová Analytika, DFS, NoSQL, Programovací modely, Apache Hadoop, Cloud Computing, AWS, Google Cloud Platform, Microsoft Azure, MapReduce, Terasort
Klíčová slova v angličtině
Big Data, Big Data Analytics, DFS, NoSQL, Programming models, Apache
Hadoop, Cloud Computing, AWS, Google Cloud Platform, Microsoft Azure, MapReduce,
Terasort
Rozsah průvodní práce
69 s. (100 309)
Jazyk
CZ
Anotace
Bakalářská práce je rozdělená na teoretickou a praktickou část. V teoretické části se nachází vypracována obecná literární rešerše na téma Big Data, podávající základní přehled o tomto oboru, identifikaci oblastí, kde se tento přístup prakticky uplatňuje, včetně obecného popisu, jakým způsobem. Dále zahrnuje proces zpracovávání dat, včetně vyjmenování užívaných souborových systémů, databázových systémů, programovacích modelů a analytických metod. Praktická část podává porovnání současného stavu cloud computingových služeb od
firmy Amazon, Google a Microsoft a v poslední části je představena současná verze technologie
Apache Hadoop, jeho implementace a provedení benchmarkového testu TeraSort.
Anotace v angličtině
The bachelor thesis is divided into theoretical and practical part. The theoretical part consists of literature research on the topic of Big Data, providing general overview of the field and identifying areas this approach is practiced, including description of its practised ways. It further includes the process of data processing, as well as enumeration of file systems, database systems, programming models and analytical methods. The practical part include comparison of cloud computing services developer by Amazon, Google and Microsoft companies and in the last part is presented the current version of Apache Hadoop technology, its implementation and performance of the benchmark test TeraSort.
Klíčová slova
Big Data, Big Datová Analytika, DFS, NoSQL, Programovací modely, Apache Hadoop, Cloud Computing, AWS, Google Cloud Platform, Microsoft Azure, MapReduce, Terasort
Klíčová slova v angličtině
Big Data, Big Data Analytics, DFS, NoSQL, Programming models, Apache
Hadoop, Cloud Computing, AWS, Google Cloud Platform, Microsoft Azure, MapReduce,
Terasort
Zásady pro vypracování
Vypracujte obecnou literární rešerši na dané téma.
Proveďte analýzu, popis a identifikaci oblastí, kde se velká data prakticky využívají.
Proveďte analýzu a popis aktuálního stavu problematiky technologií zpracování a analýzy velkých dat, včetně souborových systémů inteligentních řešení.
Proveďte analýzu použití dostupných technologií od Google, Apache, Microsoft, atd.
Proveďte popis, včetně praktických příkladů technologie MapReduce pro práci s velkými daty.
Zásady pro vypracování
Vypracujte obecnou literární rešerši na dané téma.
Proveďte analýzu, popis a identifikaci oblastí, kde se velká data prakticky využívají.
Proveďte analýzu a popis aktuálního stavu problematiky technologií zpracování a analýzy velkých dat, včetně souborových systémů inteligentních řešení.
Proveďte analýzu použití dostupných technologií od Google, Apache, Microsoft, atd.
Proveďte popis, včetně praktických příkladů technologie MapReduce pro práci s velkými daty.
Seznam doporučené literatury
Data science \& big data analytics: discovering, analyzing, visualizing and presenting data. Indianapolis: Wiley, 2015, xviii, 410 stran. ISBN 978-1-118-87613-8.
HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. První vydání. Praha: Grada, 2015, 281 stran. ISBN 978-80-247-5466-6.
MARZ, Nathan a James WARREN. Big data: principles and best practices of scalable real-time data systems. Shelter Island: Manning, 2015, xx, 308 stran. ISBN 978-1-617290-34-3.
LABERGE, Robert. Datové sklady: agilní metody a business intelligence. 1. vyd. Brno: Computer Press, 2012, 350 s. ISBN 978-80-251-3729-1.
MAYER-SCHÖNBERGER, Viktor a Kenneth CUKIER. Big Data: revoluce, která změní způsob, jak žijeme, pracujeme a myslíme. 1. vyd. Brno: Computer Press, 2014, 256 s. ISBN 978-80-251-4119-9.
EAGLE, Nathan a Kate GREENE. Reality mining: using big data to engineer a better world. Cambridge, Massachusetts: The MIT Press, 2014, 1 online zdroj (vi, 199 pages). ISBN 9780262324564.
Seznam doporučené literatury
Data science \& big data analytics: discovering, analyzing, visualizing and presenting data. Indianapolis: Wiley, 2015, xviii, 410 stran. ISBN 978-1-118-87613-8.
HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. První vydání. Praha: Grada, 2015, 281 stran. ISBN 978-80-247-5466-6.
MARZ, Nathan a James WARREN. Big data: principles and best practices of scalable real-time data systems. Shelter Island: Manning, 2015, xx, 308 stran. ISBN 978-1-617290-34-3.
LABERGE, Robert. Datové sklady: agilní metody a business intelligence. 1. vyd. Brno: Computer Press, 2012, 350 s. ISBN 978-80-251-3729-1.
MAYER-SCHÖNBERGER, Viktor a Kenneth CUKIER. Big Data: revoluce, která změní způsob, jak žijeme, pracujeme a myslíme. 1. vyd. Brno: Computer Press, 2014, 256 s. ISBN 978-80-251-4119-9.
EAGLE, Nathan a Kate GREENE. Reality mining: using big data to engineer a better world. Cambridge, Massachusetts: The MIT Press, 2014, 1 online zdroj (vi, 199 pages). ISBN 9780262324564.
Přílohy volně vložené
1 CD ROM
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Diplomant prezentoval před komisí hlavní cíle a výsledky své bakalářské práce.
Prezentace působila vyváženě, student dokázal vystihnout podstatné body práce.
Následně byl student seznámen s posudky vedoucího a oponenta bakalářské práce.
Komise vznesla k obhajobě následující dotazy:
1) Prof. Farana: S kolika různými metodami vícekriteriální analýzy jste se setkal?
2) Prof. Farana: V jaké škále jste hodnotil výsledky?
3) Doc. Hruška: Jak byste charakterizoval rozdíl mezi Big Data a standardními systémy pro správu dat?
4) Doc. Hruška: Je v této oblasti důležitá bezpečnost dat?
5) Prof. Bíla: Jak byste definoval Big Data?
Diplomant dotazy zodpověděl.