Cílem práce je vytvořit nástroj, který umožní detekovat časové entity ve vyhledávacím dotazu. V teoretické části práce jsou základně probrány typy strojového
učení, následně možné způsoby využití strojového učení, které by mohly napomoci ke kvalitní detekci vybraných časových entit. Praktická část je nejprve
zaměřena na detailní popis zvoleného řešení, dále budou probrány podrobné aspekty řešení společně s implementačními detaily.
Cílem je implementovat detekci časových entit, která ke své činnosti využívá jazykový model neuronové sítě Electra, aby bylo docíleno přesnější detekce. V závěru práce jsou vyhodnoceny dosažené výsledky kvality detekce a možné návrhy na budoucí vývoj nástroje.
Anotace v angličtině
The aim of this master's thesis is to create tool that provides time entity detection in search engine query. In theoretical part are introduced machine learning terms and some machine learning methods which can improve quality of time entity detection. The empirical part of this work is focused on choosen solution and detailed description of this approach. The goal is implementation of time entity detection which is using language model of neural network Electra to enhance detection accuracy. In the final part of the thesis are introduced results of time entity detection quality and provides an overview of possible future improvements of this tool.
Machine learning, natural language processing, text classification, regular expression, time entity, python, Pytorch, Electra, C++
Rozsah průvodní práce
57
Jazyk
CZ
Anotace
Cílem práce je vytvořit nástroj, který umožní detekovat časové entity ve vyhledávacím dotazu. V teoretické části práce jsou základně probrány typy strojového
učení, následně možné způsoby využití strojového učení, které by mohly napomoci ke kvalitní detekci vybraných časových entit. Praktická část je nejprve
zaměřena na detailní popis zvoleného řešení, dále budou probrány podrobné aspekty řešení společně s implementačními detaily.
Cílem je implementovat detekci časových entit, která ke své činnosti využívá jazykový model neuronové sítě Electra, aby bylo docíleno přesnější detekce. V závěru práce jsou vyhodnoceny dosažené výsledky kvality detekce a možné návrhy na budoucí vývoj nástroje.
Anotace v angličtině
The aim of this master's thesis is to create tool that provides time entity detection in search engine query. In theoretical part are introduced machine learning terms and some machine learning methods which can improve quality of time entity detection. The empirical part of this work is focused on choosen solution and detailed description of this approach. The goal is implementation of time entity detection which is using language model of neural network Electra to enhance detection accuracy. In the final part of the thesis are introduced results of time entity detection quality and provides an overview of possible future improvements of this tool.
Machine learning, natural language processing, text classification, regular expression, time entity, python, Pytorch, Electra, C++
Zásady pro vypracování
Vypracujte literární rešerši na dané téma.
Popište aktuální stav detekce časových entit.
Zvolte vhodné řešení pro danou úlohu.
Prozkoumejte možnosti implementace algoritmu pro předzpracování dat.
Implementujte vybraný algoritmus pro detekci časových entit.
Proveďte testování, vhodnou interpretaci výsledků a závěr.
Zásady pro vypracování
Vypracujte literární rešerši na dané téma.
Popište aktuální stav detekce časových entit.
Zvolte vhodné řešení pro danou úlohu.
Prozkoumejte možnosti implementace algoritmu pro předzpracování dat.
Implementujte vybraný algoritmus pro detekci časových entit.
Proveďte testování, vhodnou interpretaci výsledků a závěr.
Seznam doporučené literatury
ALPAYDIN, Ethem. Introduction to machine learning. Third edition. Cambridge, Massachusetts: The MIT Press, [2014], 1 online zdroj (xxii, 613 pages). Adaptive computation and machine learning. ISBN 9780262325745. Dostupné také z: https://proxy.k.utb.cz/login?url=http://ieeexplore.ieee.org/servlet/opac?bknumber=6895440
GOODFELLOW, Ian, Yoshua BENGIO a Aaron COURVILLE. Deep learning. Cambridge, Massachussetts: The MIT Press, [2016], xxii, 775 s. Adaptive computation and machine learning. ISBN 9780262035613.
WITTEN, I. H., Eibe FRANK, Mark A. HALL a Christopher J. PAL. Data mining: practical machine learning tools and techniques. Fourth edition. Amsterdam: Elsevier, [2017], xxxii, 621 s. ISBN 9780128042915.
Data science & big data analytics: discovering, analyzing, visualizing and presenting data. Indianapolis: Wiley, [2015], xviii, 410 s. ISBN 9781118876138.
GRUS, Joel. Data science from scratch. Sebastopol: O'Reilly, 2015, xvi, 311 s. ISBN 9781491901427.
OJEDA, Tony, Sean Patrick MURPHY, Benjamin BENGFORT a Abhijit DASGUPTA. Practical data science cookbook: 89 hands-on recipes to help you complete real-world data science projects in R and Python. Birmingham: Packt Publishing, 2014, 380 s. ISBN 9781783980246.
MILES, Matthew B., A. M. HUBERMAN a Johnny SALDA\ ΝA. Qualitative data analysis: a methods sourcebook. Fourth edition. Los Angeles: SAGE, [2020], xxi, 380 s. ISBN 9781544371856.
DORSEY, Richard. Data analytics. [CreateSpace Independent Publishing Platform], [2017], 67 s. ISBN 9781547089291.
Seznam doporučené literatury
ALPAYDIN, Ethem. Introduction to machine learning. Third edition. Cambridge, Massachusetts: The MIT Press, [2014], 1 online zdroj (xxii, 613 pages). Adaptive computation and machine learning. ISBN 9780262325745. Dostupné také z: https://proxy.k.utb.cz/login?url=http://ieeexplore.ieee.org/servlet/opac?bknumber=6895440
GOODFELLOW, Ian, Yoshua BENGIO a Aaron COURVILLE. Deep learning. Cambridge, Massachussetts: The MIT Press, [2016], xxii, 775 s. Adaptive computation and machine learning. ISBN 9780262035613.
WITTEN, I. H., Eibe FRANK, Mark A. HALL a Christopher J. PAL. Data mining: practical machine learning tools and techniques. Fourth edition. Amsterdam: Elsevier, [2017], xxxii, 621 s. ISBN 9780128042915.
Data science & big data analytics: discovering, analyzing, visualizing and presenting data. Indianapolis: Wiley, [2015], xviii, 410 s. ISBN 9781118876138.
GRUS, Joel. Data science from scratch. Sebastopol: O'Reilly, 2015, xvi, 311 s. ISBN 9781491901427.
OJEDA, Tony, Sean Patrick MURPHY, Benjamin BENGFORT a Abhijit DASGUPTA. Practical data science cookbook: 89 hands-on recipes to help you complete real-world data science projects in R and Python. Birmingham: Packt Publishing, 2014, 380 s. ISBN 9781783980246.
MILES, Matthew B., A. M. HUBERMAN a Johnny SALDA\ ΝA. Qualitative data analysis: a methods sourcebook. Fourth edition. Los Angeles: SAGE, [2020], xxi, 380 s. ISBN 9781544371856.
DORSEY, Richard. Data analytics. [CreateSpace Independent Publishing Platform], [2017], 67 s. ISBN 9781547089291.
Přílohy volně vložené
-
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Student odprezentoval výsledky své diplomové práce. Byly přečtené posudky vedoucího a oponenta a student odpověděl dotazy z posudků.
Dotazy komise:
doktor Oulehla - ve vaší práci jste řešil správnost nebo pokrytí regulárního výrazu pro datum ?
Student odpověděl na doplňující dotazy komise, student splnil všechny body zadání. Z důvodu nižšího stránkového rozsahu práce a stanoveného rozsahu směrnicí SD/10/20 byla známka ponížena na stupeň B.