Tvorba datových zdrojů pro bibliometrická měření

Baratta, Štěpán

Title:	Tvorba datových zdrojů pro bibliometrická měření
Other Titles:	Creation of Data Sources for Bibliometric Analysis
Authors:	Baratta, Štěpán
Advisor:	Fiala Dalibor, Doc. Ing. Ph.D.
Referee:	Dostal Martin, Ing. Ph.D.
Issue Date:	2019
Publisher:	Západočeská univerzita v Plzni
Document type:	diplomová práce
URI:	http://hdl.handle.net/11025/37416
Keywords:	bibliografie;nosql;databáze;api
Keywords in different language:	bibliography;nosql;database;api
Abstract:	Cílem této práce je vytvoření rozsáhlého úložište obsahujícího data z různých datových zdrojů, které se zabývají sběrem publikačních a patentových bibliografických dat. Součástí práce je také umožnění přístupu k této vytvořené databázi pomocí aplikačního rozhraní, které poskytuje metody pro dotazování. Ve výsledném řešení byla použita nerelační databáze MongoDB a pro komunikaci s ní byl použit programovací jazyk Java. Podařilo se shromáždit přes 200 milionů záznamů ze 4 datových zdrojů, zejména z publikační databáze Microsoft Academic Graph. Z amerického patentového úřadu United States Patent and Trademark Office bylo získáno přes 3 miliony záznamů. Další část práce se zabývala vytvořením aplikace pro administraci datových zdrojů, která také umožnuje předzpracovávání dat a jejich nahrávání do databáze MongoDB. Jako nadstavba byla vytvořena webová aplikace, demonstrující fungování aplikačního rozhraní, umožnující jednoduché vizualizace výsledků. Jako součást měření byla provedena analýza hlavních datových zdrojů.
Abstract in different language:	The main purpose of this thesis is to create a large repository concentrating data from various publicly available databases which store bibliographic information related to intellectual property rights. One part of this work focuses on enabling access to the created repository using an application interface, providing methods for querying. In the final solution, non-relational database MongoDB was used and Java programming language was used for communication with the database. Over 200 millions of records were acquired from multiple data sources, mainly from publication database Microsoft Academic Graph. Over 3 millions of records were acquired from the United States Patent and Trademark Office. Another part of this work focused on creating an application for administering the data sources. It also enables for data preprocessing and loading data to the MongoDB database. An additional web application was created to demonstrate the functioning of the application interface, enabling for simple visualization of the results. An analysis of the main data sources was created.
Rights:	Plný text práce je přístupný bez omezení.
Appears in Collections:	Diplomové práce / Theses (KIV)

Files in This Item:

File	Description	Size	Format
thesis.pdf	Plný text práce	4,43 MB	Adobe PDF	View/Open
A17N0061Pposudek-op.PDF	Posudek oponenta práce	348,54 kB	Adobe PDF	View/Open
A17N0061Phodnoceni-ved.PDF	Posudek vedoucího práce	473,02 kB	Adobe PDF	View/Open
A17N0061Pobhajoba.PDF	Průběh obhajoby práce	195,47 kB	Adobe PDF	View/Open

Show full item record

Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/37416

search

navigation