Title: Tvorba datových zdrojů pro bibliometrická měření
Other Titles: Creation of Data Sources for Bibliometric Analysis
Authors: Baratta, Štěpán
Advisor: Fiala Dalibor, Doc. Ing. Ph.D.
Referee: Dostal Martin, Ing. Ph.D.
Issue Date: 2019
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/37416
Keywords: bibliografie;nosql;databáze;api
Keywords in different language: bibliography;nosql;database;api
Abstract: Cílem této práce je vytvoření rozsáhlého úložište obsahujícího data z různých datových zdrojů, které se zabývají sběrem publikačních a patentových bibliografických dat. Součástí práce je také umožnění přístupu k této vytvořené databázi pomocí aplikačního rozhraní, které poskytuje metody pro dotazování. Ve výsledném řešení byla použita nerelační databáze MongoDB a pro komunikaci s ní byl použit programovací jazyk Java. Podařilo se shromáždit přes 200 milionů záznamů ze 4 datových zdrojů, zejména z publikační databáze Microsoft Academic Graph. Z amerického patentového úřadu United States Patent and Trademark Office bylo získáno přes 3 miliony záznamů. Další část práce se zabývala vytvořením aplikace pro administraci datových zdrojů, která také umožnuje předzpracovávání dat a jejich nahrávání do databáze MongoDB. Jako nadstavba byla vytvořena webová aplikace, demonstrující fungování aplikačního rozhraní, umožnující jednoduché vizualizace výsledků. Jako součást měření byla provedena analýza hlavních datových zdrojů.
Abstract in different language: The main purpose of this thesis is to create a large repository concentrating data from various publicly available databases which store bibliographic information related to intellectual property rights. One part of this work focuses on enabling access to the created repository using an application interface, providing methods for querying. In the final solution, non-relational database MongoDB was used and Java programming language was used for communication with the database. Over 200 millions of records were acquired from multiple data sources, mainly from publication database Microsoft Academic Graph. Over 3 millions of records were acquired from the United States Patent and Trademark Office. Another part of this work focused on creating an application for administering the data sources. It also enables for data preprocessing and loading data to the MongoDB database. An additional web application was created to demonstrate the functioning of the application interface, enabling for simple visualization of the results. An analysis of the main data sources was created.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
thesis.pdfPlný text práce4,43 MBAdobe PDFView/Open
A17N0061Pposudek-op.PDFPosudek oponenta práce348,54 kBAdobe PDFView/Open
A17N0061Phodnoceni-ved.PDFPosudek vedoucího práce473,02 kBAdobe PDFView/Open
A17N0061Pobhajoba.PDFPrůběh obhajoby práce195,47 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/37416

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.