Title: Systém pro extrakci informací z kriminalistických textů
Other Titles: System for extracting information from criminalistic texts
Authors: Naggy, Marek
Advisor: Ježek Karel, Prof. Ing. CSc.
Referee: Nykl Michal, Ing. Ph.D.
Issue Date: 2016
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/23674
Keywords: zpracování nestrukturovaných dokumentů;sociální sítě;destabilizace kriminální sítě;anonymizace osobních údajů;rozpoznávání pojmenovaných entit
Keywords in different language: unstructured documents processing;social networks;criminal network destabilization;personal data anonymization;named entity recognition
Abstract: Práce se zabývá zpracováním nestrukturovaných dokumentů a následným zpracováním extrahovaných dat. Největší pozornost je věnována extrakci jmen osob, ze kterých je následně vytvářena sociální (kriminální) síť. Dále je ukázán způsob, jakým tuto síť efektivně destabilizovat. V práci jsou ukázány možnosti detekce komunit, které se spolu často v textech vyskytují, prostorové a časové analýzy. Systém by mohl usnadnit práci např. investigativním reportérům nebo policii, která má k dispozici velké množství textových dokumentů. Jejich ruční zpracování, zejména pokud jsou hledána vodítka napříč několika dokumenty, může být obtížné. Jelikož tyto záznamy mohou obsahovat osobní údaje, je zde představen anonymizátor, který tyto údaje dokáže anonymizovat a následně deanonymizovat. Funkčnost systému byla ověřena na testovací sérii článků, které se věnují teroristickým útokům v Paříži a Bruselu.
Abstract in different language: The aim of this diploma thesis is processing of unstructured documents and further data processing of extracted information. The main attention was devoted to extraction of personal names. From obtained personal names was created a social (criminal) network. An effective destabilization of this network is shown. Also the detection of communities, which occur frequently together is demonstrated and the example of spatial and the temporal analysis is presented. Our system could facilitate the work of investigative reporters or police, which has an available large set of unstructured documents. Manual processing of these documents may be difficult. Mainly, if they look for clues between multiple documents. However, these documents may contain some personal data. Therefore the anonymizator was created similarly as the deanonymizer. The function of this system is demonstrated. Used test data was created from articles on terrorist attacks in Paris and Brussels.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
DIP-Marek-Naggy.pdfPlný text práce5,7 MBAdobe PDFView/Open
A13N0119Phodnoceni-ved.PDFPosudek vedoucího práce348,33 kBAdobe PDFView/Open
A13N0119Pposudek-op.PDFPosudek oponenta práce418,99 kBAdobe PDFView/Open
A13N0119Pobhajoba.PDFPrůběh obhajoby práce207,49 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/23674

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.