Název: Systém pro extrakci informací z kriminalistických textů
Další názvy: System for extracting information from criminalistic texts
Autoři: Naggy, Marek
Vedoucí práce/školitel: Ježek Karel, Prof. Ing. CSc.
Oponent: Nykl Michal, Ing. Ph.D.
Datum vydání: 2016
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/23674
Klíčová slova: zpracování nestrukturovaných dokumentů;sociální sítě;destabilizace kriminální sítě;anonymizace osobních údajů;rozpoznávání pojmenovaných entit
Klíčová slova v dalším jazyce: unstructured documents processing;social networks;criminal network destabilization;personal data anonymization;named entity recognition
Abstrakt: Práce se zabývá zpracováním nestrukturovaných dokumentů a následným zpracováním extrahovaných dat. Největší pozornost je věnována extrakci jmen osob, ze kterých je následně vytvářena sociální (kriminální) síť. Dále je ukázán způsob, jakým tuto síť efektivně destabilizovat. V práci jsou ukázány možnosti detekce komunit, které se spolu často v textech vyskytují, prostorové a časové analýzy. Systém by mohl usnadnit práci např. investigativním reportérům nebo policii, která má k dispozici velké množství textových dokumentů. Jejich ruční zpracování, zejména pokud jsou hledána vodítka napříč několika dokumenty, může být obtížné. Jelikož tyto záznamy mohou obsahovat osobní údaje, je zde představen anonymizátor, který tyto údaje dokáže anonymizovat a následně deanonymizovat. Funkčnost systému byla ověřena na testovací sérii článků, které se věnují teroristickým útokům v Paříži a Bruselu.
Abstrakt v dalším jazyce: The aim of this diploma thesis is processing of unstructured documents and further data processing of extracted information. The main attention was devoted to extraction of personal names. From obtained personal names was created a social (criminal) network. An effective destabilization of this network is shown. Also the detection of communities, which occur frequently together is demonstrated and the example of spatial and the temporal analysis is presented. Our system could facilitate the work of investigative reporters or police, which has an available large set of unstructured documents. Manual processing of these documents may be difficult. Mainly, if they look for clues between multiple documents. However, these documents may contain some personal data. Therefore the anonymizator was created similarly as the deanonymizer. The function of this system is demonstrated. Used test data was created from articles on terrorist attacks in Paris and Brussels.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DIP-Marek-Naggy.pdfPlný text práce5,7 MBAdobe PDFZobrazit/otevřít
A13N0119Phodnoceni-ved.PDFPosudek vedoucího práce348,33 kBAdobe PDFZobrazit/otevřít
A13N0119Pposudek-op.PDFPosudek oponenta práce418,99 kBAdobe PDFZobrazit/otevřít
A13N0119Pobhajoba.PDFPrůběh obhajoby práce207,49 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23674

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.