Název: | Systém pro extrakci informací z kriminalistických textů |
Další názvy: | System for extracting information from criminalistic texts |
Autoři: | Naggy, Marek |
Vedoucí práce/školitel: | Ježek Karel, Prof. Ing. CSc. |
Oponent: | Nykl Michal, Ing. Ph.D. |
Datum vydání: | 2016 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/23674 |
Klíčová slova: | zpracování nestrukturovaných dokumentů;sociální sítě;destabilizace kriminální sítě;anonymizace osobních údajů;rozpoznávání pojmenovaných entit |
Klíčová slova v dalším jazyce: | unstructured documents processing;social networks;criminal network destabilization;personal data anonymization;named entity recognition |
Abstrakt: | Práce se zabývá zpracováním nestrukturovaných dokumentů a následným zpracováním extrahovaných dat. Největší pozornost je věnována extrakci jmen osob, ze kterých je následně vytvářena sociální (kriminální) síť. Dále je ukázán způsob, jakým tuto síť efektivně destabilizovat. V práci jsou ukázány možnosti detekce komunit, které se spolu často v textech vyskytují, prostorové a časové analýzy. Systém by mohl usnadnit práci např. investigativním reportérům nebo policii, která má k dispozici velké množství textových dokumentů. Jejich ruční zpracování, zejména pokud jsou hledána vodítka napříč několika dokumenty, může být obtížné. Jelikož tyto záznamy mohou obsahovat osobní údaje, je zde představen anonymizátor, který tyto údaje dokáže anonymizovat a následně deanonymizovat. Funkčnost systému byla ověřena na testovací sérii článků, které se věnují teroristickým útokům v Paříži a Bruselu. |
Abstrakt v dalším jazyce: | The aim of this diploma thesis is processing of unstructured documents and further data processing of extracted information. The main attention was devoted to extraction of personal names. From obtained personal names was created a social (criminal) network. An effective destabilization of this network is shown. Also the detection of communities, which occur frequently together is demonstrated and the example of spatial and the temporal analysis is presented. Our system could facilitate the work of investigative reporters or police, which has an available large set of unstructured documents. Manual processing of these documents may be difficult. Mainly, if they look for clues between multiple documents. However, these documents may contain some personal data. Therefore the anonymizator was created similarly as the deanonymizer. The function of this system is demonstrated. Used test data was created from articles on terrorist attacks in Paris and Brussels. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
DIP-Marek-Naggy.pdf | Plný text práce | 5,7 MB | Adobe PDF | Zobrazit/otevřít |
A13N0119Phodnoceni-ved.PDF | Posudek vedoucího práce | 348,33 kB | Adobe PDF | Zobrazit/otevřít |
A13N0119Pposudek-op.PDF | Posudek oponenta práce | 418,99 kB | Adobe PDF | Zobrazit/otevřít |
A13N0119Pobhajoba.PDF | Průběh obhajoby práce | 207,49 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/23674
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.