Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorJežek Karel, Prof. Ing. CSc.
dc.contributor.authorNaggy, Marek
dc.contributor.refereeNykl Michal, Ing. Ph.D.
dc.date.accepted2016-6-13
dc.date.accessioned2017-02-21T08:28:02Z-
dc.date.available2015-9-1
dc.date.available2017-02-21T08:28:02Z-
dc.date.issued2016
dc.date.submitted2016-5-12
dc.identifier66791
dc.identifier.urihttp://hdl.handle.net/11025/23674
dc.description.abstractPráce se zabývá zpracováním nestrukturovaných dokumentů a následným zpracováním extrahovaných dat. Největší pozornost je věnována extrakci jmen osob, ze kterých je následně vytvářena sociální (kriminální) síť. Dále je ukázán způsob, jakým tuto síť efektivně destabilizovat. V práci jsou ukázány možnosti detekce komunit, které se spolu často v textech vyskytují, prostorové a časové analýzy. Systém by mohl usnadnit práci např. investigativním reportérům nebo policii, která má k dispozici velké množství textových dokumentů. Jejich ruční zpracování, zejména pokud jsou hledána vodítka napříč několika dokumenty, může být obtížné. Jelikož tyto záznamy mohou obsahovat osobní údaje, je zde představen anonymizátor, který tyto údaje dokáže anonymizovat a následně deanonymizovat. Funkčnost systému byla ověřena na testovací sérii článků, které se věnují teroristickým útokům v Paříži a Bruselu.cs
dc.format83 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectzpracování nestrukturovaných dokumentůcs
dc.subjectsociální sítěcs
dc.subjectdestabilizace kriminální sítěcs
dc.subjectanonymizace osobních údajůcs
dc.subjectrozpoznávání pojmenovaných entitcs
dc.titleSystém pro extrakci informací z kriminalistických textůcs
dc.title.alternativeSystem for extracting information from criminalistic textsen
dc.typediplomová prácecs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programInženýrská informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThe aim of this diploma thesis is processing of unstructured documents and further data processing of extracted information. The main attention was devoted to extraction of personal names. From obtained personal names was created a social (criminal) network. An effective destabilization of this network is shown. Also the detection of communities, which occur frequently together is demonstrated and the example of spatial and the temporal analysis is presented. Our system could facilitate the work of investigative reporters or police, which has an available large set of unstructured documents. Manual processing of these documents may be difficult. Mainly, if they look for clues between multiple documents. However, these documents may contain some personal data. Therefore the anonymizator was created similarly as the deanonymizer. The function of this system is demonstrated. Used test data was created from articles on terrorist attacks in Paris and Brussels.en
dc.subject.translatedunstructured documents processingen
dc.subject.translatedsocial networksen
dc.subject.translatedcriminal network destabilizationen
dc.subject.translatedpersonal data anonymizationen
dc.subject.translatednamed entity recognitionen
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DIP-Marek-Naggy.pdfPlný text práce5,7 MBAdobe PDFZobrazit/otevřít
A13N0119Phodnoceni-ved.PDFPosudek vedoucího práce348,33 kBAdobe PDFZobrazit/otevřít
A13N0119Pposudek-op.PDFPosudek oponenta práce418,99 kBAdobe PDFZobrazit/otevřít
A13N0119Pobhajoba.PDFPrůběh obhajoby práce207,49 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23674

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.