Title: Automatické zodpovídání dotazů založené na sumarizaci textů
Other Titles: Automated Question Answering Based on a Text Summarization
Authors: Saleh Salem, Tárik
Advisor: Ježek, Karel
Referee: Krčmář, Lubomír
Issue Date: 2012
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/3039
Keywords: sumarizace textů;multidokumentová sumarizace;latentní sémantická analýza;zpracování přirozeného jazyka;filtrování nežádoucího textu z webových stránek;internet;vyhledávání;internetový vyhledávač;Java
Keywords in different language: text summarization;multidocument summarization;latent semantic analysis;natural language processing;boilerplate removal;internet;search;search engine;Java
Abstract: Úkolem této diplomové práce bylo vytvořit internetový vyhledávač založený na automatické dotazové multidokumentové sumarizaci textů. Práce tento cíl splňuje a výsledkem je webová aplikace ASI využívající latentní sémantickou analýzu pro sumarizaci textů z webových stránek. Aplikace ASI dokáže sumarizaci webových stránek psaných v češtině a angličtině a dovoluje snadné rozšíření o další algoritmy pro vyhledávání. Práce také seznamuje s oblastmi sumarizace textů, internetového vyhledávání, filtrace textů z webových stránek a zpracování přirozeného jazyka, které všechny hrajou důležitou roli.
Abstract in different language: The objective of this diploma thesis was to develop a search engine based on automatic query-based multidocument summarization of texts. The thesis meets this objective and the result of the work is the ASI web application using a latent semantic analysis for summarization of texts from web pages. The ASI application is able to perform summarization of web pages in Czech and English and allows extension of the application by other searching algorithms. Further, the work deals with the text summarization, internet searching, filtration of text from web pages (boilerplate removal) and natural language processing, which play an important role in this work.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
DP_TarikSalehSalem_2012.pdfPlný text práce1,91 MBAdobe PDFView/Open
A09N0102Pposudek-ved.pdfPosudek vedoucího práce261,22 kBAdobe PDFView/Open
A09N0102Pposudek-op.pdfPosudek oponenta práce318,58 kBAdobe PDFView/Open
A09N0102Pprubeh.pdfPrůběh obhajoby práce195,62 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/3039

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.