Název: Automatická detekce klíčových slov v textu
Další názvy: Automatic keyword detection
Autoři: Krajňák, Jan
Vedoucí práce/školitel: Sido Jakub, Ing.
Oponent: Pražák Ondřej, Ing.
Datum vydání: 2022
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/49552
Klíčová slova: automatická extrakce klíčových slov;tf-idf;textrank;yake;keybert;bert;čtk;semeval
Klíčová slova v dalším jazyce: automatic keyword extraction;tf-idf;textrank;yake;keybert;bert;čtk;semeval
Abstrakt: Tato práce se zabývá problematikou automatické extrakce klíčových slov z textu. Nejprve jsou analyzovány již existující přístupy k řešení problému. Některé z existujících přístupů byly vybrány a vyzkoušeny na anglické datové sadě, použité i při soutěži SemEval 2010. Stejné metody byly rovněž otestovány na zcela nové, nikdy netestované datové sadě získané při spolupráci s Českou tiskovou kanceláří. Jelikož tento nový korpus obsahuje dostatek označených dat, práce se v další části zabývá návrhem metody využívající přístup učení s učitelem založené na BERT modelech a následném porovnání s již existujícími metodami.
Abstrakt v dalším jazyce: This thesis deals with automatic keywords extraction from documents. First, it analyzes already existing approaches to solve the problem then tests some of the methods on a dataset from SemEval 2010 competition. Same methods are then tested on a completely new czech dataset which has been obtained with cooperation with ČTK. As this new corpus contains enough annotated documents, the work in the final part deals with a proposal of a supervised method based on BERT models and the subsequent comparisson with already existing methods.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
A19B0103P.pdfPlný text práce1,77 MBAdobe PDFZobrazit/otevřít
A19B0103P_hodnoceni.pdfPosudek vedoucího práce117,37 kBAdobe PDFZobrazit/otevřít
A19B0103P_posudek.pdfPosudek oponenta práce235,9 kBAdobe PDFZobrazit/otevřít
A19B0103P_obhajoba.pdfPrůběh obhajoby práce85,35 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/49552

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.