Název: | SharePoint Add-In pro vytěžování dat z dokumentů |
Další názvy: | Data Mining SharePoint Add-In |
Autoři: | Kutková, Veronika |
Vedoucí práce/školitel: | Wegschmied David, Ing. |
Oponent: | Kryl Martin, Ing. |
Datum vydání: | 2017 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/27140 |
Klíčová slova: | sharepoint;add-in;vytěžování dat;dolování dat;rozpoznávání znaků;ocr;účetní dokumenty;faktura;office 365;microsoft azure |
Klíčová slova v dalším jazyce: | sharepoint;add-in;data mining;optical character recognition;ocr;financial documents;invoice;office 365;microsoft azure |
Abstrakt: | Tato práce je zaměřena na návrh a vytvoření SharePoint add-inu zajišťujícího vytěžování dat z naskenovaných faktur. V rámci experimentu byl vyzkoušen a porovnán vzorek OCR nástrojů. Nejlepších výsledků z~bezplatných řešení dosáhl nástroj OnlineOCR.net. Vyzkoušeno bylo také několik metod vytěžování dat z faktur. Jako nejvhodnější se ukázala metoda založená na Locality-Sensitive Hashing. Tyto poznatky byly využity při návrhu a implementaci výsledného add-inu. Kompletní řešení je hostováno na cloudové platformě Microsoft Azure. Pro asynchronní zpracovávání požadavků na vytěžování dat bylo použito několik Azure komponent (fronta, webová úloha). Výsledkem je funkční add-in do SharePoint Online, jehož použití částečně automatizuje ruční přepis faktur do systému a minimalizuje vzniklé chyby. |
Abstrakt v dalším jazyce: | This thesis is focused on design and implementation of invoice data mining add-in for SharePoint. A couple of OCR tools were tested and compared, as~well as several invoice data mining methods. Experiments proved that OnliceOCR.net is the most precise free OCR tool. As for invoice data mining, Locality-Sensitive Hashing based method turned out to be the most suitable. Observed results were used to~design and implement the add-in. The complete solution is hosted on Microsoft Azure cloud platform. Few Azure components (storage queue, webjob) were used to process the data mining requests asynchonously. The outcome of this thesis is the add-in for SharePoint Online, partially automating the invoice transcription process and reducing data entry errors. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
DP_Kutkova.pdf | Plný text práce | 7,23 MB | Adobe PDF | Zobrazit/otevřít |
A14N0077Phodnoceni-ved.PDF | Posudek vedoucího práce | 835,99 kB | Adobe PDF | Zobrazit/otevřít |
A14N0077Pposudek-op.PDF | Posudek oponenta práce | 716,22 kB | Adobe PDF | Zobrazit/otevřít |
A14N0077Pobhajoba.PDF | Průběh obhajoby práce | 213,61 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/27140
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.