Externí data jsou často uložena jako přílohy nebo obsah souborů typu PDF. Pokud potřebujeme tato data převést do formátu Excel, musíme použít některý z nástrojů pro optické rozlišování textu (OCR).
Pro načítání dat z PDF souborů nebo dokonce i z obrázkových souborů (JPG, PNG…) máme nyní k dispozici zabudované OCR možnosti v dostupných jazykových modelech umělé inteligence (AI).
Postup je intuitivní a v případě běžncý tabulek vede k úspěšnému přavodu ve velmi rychlém čase.
Postup si ukážeme pro převod vložené tabulky v souboru PDF do sešitu Excelu pomocí free verze jazykového modelu ChatGPT společnosti OpenAI, který je volně k dispozici jako webová služba.
POSTUP
- stáhneme si soubor PDF do svého počítače
2. na adrese https://chatgpt.com/ otevřeme dialogové okno pro práci s jazykovým modelem
3. pomocí tlačítka s ikonou záložky vložíme PDF soubor a zapíšeme do vstupního pole náš požadavek na převod tabulky. Upřesníme i polohu tabulky v dokumentu.
4) ChatGPT převede tabulku podle našeho zadání a uloží ji do samostatného souboru