Český text pod kontrolou — pět nástrojů, jeden web
Všechno, co s českým textem potřebujete, na jednom místě: anonymizace osobních údajů, rozpoznávání entit, morfologie, oprava pravopisu a překlad. Zdarma, bez instalace a bez registrace — běží přímo ve vašem prohlížeči. Postaveno na špičkových akademických nástrojích od ÚFAL MFF UK.
Vložíte text do AI — a ona si ho nechá.
Jazykové modely se z vašich vstupů učí a citlivé údaje můžou skončit tam, kde nemají. Projeďte text anonymizérem dřív, než ho komukoliv předáte — jména, rodná čísla i adresy zmizí. V lokálním režimu text dokonce vůbec neopustí váš počítač. Co se k AI nedostane, to se nedá zneužít.
Komu ušetří práci
Kdokoliv pracuje s českým textem a potřebuje ho zbavit citlivých údajů, zpracovat nebo přeložit — bez drahého softwaru a instalace.
Právníci a advokáti
Anonymizujte spisy a smlouvy dřív, než je pošlete do AI nebo komukoliv předáte. Soulad s GDPR během chvíle.
Lékaři a zdravotníci
Odstraňte z lékařských zpráv jména a rodná čísla pacientů, než s textem dál pracujete.
Úředníci a státní správa
Připravte dokumenty ke zveřejnění — citlivé údaje nahradíte zástupnými značkami jako OSOBA1.
Novináři a redaktoři
Chraňte zdroje, opravte pravopis a doplňte diakritiku, přeložte podklady z cizích jazyků.
Učitelé a studenti
Morfologická analýza, oprava diakritiky a překlad pro výuku i studium jazyka.
Vývojáři a datoví analytici
Rozpoznávání entit a anonymizace dat rovnou v prohlížeči — bez instalace MCP serveru.
Hotovo ve třech krocích
Žádné účty ani konfigurace. Otevřete web a můžete pracovat.
Vyberte nástroj
Pět nástrojů na jednom místě. Klikněte na záložku podle toho, co zrovna potřebujete.
Vložte text nebo soubor
Napište text, vložte ho ze schránky, nebo nahrajte PDF, DOCX či TXT. Limit je 20 000 znaků.
Výsledek máte hned
Zpracování proběhne přes akademické API ÚFAL. Žádný vlastní server, nic se neukládá.
Co všechno umí
Vyberte nástroj a pusťte se do práce. U každého najdete krátké vysvětlení, k čemu slouží.
Anonymizace Vlajková loď
Skryje v textu jména, rodná čísla, adresy, telefony, IČO i e-maily a nahradí je značkami jako OSOBA1. Dva režimy: plně offline (regex), nebo přesný NER od ÚFAL. 19 typů údajů, živé zvýraznění a tabulka náhrad.
⚙️ regex offline + MasKIT / NameTag Otevřít anonymizér →Entity (NER)
Najde v textu jména osob, firmy, místa, instituce a data a roztřídí je do kategorií. Hodí se na extrakci dat z dokumentů, indexaci a přípravu textu k další analýze.
⚙️ NameTag 3 · 35 jazyků Otevřít nástroj →Morfologie
U každého slova určí základní tvar (lemma), slovní druh a mluvnické kategorie — pád, rod, číslo, čas. Pro jazykovou analýzu, chytré vyhledávání a výuku češtiny.
⚙️ UDPipe 2 Otevřít nástroj →Pravopis
Opraví překlepy a doplní chybějící diakritiku — háčky a čárky. Ideální na texty psané bez diakritiky (SMS, chat) nebo s překlepy.
⚙️ Korektor ÚFAL Otevřít nástroj →Překlad
Přeloží běžný i odborný text mezi sedmi jazyky. Pro češtinu a angličtinu používá CUBBITT — kvalitou srovnatelný s profesionálním překladem.
⚙️ CUBBITT · 7 jazyků Otevřít nástroj →Čitelnost
Vyhodnotí, jak je text srozumitelný, a navrhne, kde ho zjednodušit. Nástroj PONK zatím nelze volat z prohlížeče — připravujeme.
⚙️ PONK ÚFAL PřipravujemeČasté otázky
Co je Czech NLP Toolkit?
Bezplatná webová sada českých NLP nástrojů v jednom místě: anonymizace osobních údajů, rozpoznávání entit (NER), morfologická analýza, oprava pravopisu a strojový překlad. Vše běží přímo v prohlížeči a využívá akademické API ÚFAL MFF UK.
Je Czech NLP Toolkit zdarma?
Ano, je zdarma pro nekomerční použití. Staví na otevřených nástrojích od ÚFAL MFF UK — NameTag, UDPipe, Korektor a Charles Translator (CUBBITT).
Posílají se moje texty někam?
Nástroj nemá vlastní server a nic neukládá. Texty se posílají přímo z vašeho prohlížeče na akademické API ÚFAL (LINDAT) ke zpracování. Anonymizér navíc nabízí plně offline lokální mód, kde text neopustí váš počítač.
Jak anonymizovat český text pro GDPR?
V nástroji Anonymizace vložte text a citlivé údaje (jména, rodná čísla, adresy, telefony, IČO, e-maily) se nahradí placeholdery jako OSOBA1 nebo MESTO1. K dispozici je offline regex mód i přesnější mód s reálným NER od ÚFAL.
Jaké jazyky umí překladač?
Překlad mezi češtinou, angličtinou, němčinou, francouzštinou, polštinou, ruštinou a ukrajinštinou. Pro češtinu↔angličtinu používá CUBBITT, jeden z nejkvalitnějších dostupných překladačů.