Skript 2015 – korpus rodilých mluvčích češtiny
- Modelový typ srovnávacího akvizičního korpusu písemných prací žáků na různých jazykových úrovních
- Současný stav:
- 2582 textů, 380 tis. tokenů; žáci ZŠ, ZŠP, ZŠS, SOŠ a gymnázií (včetně víceletých) ve věku 10–15 let
- Texty jsou vybaveny metadaty a faksimilii
- U textů byla provedena ruční transkripce včetně záznamu oprav pisatele a ruční anonymizace
- Texty byly ručně i automaticky anotovány a ručně revidovány, výsledky obsahují:
- ruční emendaci na více rovinách: pravopis a morfematika, morfosyntax, slovník
- automatickou morfologickou analýzu původního textu a všech oprav
- automatickou identifikaci typu pravopisné a morfématické chyby
- Po přihlášení uživatel může texty i anotace opravovat a doplňovat
- Využitelnost:
- Učitelé mohou korpus využívat při přípravě hodiny, pomocných učebních materiálů i při vlastní výuce
- Žáci mohou korpus využívat při samostatném studiu
- Aktuální využití a udržitelnost:
- V kurzech DV PP i v kurzech v pregraduální přípravě učitelů
- Při vývoji počítačových nástrojů ke zpracování textů nerodilých mluvčích češtiny nebo jiných textů odlišných od spisovné normy
Instrukce k přípravě korpusu
Přepis a anonymizace žákovských textů
Oprava žákovských textů