Premium

Získejte všechny články mimořádně
jen za 49 Kč/3 měsíce

Vzniká banka slov moderní češtiny. S bezzubou myší a bez kalamáře

  18:41
U slova "myš" si dnešní děti spíše než malého hlodavce představí zařízení k počítači, říká jazykovědec Karel Oliva. Pod jeho vedením finišuje sedmiletá práce na elektronické databázi slovní zásoby současné češtiny. Sleduje proměny významů slov a poslouží jako materiál pro velký výkladový slovník.

Výzkumný tým vede ředitel Ústavu pro jazyk český Akademie věd ČR Karel Oliva. | foto: iDNES.cz

V čem práce na databázi, kterou vytváří Ústav pro jazyk český Akademie věd, spočívá?
Díváme se, jak se vyvinul význam slov od dřívějších zpracování. Stará slova dostávají nové významy a objevují se i slova zcela nová, často přejímky z angličtiny a slova nově utvořená. Také sledujeme frekvenci výskytu, kdy si vezmeme spoustu textů v elektronické podobě a v těch stovkách milionů slov hledáme, kolikrát se tam určité slovo vyskytuje.

Když si vezmeme třeba slovo "stůl", jak bude vypadat heslo v databázi?
Bude obsahovat jeho význam, tedy že je to kus nábytku, a dále starší a přenesené významy. Bude tam také dlouhá řada dokladů, v jakých typických kontextech se dnes slovo používá, což byla největší práce na databázi. Naši předchůdci v době takříkajíc předpočítačové měli pro výrobu slovníků velmi málo dat a museli všechno dělat ručně. Dnes jsme se přehoupli do situace opačné, kdy je potřeba si z obrovského množství elektronických textů vyzobat taková slovní spojení, která přinášejí zajímavou informaci. Například "jednat u kulatého stolu" nebo "rozhodnout od zeleného stolu", ale ne třeba "dřevěný" nebo "skleněný stůl".

Plánovaný slovník

Hotová databáze se využije pro přípravu moderního výkladového slovníku češtiny, který vznikne v elektronické podobě.

Jeho pracovní název je Lexikon 21.

Zatím je k dispozici Příruční slovník jazyka českého (1935-1957), Slovník spisovného jazyka českého (1. vydání 1960-1971, 2. vydání 1989) a Slovník spisovné češtiny (1. vydání 1978, současná verze 2010).

Měla by databáze obsáhnout všechna česká slova?
Pokud možno ano, ale má to své hranice. Nesledujeme například argoty a všechny nesmysly, které si někdo vymyslí na chatu, to se snad ani sledovat nedá. Položky v databázi jsou ale spíš první skicou než hotovým slovníkovým heslem.

Kolik tedy bude mít databáze položek?
Naplánovali jsme si zhruba 120 tisíc, ale myslím, že to překročíme tak na 150 tisíc. Pak bude potřeba vytvořit koncepci, jak z databáze udělat slovníková hesla a vytvořit celý slovník. To bude složitější práce a úkol na léta.

Jak rychle se proměňují významy slov?
Jazyk je velmi živý organismus a mění se sám od sebe. Nová slova vznikají s novými pojmy, se starými pojmy slova zanikají. Stačí se podívat na slovo "počítač". Ještě ve Slovníku spisovného jazyka českého, který vycházel v 60. letech, znamená něco jako "účetní". Také se vyvinulo slovo "myš". Zatímco pro mě je primární význam pořád zvíře, dnešní děti už daleko více znají jinou myš.

Jedna početnější elektronická databáze už ale funguje...
Ano, v jiné, ale jen velmi jednoduché databázi máme zhruba 800 tisíc českých slov, ale tam jsou shromážděna slova od roku 1770 až do víceméně současné doby. Na některá můžete narazit třeba ve starých vydáních Boženy Němcové, ale jejich frekvence v dnešních textech - knihách, časopisech či novinách - je často nulová. Třeba slovo "kalamář" bychom hledali velmi těžko. V nové databázi zastoupeno nebude, protože chceme vytvořit slovník češtiny, kterou se dnes opravdu mluví. Dáváme na internet k dispozici i staré slovníky, takže když někdo bude hledat význam slova "kalamář", tak si ho najde.

Bude databáze přístupná i pro veřejnost?
To zatím není rozhodnuté. Práce se blíží ke konci a vedou se o tom velké debaty. Na jednu stranu to děláme za veřejné peníze, takže bychom to měli předvést. Lidé by měli mít přístup k tomu, jak čeština dnes vypadá. Pokud z toho ale chceme udělat slovník, tak bychom ještě měli na datech pracovat, protože to je jen polotovar. Když dáte nepoučeným laikům, a tím nechci nikoho urážet, do rukou nedodělané věci, může se udělat více škody než užitku. A naše snaha je češtině prospívat.

Kolik lidí se na projektu podílí?
Celkem asi třicet lidí, ale ne všichni mají plný úvazek. Jsou to především lexikografové z našeho ústavu, několik studentů, kteří vyhledávají nová slova, a počítačová podpora. Na elektronizaci spolupracujeme s Fakultou informatiky Masarykovy univerzity v Brně, kde působí jedno z nejlepších světových pracovišť v oblasti podpory tvorby slovníků.

Autor:

Eurovolby 2024

Volby do Evropského parlamentu se v Česku uskuteční v pátek 7. a v sobotu 8. června 2024. Čeští voliči budou vybírat 21 poslanců Evropského parlamentu. Voliči v celé Evropské unii budou rozhodovat o obsazení celkem 720 křesel

Historik: Metro mělo původně vést středem magistrály a jezdit přes mosty

  • Nejčtenější

Nahá umělkyně za zvuků techna házela před dětmi hlínou. Už to řeší policie

3. května 2024  10:10,  aktualizováno  13:43

Policie prošetřuje vystoupení, ke kterému došlo na Akademii výtvarných umění (AVU). Umělkyně a...

Stovky amerických obrněnců se v řádu dnů nepozorovaně přemístily do Česka

2. května 2024  17:21

Několik set vozidel americké armády včetně obrněnců Bradley nebo transportérů M113 se objevilo ve...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Přes Česko přešly bouřky s krupobitím. Dálnici D1 pokrylo bahno a větve

6. května 2024  15:47,  aktualizováno  7.5

Do Česka přišly přívalové deště, na některých místech padaly i kroupy. Hasiči hlásili desítky...

Německo je otřeseno. Přišel brutální útok na politika, pak následoval další

4. května 2024  17:40,  aktualizováno  21:09

Na lídra kandidátky německé sociální demokracie (SPD) v Sasku do evropských voleb Matthiase Eckeho...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Vyváděla strašné věci. Zahradil označil Jourovou za nejhorší z eurokomisařů

4. května 2024

Premium Když Česko vstoupilo 1. května do Evropské unie, byl tam matador ODS Jan Zahradil kooptován...

Izrael otevřel přechod Kerem Šalom, pomoc se k civilistům přesto nedostává

8. května 2024  9:48,  aktualizováno  21:28

Do Pásma Gazy ve středu přes klíčové hraniční přechody na jihu oblasti nepřicházela žádná...

USA pozastavily dodávky bomb Izraeli. Nechtějí krveprolití v Rafáhu

8. května 2024  10:51,  aktualizováno  20:49

Spojené státy odložily plánovanou dodávku munice Izraeli a kvůli jeho operacím v Rafáhu na jihu...

Plat 200 tisíc čistého, k tomu tučné náhrady. Co čeká na nové europoslance

8. května 2024

Premium Poslední měsíc zbývá do voleb do Evropského parlamentu. A českých 675 kandidátů, kteří usilují o...

Monopol skončil. Čínské satelity obsazují orbitu, znepokojují Pentagon

8. května 2024

Čína buduje svou „flotilu“ satelitů v takovém tempu, že Spojené státy ztrácejí svou dominanci ve...

Večerní parťák na koupací rituál: Vyhrajte balíček od sebamed Baby
Večerní parťák na koupací rituál: Vyhrajte balíček od sebamed Baby

Přebalit, vykoupat, umýt hlavu, pořádně promazat celé tělíčko... Skvělým parťákem pro takový večerní rituál je sebamed Baby. Sháníte-li jednoho...

V 59 letech zemřela herečka Simona Postlerová, ještě v sobotu zkoušela

Zemřela divadelní a filmová herečka Simona Postlerová, bylo jí 59 let. Zprávu o úmrtí potvrdil nadační fond Dvojka...

Dara Rolins je po další plastice. Kritiku fanoušků nechápe, cítí se svěží

Zpěvačka Dara Rolins (51) se na čas stáhla z veřejného života. V tom období prodělala „estetický zákrok“ a na sociální...

Titěrné sukně i míčky na podpatcích. Zendaya vzkřísila trend tenniscore

S nadsázkou bychom mohli říct, že největší tenisovou událostí tohoto roku je premiéra snímku Rivalové. Aspoň co se módy...

Zpěvačka Tereza Kerndlová měla autonehodu. Poslala vzkaz ze záchranky

Tereza Kerndlová (37) a její manžel René Mayer (53) měli v úterý ráno autonehodu. Na mokré vozovce do nich zezadu...

První světová válka zničila část Francie natolik, že tu stále řádí smrt

Řídkým rozvolněným lesem pokrytá pahorkatina u francouzského Soissons, Compiégne, Lens či Cambrai přirozeně svádí k...