Sprememba iskanja po Evrokorpusu

Preprosto iskanje

Na kratko: če iščete izraze, ki so sestavljeni iz več besed, dajte iskani niz med narekovaje (npr.: "European Union", "apple juice", "in the future" ipd.).
Podrobnejša pojasnila
Da bi povečali hitrost iskanja, smo sredi februarja 2012 podatke v Evrokorpusu uredili nekoliko drugače in s tem se je spremenil tudi način iskanja (iskanje po Evrotermu se ni spremenilo). Poenostavljeno povedamo: v Evrokorpusu iščemo podobno kot z iskalnikom Google.
Iskanje ene besede
Ko vpišemo iskano besedo, jo program poišče v izbranem korpusu. Nadomestni znak * lahko uporabimo na koncu besede, da poiščemo besedne oblike z različnimi končnicami (npr. vpišemo financ*, pa dobimo med zadetki (v EN-SL korpusu) naslednje besede: finance, financed, financial, financially, financing in morda še kaj).

Če znak * uporabimo na začetku besede, dobimo enako število zadetkov, kot če zvezdice ne napišemo (torej je v začetku besede ni smiselno uporabljati). Če znak * napišemo sredi besede, bo program iskal dve besedi: tisto, ki je levo od zvezdice, in tisto, ki je desno od nje (torej zvezdice tudi v takem primeru ni smiselno uporabljati).

Zvezdico je smiselno uporabljati samo na koncu iskanega izraza, če napišemo začetni del besede in želimo videti vse njene možne oblike.

Beseda z vezajem se obravnava kot dve besedi, zato je treba tako besedo dati med narekovaja, npr. "self-employed".

Znakov %, _, . in ? ne uporabljajte, ker nimajo več funkcije nadomestnih znakov.

Zelo pogostih besed (npr. off, one, the) ni možno iskati in v tem primeru dobimo kot rezultat iskanja 0 zadetkov.
Iskanje dveh ali več besed
Iskanje dveh ali več besed se bistveno razlikuje od prejšnje verzije Evrokorpusa. Veljajo naslednja pravila: Nekaj primerov: Posebnost: beseda z vezajem se obravnava kot dve besedi, zato je treba tako besedo dati med narekovaja, npr. "self-employed".
Kako stare izraze z nadomestnimi znaki prevedemo v novo obliko?
Pri starem načinu iskanja je bilo možno v iskalno okence napisati organi?ation, pa smo z enim iskanjem dobili segmente, v katerih se je pojavila beseda organisation ali organization. Po novem enak učinek dosežemo, če v iskalno okence napišemo organisation organization (obvezno brez narekovajev!).

Če želimo dobiti zadetke, ki poleg illicit drug vsebujejo tudi besedne zveze, pri katerih je med besedama še en ali več drugih izrazov (npr. illicit manufacture of narcotic drugs, illicit export of drugs, illicit traficking in narcotic drugs ipd.), smo pri starem načinu iskanja to dosegli z iskalnim nizom illicit*drug. Če ta iskani niz napišemo zdaj, dobimo zadetke, v katerih se pojavi beseda illicit ali drug ali obe. Če želimo dobiti enak tip zadetkov kot prej, moramo kot iskalni pogoj uporabiti izraz: +illicit +drug*.

Če se pogoste besede pojavijo v besednih zvezah (npr. "in the future"), jih program poišče pravilno, če je v besedni zvezi vsaj ena "nepogosta" beseda, sicer pa ne (za "the act" program ne prikaže nobenega zadetka).

Ker prevajalci dvojezični korpus praviloma uporabljajo za iskanje ustreznic v drugem jeziku, je pri večbesednih izrazih najbolj smiselno napisati iskani niz med narekovajema.

Glede rabe velikih ali malih črk velja enako kot prej: iskanje ni občutljivo na velike ali male črke (ali drugače: število zadetkov je enako, če v iskalno okence napišete United ali united ali UNITED).

Izpopolnjeno iskanje

Izpopolnjeno iskanje deluje enako kot prej, sčasoma pa bomo zaradi hitrejšega odziva iskalnika spremenili tudi tega.

Če vam še kaj ni jasno, mi