Pentru a putea vota, modifica pagini sau abona la modificările unei pagini trebuie să fiți autentificați. Cu această ocazie scăpați și de acest mesaj deranjant.

Dicţionare

De la l10n.ro
Versiunea din 18 ianuarie 2008 17:30, autor: Admin (Discuție | contribuții) (Ce sunt „dicţionarele româneşti”?)
Salt la: navigare, căutare

Ce sunt „dicţionarele româneşti”?

Dicţionarele sunt colecţii de cuvinte însoţite de echivalentele lor. Colecţiile de cuvinte (ale unui dialect, domeniu de activitate, etc.) se numesc lexicoane, iar echivalentul unui element de lexicon poate fi la rândul său o explicaţie sau o traducere. Expresia „dicţionar românesc” se referă atât la lexicoane româneşti, cât şi la lexicoane formate din cuvintele altor limbi, dar care au elementele traduse sau explicate în română.

Dintr-o perspectivă IT, definiţia de dicţionar s-ar putea vedea astfel: o bază de date cu lexiconul (doar el singur) sau o bază de date cu un lexicon şi traducerea ori explicaţia elementelor lui. Această bază de date poate fi folosită eventual şi de alte aplicaţii pentru a-i extinde utilitatea, astfel că împărţirea acestui subiect s-ar putea face astfel:

  • lexicoane româneşti şi aplicaţii cu lexicoane proprii
  • aplicaţii ce folosesc lexicoane deja existente.

Aplicaţiile care folosesc lexicoane pot fi foarte variate. În mare, ele se împart în două categorii:

  • corectoare ortografice (spellcheckers), singure sau integrate în alte programe
  • dicţionare propriu-zise.

Lexicoane şi aplicaţii cu lexicoane proprii

DEZ Online

DEX Online este un dicţionar explicativ al limbii române, disponibil online, care conţine definiţii culese din diverse dicţionare tipărite. Aşa cum numele o arată, sursa primară pentru definiţii este Dicţionarul Explicativ al Limbii Române, publicat de Institutul de Lingvistică „Iorgu Iordan” la Editura Univers Enciclopedic, ediţia 1998 (acronim consacrat: DEX '98). Însă cu timpul, definiţii din alte dicţionare româneşti importante s-au adăugat acestei baze de date. Astăzi DEX '98 a fost complet cules. Sursele acceptate de proiect pentru definiţii noi sunt enumerate în rubrica FAQ a proiectului.

DEX Online este un proiect colaborativ, oricine poate contribui cu definiţii noi (atât online, cât şi offline). Proiectul are şi o listă de discuţii, momentan privată (înscrierea trebuie aprobată de moderator, iar arhivele listei sunt disponibile doar membrilor listei). Codul proiectului este accesibil prin CVS, pentru instrucţiuni suplimentare despre instalarea unei cópii actualizate pe propriul calculator, vizitaţi pagina care descrie accesul CVS.

Proiectul a fost iniţiat de Cătălin Frâncu în august 2001. La început a avut o evoluţie lentă şi haotică, cu un fond de cuvinte destul de modest. Un efort susţinut şi sistematic a fost depus de membrii Federaţiei Române de Scrabble care au reuşit să dezvolte proiectul dincolo de o masă critică de cuvinte (2000 - 3000) fapt care a permis ca proiectul DEX Online să câştige o binemeritată popularitate. Odată trecut de această fază proiectul a cucerit valoroasa contribuţie a multor alţi voluntari care cred în această idee. Natural, în aceste condiţii favorabile, proiectul a căpătat nu numai o bogăţie tot mai mare a lexiconului, ci şi facilităţi noi necesare unei operări comode cu acest instrument lingvistic (căutare folosind expresii regulare, dar şi alte facilităţi destinate contributorilor, de exemplu formatare interactivă a definiţiei). Iată şi câteva cifre statistice care reflectă evoluţia remarcabilă a acestui proiect: Dată Număr de cuvinte decembrie, 2001 (* 40 iunie, 2003 20,000 februarie 15, 2004 30,000 mai 9, 2004 40,000 februarie 17, 2006 (** 262,521 (** dată aproximativă (** la data ultimei actualizări a acestei pagini

Ispell

Ispell este un corector ortografic interactiv, un utilitar ce funcţionează în linia de comandă. Este un program construit după mai vechiul spell(1) care a primit denumirea ispell(1) pe sistemul de operare ITS. Felul în care operează Ispell de obicei este: ispell nume-fişier. Acestă comandă lansează aplicaţia, în care fiecare cuvânt din fişierul nume-fişier cu o ortografie „discutabilă” este marcat vizibil şi sunt sugerate posibile variante corecte.

Aplicaţia face sugestiile pe baza unui lexicon. Lexiconul ispell pentru limba română a fost scris de Mihai Budiu. Evoluţia acestui lexicon a rămas însă la prima încercare, eforturile fiind concentrate spre Aspell. Lexiconul românesc poate fi descărcat de la următoarele adrese:

  • site-ul personal al lui Mihai Budiu sub denumirea rom-spell.tar.gz (timestamp: 20031217)
  • proiectul Romdict ca ispell-ro-0.1.tar.gz (timestamp: 20021122)

Aspell este un utilitar care funcţionează ca înlocuitor pentru comanda ispell -a, fiind o aplicaţie mai nouă ca precedenta şi mai flexibilă. Pentru acest motiv, aspell(1) a reuşit să capete statutul de „urmaş” al lui Ispell şi să capteze astfel eforturile de localizare ale programatorilor români. În această direcţie au continuat eforturile depuse de Mihai Budiu, la care s-au adăugat cele ale lui Mugurel Ion Ciobîcă. Lexiconul românesc pentru Aspell este foarte cuprinzător (comparativ cu cel pentru Ispell) şi poate fi descărcat de la:

  • pagina Debian dedicată aspell-ro (pagina este împărţită cu alte două proiecte de localizare: OrtoSelector şi debian-l10n-ro) în două versiuni: aspell-ro_0.50-2.orig.tar.gz şi aspell-ro_0.50-2-2.diff.gz.
  • proiectul Romdict ca aspell-ro-0.1.tar.bz2 (serverul SourceForge din Kent, dar pot fi alese şi alte servere SourceForge).

OpenOffice.org

OpenOffice.Org este o suită de aplicaţii de birou cu suport de corectare ortografică pentru limba română. Suportul este compus din trei componente: corector ortografic (ro_RO.zip), dicţionar de cuvinte (th_ro_RO.zip) şi corector pentru despărţirea în silabe (hyph_ro_RO.zip). Dicţionarul de cuvinte este la început de drum, celelalte două componente sunt remarcabile. Cele trei componente pot fi descărcate împreună, arhivat sau independent:

   * ro_RO-pack.zip este arhiva cu cele trei componente
   * ro_RO.zip este doar lexiconul pe baza căruia funcţionează corectorul ortografic
   * hyph_ro_RO.zip este corectorul de despărţire în silabe

Glosarul

Glosarul este o aplicaţie scrisă de Dan Damian, destinată echipelor de traducere a proiectelor Free Software / Open Source. Funcţionează online, pe site-ul TMLUG, grupul utilizatorilor de Linux din Timişoara. Pentru a instala această aplicaţie pe calculatorul propriu este nevoie de un server web şi PHP. Este un instrument de tip Wiki (editare colaborativă), de mare ajutor în păstrarea consecvenţei unui proiect de traducere. Este similar cu DEX Online, însă cele două soluţii se adresează unui public diferit (motiv pentru care o comparaţie între cele două ar fi disproporţionată). În vreme ce DEX Online se adresează unui public larg şi îşi propune să ofere un dicţionar explicativ complet al limbii române, Glosarul se adresează în primul rând traducătorilor de documentaţii din engleză, scopul său fiind facilitarea consecvenţei traducerilor diverselor proiecte IT (motiv pentru care şi aria acoperită de lexiconul Glosarului este aproape exclusiv concentrată pe argoul şi jargonul IT).

O remarcă: această aplicaţie, spre deosebire de DEX Online, nu are un mecanism de contopire a contribuţiilor „offline” cu versiunea oficială, de la TMLUG. Bineînţeles că acest lucru nu exclude contribuţiile independente, însă având în vedere publicul căruia i se adresează aplicaţia, se presupune aveţi la dispoziţie o conexiune la Internet care vă permite lucrul „online” pe versiunea oficială. Mai jos sunt fişierele necesare pentru descărcare. Lexiconul este un fişier în format text, delimitat prin taburi şi are numele glosar.txt.

   * glosar-0.2.tgz aplicaţia propriu-zisă
   * glosar.txt este lexiconul acestei aplicaţii
   * history.txt este un fişier ajutător
   * pagina de ajutor, unde puteţi afla mai multe detalii despre acest proiect.

Mozilla

Mozilla este o suită de aplicaţii dezvoltată de Fundaţia Mozilla. Aplicaţiile Mozilla ce folosesc un corector ortografic (spellchecker) sunt: Thunderbird, Mozilla Mail şi Mozilla Composer. Dicţionarul folosit de corectorul ortografic se instalează uşor (un simplu click, urmat de acceptarea instalării), fiind un fişier în format xpi: spell-ro.xpi

Wikţionarul

Wikţionarul este un proiect soră al enciclopediei Wikipedia în română accesibil online. Proiectul fiind la început de drum este mai redus ca dimensiuni, dar merită menţionat pentru că în timp ar putea deveni un reper important al proiectelor româneşti online.

Alte aplicaţii ce folosesc lexicoane

Dixit

Dixit e un dicţionar propriu-zis ce poate opera căutări în baza de date cu sau fără diacritice. Este un program scris de Octavian Procopiuc, disponibil sub licenţă GPL în pagina proiectului. Ultima versiune, 1.0.1, a fost publicată în 23 august 2004. Acest program rulează pe calculatorul propriu fără necesitatea unei legături la Internet. Dacă aveţi însă legătură la Internet, lexiconul acestei aplicaţii poate fi actualizat automat, utilizând lexiconul furnizat de proiectul DEX Online. Aplicaţia este scrisă în C++ şi are o interfaţă grafică (GUI) ce utilizează versiunea necomercială a bibliotecii grafice Qt.

ROSpell

ROSpell este un editor de texte cu funcţie de corector ortografic având de asemenea un proiect SourceForge dedicat. Foloseşte în acest scop o colecţie de lexicoane româneşti compusă din:

   * lexiconul românesc pentru Ispell scris de Mihai Budiu
   * lexiconul românesc pentru Aspell, aspell-ro.

Programul foloseşte biblioteca Qt a firmei Trolltech. Pe lângă fişiere text neformatate (plain text), poate recunoaşte toate formatele de tip HTML şi XML (OpenOffice.org, AbiWord, Scribus) fără a include în corectare marcajele (tagurile) utilizate. Altă caracteristică a acestui program simplu şi rapid este că, în rarele cazuri în care nu puteţi configura o tastatură românească (pentru instrucţiuni vedeţi pagina Tastaturi), editorul suportă nativ diacriticele. Tot nativ, editorul „ştie” (practic, toate) seturile de caractere româneşti: UTF-8, ISO-8859-2, ISO-8859-16, CP1250. Şi această aplicaţie permite căutarea de definiţii online în dicţionarul DEX Online.