Pentru a putea vota, modifica pagini sau abona la modificările unei pagini trebuie să fiți autentificați. Cu această ocazie scăpați și de acest mesaj deranjant.

Localizarea în Visual C

De la l10n.ro
Versiunea din 14 decembrie 2007 00:13, autor: Admin (Discuție | contribuții) (Cum convertesc dintr-un string în altul)
Salt la: navigare, căutare


Introducere

Am in mentenanţă o aplicaţie MFC veche de 7 ani şi de curând am putut să renunţ la suportul pentru Win9x şi am început trecerea aplicaţiei la Unicode.

Acum pot sa recomand oricui vrea sa internationalizeze/localizeze să folosească libraria gettext din urmatoarele motive:

  • mentenanţa fişierelor de localizare este incomparabil mai uşoară
  • există orice fel de unelte de localizare pentru fişiere gettext (.PO)
  • poate fi folosită şi în aplicaţii comerciale (este LGPL)

Trecerea aplicației la Unicode

Unii o pot considera inutila dar experienta mea spune ca merita sa renunti la Win9x și sa treci la unicode. Cel puțin scapi de problema codepage-urilor.

Începeti prin a înlocui tipurile de date și apelurile la funcții cu urmatăarele alternative care de fapt sunt toate macro-uri care se compilează diferit în funcție de target. Această fază nu vă va 'strica' aplicaţia şi veţi putea să faceţi build-uri separate.

Nu uitați să faceți un branch separat înainte de a începe, s-ar putea să dureze de 3X mai mult decât credeți, acum depinde de când și de cine a fost scrisă aplicația inițial.

char    _TCHAR
LPSTR       LPTSTR
LPCSTR      LPCTSTR

strlen      _tcslen
strcpy      _tcscpy 
strcmp      _tcscmp
strncmp     _tcsmcmp
stricmp     _tcsicmp
strchr      _tcschr
strncmp     _tcsncmp
sprintf     _tsprintf /* Vezi mai jos */
strstr      _tcsstr
sscanf      _stscanf
wsprintf    _tcs
atoi    _tstoi
itoa    itot
sscanf    _stscanf
vsprintf    _vstprintf
fopen    _tfopen
fputs       _fputs
fclose    _tfclose
/* Cum Bill cam uită să ducă treaba la bun sfârşit a uitat de (w)sprintf aşa că adăugaţi şi asta într-un H*/
#ifdef UNICODE
#define _tsprintf wsprintf
#define tstring wstring
#else
#define _tsprintf sprintf
#define tstring string
#endif

Ceva mai puţin evident despre ..prinf(...)

funcţiile din gama printf pot primi ca parametrii atât char, w_char cât şi t_char aşa că **trebuie** ajutate să-şi dea sema ce primesc

Apel                  build unicode          build ne-unicode        alias
--------------------------------------------------------------------------------
sprintf "%s"          LPWSTR                 LPSTR                   normal
sprintf "%S"          LPSTR          LPWSTR                  inverse  
sprintf "%hs"         LPSTR                  LPSTR                   single-byte
sprintf "&ls"         LPWSTR                 LPWSTR                  double-byte

Cum convertesc dintr-un string în altul

Puteți folosi niște macrocomenzi gen:

W2A(...) și CW2A(...)
A2T(...) și CA2T(...)
T2A(...) și CT2A(...)
  • C - constant
  • W - Wide
  • T - TCHAR (Adica W în unicode și A în rest)
  • A - ASCII

Nu uitați câ nu le puteți folosi oricum deoarece fac niște hack-uri cam nasoale. Dacă vreți să le folosiți citiți neapărat înainte

Gettext

Gettext functions and comments

// Translators: This is a text that is going to be used by translators in order to translate the next term corectly.
print(_("Code"));

// This is how we MUST use printf syntax in order to be able to translate corectly the programs.
// This syntax permits the changing the order of the parameters.
printf("'%2$d' us tge 2th parameter and '%1$s' is the first one.", param1, param2);

// SYntax
// _(...) este doar un macro care se expandeaza la gettext(...)
// dgettext
// dcgettext
char * ngettext (const char *msgid_singular, const char *msgid2_plural, unsigned long int n); // For plural
char * dngettext (const char *domain, const char *msgid1_singular, const char *msgid2_plural, unsigned long int n); // 
char * dcngettext (const char *domain, const char *msgid1, const char *msgid2, unsigned long int n, int category); //
// Formatting with positions
fprintf "%2$d %1$d" // (POSIX but not C 99)
// printf, vfprintf, sprintf, vsprintf, fwprintf, wprintf, swprintf, vswprintf

...

Descarcati:

Ar trebui sa stiti ca implicit gettext intoarce textele in UTF-8 ceea ce este foarte bine, mai putin pentru Windows care foloseste in modul Unicode (UTF16-LE), asa ca trebuie sa le convertiti la runtime (oricum e suficient de rapida conversia).

#include "../contrib/gettext-runtime/include/libintl.h"

CString strDomain=CString(textdomain("myproject")); // if you put "" will default to "messages"
CString strBinded = CString(bindtextdomain("myproject","d:\\dev\\pbxtools\\src\\debug\\locale\\")); // put you path here

// later
AfxMessageBox(_("Hello World!"), (UINT)MB_OK, (UINT)0);

Extragerea textelor

Extragerea textelor din fisierele .C si .CPP este extrem de usoara folosing xgettext, dar cand veti ajunge la fisierele .RC o sa descoperiti ca nu sunt suportate. Din fericire dupa multe incercari nereusite am gasit singur o solutie simpla

xgettext --from-code=UTF-8 --add-comments --omit-header --no-location \
--keyword=MENUITEM --keyword=LTEXT --keyword=DEFPUSHBUTTON --keyword=PUSHBUTTON --keyword=CAPTION \
--language=Tcl -o resources.po project.rc

Sau pe scurt: intrucat sintaxa Tcl e destul de compatibila cu cea din .RC, folosind keyword-urile respective obtinei un parser de .RC in xgettext. Cool?... o sa trimit si un mail ca sa modifice sa recunoasca fisierele rc direct.

Legături

--sorin