Seguire i suggerimenti riportati di seguito per preparare il vostro sito web al processo di localizzazione.

1. Scegliere Unicode come sistema di codifica delle vostre pagine web

Se volete localizzare il vostro sito web in diverse lingue allora dovreste senz’altro affidarvi a Unicode, un sistema di codifica di caratteri numerici a 2 byte e che può quindi contenere fino a 65.535 caratteri. Non vi sono lingue al mondo che contengano più di 65.535 caratteri, quindi utilizzando Unicode come sistema di codifica non vi è il rischio di incorrere in problemi di visualizzazione di caratteri. Per gestire il testo di una pagina web come Unicode, dovete specificare come set di caratteri l’UTF-8 (anzichè usare la Codifica Predefinita) e inserire la seguente linea di codice all’inizio della pagina:

Un altro vantaggio che comporta Unicode nella creazione della vostra pagina web, è la possibilità di visualizzare più set di caratteri nella stessa pagina. Questo risulterà di grande aiuto se le pagine da voi create dovranno essere visualizzate in più di una lingua, per esempio come pagine di entrata o come elenco di selezione delle lingue. Dovrete inoltre assicurarvi che il vostro server sia in grado di inviare al browser la pagina web nel formato Unicode. Se utilizzate il web server Apache dovrete modificare il file .htaccess e assicurarvi che la direttiva AddDefaultCharset sia impostata su:

AddDefaultCharset utf-8

2. Utilizzare stili (anzichè tag ) e font Unicode nel vostro css

Se per le vostre pagine web utilizzate stili anzichè tag incorporati, risulterà più semplice impostare la dimensione del testo per le lingue all’interno dell’intero sito. La scelta dei font da utilizzare è limitata qualora le vostre pagine web debbano essere tradotte in una o più lingue diverse dall’inglese. Possono esserci alcuni font che si installano automaticamente e che possono mostrare caratteri multilingue. Se volete che le pagine del vostro sito web siano visualizzate correttamente senza l’obbligo di installare font, dovrete utilizzare questi font multilingue. I più comuni font Unicode sono Arial, Verdana, Times New Roman e Tahoma.

3. Considerare l’authoring dei propri documenti nel linguaggio XML per la separazione di stili e contenuti

XHTML e XML + XSLT permettono di tradurre efficientemente il contenuto dei file di origine. I tipi di documento XML sono largamente usati in numerosi strumenti di memoria di traduzione e quindi i traduttori potranno lavorare direttamente sui vostri file di origine riducendo i tempi di formattazione.

4. Valutare l’utilizzo di un layout variabile che si adatti alla lunghezza delle parole

In media un testo in tedesco impiega un terzo dei caratteri in più per parola rispetto a un testo in inglese; le lingue asiatiche, al contrario, impiegano spesso meno caratteri rispetto all’inglese. Il design dell’interfaccia web, il layout e la navigazione del vostro sito devono essere concepiti considerando questo fattore. Valutare l’uso del posizionamento CSS per gli elementi di testo o di tabelle a lunghezza variabile dove le celle si ingrandiscono o si rimpiccioliscono a seconda del carattere del layout. In ogni caso possiamo addattare il vostro layout al contenuto del linguaggio di destinazione o – in alternativa – possiamo creare un layout simile che si adatti al nuovo contenuto.

5. Considerazioni sulla navigazione

Alcune lingue potrebbero richiedere l’apporto di modifiche del design e della navigazione del vostro sito. Per esempio, la barra dei menu verticale deve essere posizionata alla sinistra della pagina web nella versione inglese e alla destra della pagina web nella versione araba. Questo perchè la lingua araba viene letta in modalità RTL (Right to Left), ovvero da destra a sinistra. Ad ogni modo tali accorgimenti non sono una regola imprescindibile, ma è meglio tenerli in considerazione nel design delle pagine web.

6. Quando possibile, utilizzare elementi testuali invece di elementi grafici

Gli elementi grafici o le immagini contenenti testo richiedono più tempo per essere localizzati e maggiore difficoltà rispetto al formato HTML. È quindi raccomandabile, se possibile, sostituire eventuali testi all’interno di elementi grafici con testo HTML; considerando poi che i motori di ricerca non leggono il contenuto degli elementi grafici, questa precauzione faciliterà la visibilità del vostro sito su Internet. Spesso la formattazione di contenuti grafici delle lingue asiatiche (con set di caratteri a doppio byte) può richiedere l’utilizzo di appositi strumenti di analisi testuale, che vi comporterebbe un ulteriore dispendio di tempo e soldi. È quindi più semplice fare ricorso a elementi testuali e codificare le vostre pagine web in Unicode. È comunque risaputo che il design e un sito accattivante sono fondamentali per attirare visitatori. Quindi, se non vi fosse possibile modificare gli elementi grafici, possiamo eseguire noi l’editing del relativo contenuto testuale.

7. Evitare di incorporare dati e di utilizzare sezioni CDATA

Tutti i dati non testuali (ad esempio gli Java Script e le query SQL) non vanno inseriti direttamente nel documento bensì collegati tramite un sistema di “include”. L’aggiornamento del vostro sito ne trarrà beneficio, non essendo più necessario aggiornare gli script di tutte le pagine web. Molti strumenti di traduzione assistita non supportano bene CDATA e l’individuazione di segmenti di codice interni a CDATA potrebbe rivelarsi difficoltosa nel processo traduttivo.