De volgende tips helpen u bij het voorbereiden van uw website op lokalisatie.
1. Codeer en serveer je pagina's als Unicode
Als u van plan bent om uw site in andere talen te lokaliseren dan de beste codering, moet u kies voor uw webpagina's is Unicode. Unicode is een soort numerieke presentatie van tekens die twee is bytes en kunnen dus maximaal 65535 tekens bevatten om weer te geven. Er zijn momenteel geen gesproken talen die meer dan 65.535 tekens, dus door Unicode als codepagina te gebruiken, mag u geen problemen ondervinden met tekens worden niet weergegeven. Als u uw webpagina wilt weergeven als een Unicode-pagina, geeft u de tekenset op als UTF-8 in plaats van de standaard voeg hieronder een regel code toe in het hoofdgedeelte van uw pagina:
<meta HTTP-equiv="Content-Type" content="text/html; charset=utf-8">
Een ander voordeel van het gebruik van unicode om uw pagina's te schrijven is dat u hiermee op unieke wijze meerdere tekensets op de ene pagina. Dit is het meeste voordeel voor pagina's waar u meer dan één type taal, bijv. introductiepagina's, lijsten met taalinhoud enz. U moet er ook voor zorgen uw webserver is ingesteld om de pagina als Unicode naar de browser te verzenden. Als u de Apache-webserver gebruikt kunt u dit doen door het .htaccess-bestand te bewerken en ervoor te zorgen dat de richtlijn voor het toevoegen van standaardfuncties is ingesteld als:
Standaard toevoegenCharset utf-8
2. Gebruik stijlen in plaats van <font>
en gebruik Unicode-lettertypen in uw css
Stijlen gebruiken in plaats van <font> tags op uw pagina's maken het gemakkelijker voor u om tekst aan te passen grootte voor sommige talen in een later stadium op de hele website. Wanneer u uw webpagina's in een taal aanmaakt anders dan Engels, bent u beperkt in het gebruik van lettertypen. Er zijn een paar lettertypen in vensters die automatisch geïnstalleerd en kan meertalige tekens weergeven. Als u wilt dat uw bezoekers uw pagina's bekijken zonder dat u lettertypen hoeft te installeren, moet u deze meertalige lettertypen gebruiken. De meest voorkomende Unicode-lettertype gezichtkeuzes omvatten Arial, Verdana, Times New Roman & Tahoma.
3. Overweeg om uw documenten in een XML-taal te schrijven, voor een scheiding van stijl en inhoud
Met XHTML en XML + XSLT kunnen je contentbronbestanden efficiënt worden vertaald. XML-documenttypes hebben wijdverspreide ondersteuning in een aantal vertaalgeheugentoepassingen, wat betekent dat vertalers kunnen werken rechtstreeks met uw bronbestanden, waardoor u minder tijd kwijt bent aan formatteren.
4. Overweeg een vloeistofstroom van tekst om verschillen in woordlengte mogelijk te maken
De Duitse tekst gebruikt gemiddeld 1/3e meer tekens per woord dan de Engelse en Aziatische taal veel minder tekenruimte dan Engelse woorden. Uw ontwerpinterface, lay-out en navigatie moeten overwegingen voor deze verschillen. Overweeg het gebruik van CSS-positionering voor tekstelementen of gebruik flexibele relatieve tabelbreedtes waar de cellen uitvouwen of samentrekken, afhankelijk van de tekenindeling.
5. Navigatie-overwegingen
Sommige talen dwingen u om enkele wijzigingen aan te brengen in het ontwerp en de navigatie van uw website. Bijvoorbeeld, als u een verticale menubalk hebt, kunt u deze links van uw pagina's voor Engelse pagina's en in de rechts voor Arabische pagina's omdat Arabisch een RTL-taal is en mensen worden gebruikt om te beginnen met het lezen van pagina's vanaf van rechts naar links. Dit is echter geen regel, maar het is beter om er rekening mee te houden bij het ontwerpen van pagina's.
6. Minimaliseer waar mogelijk de tekst in afbeeldingen
Grafische elementen of afbeeldingen die tekst bevatten, zullen langer duren om te lokaliseren en zijn niet zo eenvoudig te vertalen als HTML tekst. Daarom wordt aanbevolen om waar mogelijk tekst in een afbeelding te vervangen door HTML-tekst. Vaak het formatteren van grafische tekst in Aziatische talen (dubbele-byte tekensets) vereist mogelijk een speciale computer tools die kunnen bijdragen aan uw kosten & tijdsbronnen. Het is veel gemakkelijker om tekst te gebruiken en uw pagina's te coderen in Unicode.
7. Integreer geen gegevens en vermijd het gebruik van CDATA-secties
Alle gegevens die geen tekst zijn (bijv. javascripts, SQL-query's) buiten het document moeten worden gehouden als mogelijk en in plaats daarvan gekoppeld aan een inclusief mechanisme. De meeste vertaaltools verwerken CDATA niet erg goed en het kan moeilijk zijn om inline CDATA-codesegmenten bij te houden, die in de vertaling over het hoofd kunnen worden gezien proces.