Egyáltalán nem ritka, hogy egy-egy szöveget HTML dokumentum formájában kapunk meg. Bár ezen dokumemtumokat viszonylag egyszerű lefordítani fordítómemória eszköz (CAT) használatával, sokszor előfordul, hogy egy-egy Word formátumú folyószövegben találunk HTML kódokat, vagy egy Excel-táblázatban kapunk fordítandó kódokat, amelyek esetében első pillantásra zavarba ejtő lehet, hogy mit is látunk, illetve mit is kell fordítani.
Abban az esetben, ha a fordítandó szöveget HTML formátumban kapjuk meg, a formázással nincs különösebb dolgunk, hiszen a legtöbb esetben Word dokumentum formájában érkezik, a fordítás esetében azonban számos kérdés felmerül. Ugyanis egy HTML fájl nagyon sok olyan információt, kódot tartalmaz, amely nem változhat, ezért ezek fordításánál különös körültekintéssel kell eljárni.
Összeállításunk célja, hogy tömören bemutassuk a HTML kódok lényegét, és így már nyugodtabban lehessen nekiállni egy-egy ilyen szövegrész szerkesztésének és fordításának.
A HTML az angol HyperText Markup Language (magyarul hiperszöveges jelölőnyelv) kifejezésből alkotott mozaikszó. A HTML egy olyan leíró jelnyelv, vagy kódrendszer, amelyet a weboldalak létrehozásához használnak. Fontos azonban tisztázni, hogy a HTML nem programozási nyelv, hanem egy olyan jelnyelv, amely a formázásra ad utasításokat, illetve a weboldalon megjelenő egyéb tartalmakra hivatkozásokat. Egészen leegyszerűsítve a HTML kódok használatával alakítható ki egy weboldal képi megjelenése.
A HTML-ben négy szimbólumot különböztetünk meg, melyek feladatukban eltérnek. A strukturális elemek meghatározzák az adott szövegrész célját (pl.: címsor), prezentációs szimbólumok jelölik ki, hogy a szöveg hogyan is nézzen ki, az eszköz elemek segítségével pedig különböző gombok és listák hozhatók létre. A negyedik szimbólum a hiperhivatkozás, amely kapcsolatot hoz létre az adott szöveg és egyéb tartalmak között. A hiperhivatkozás köszönhetően tudunk tehát linkelni az egyes szövegeken belül.
A HTML kódokat viszonylag egyszerű felismerni, hiszen < és > relációs jelek – közismert nevén „kacsacsőr” – jelölik. A két relációs jel között találhatjuk azt az általában néhány betűből álló utasítást, amely a megjelenésre utal. Ezek a néhány betűs utasítások a legtöbb esetben utalnak az angol megfelelőre, annak rövidítését vagy kezdőbetűit tartalmazzák. Tipikusan ilyen például a <br>, azaz line break, tehát sortörés, vagy a <hr>, a vízszintes elválasztó, vagyis horizontal ruler is.
Sok kód párban áll. A nyitó elem a < és > relációs jelek között található. Párja, a záró elem majdnem ugyanilyen, de a két relációs jel között egy / (perjel) is helyet kap. Például a "p" jelentése paragraph, azaz bekezdés, amelynek működése hasonló a Wordben egyébként ismert bekezdésekhez: <p>Ide kerül a bekezdés szövege</p>. De ugyanígy működik a <HTML> és a </HTML> kódpár is, melyek a HTML dokumentum elejét és végét jelzik.
Előfordulhat az is, hogy a HTML kódok bizonyos adatokat is tartalmaznak általában a név="adat" formában. Erre a legismertebb példa lehet az, ha egy logót kell megjeleníteni az oldalon. A <img src="logo.jpg"> HTML kód segítségével elérhetjük azt, hogy a kívánt logó is szerepeljen a weblapon.
Számtalan HTML kóddal találkozhatunk, ezért most csak a leggyakrabban használt, és leginkább előforduló néhány kódot gyűjtjük össze a könnyebb átláthatóság kedvéért.
<i> és </i>: italic, dőlt betű
<em> és </em>: emphasized, kihangsúlyozott - a gyakorlatban ez is dőlt betűt eredményez
<b> és </b>: bold, félkövér
<strong> és </strong>: strong, erősebben szedett - a gyakorlatban ez is félkövér betűt eredményez
<ul> és </ul>: underlined, aláhúzott szöveg
<p> és </p>: paragraph, bekezdés
<h1> és </h1>: első címsor
<font size> és </font>: betűméret beállítása
<font color> és </font>: betűszín beállítása
<br>: line break, sortörés
<hr>: horizontal ruler, vízszintes vonal
<img>: image, kép
Elsősorban azt kell tisztázni, hogy mely szövegrészeket kell fordítani, azaz azt, hogy mely részek azok, amelyek kódok, és melyek azok, amelyek a kódok által formázott szöveg. Ez nagyon fontos, ugyanis, ha a fordítás során megváltozik a kód, akkor sérül az a programozási vagy formázási információ is, amelyet jelöl. Éppen ezért ilyen szövegeket mindenképp valamilyen fordítástámogató szoftver segítségével fordítsunk.
Általánosságban elmondható, hogy a főszabály az, a lefordított anyagot olyan formátumban adjuk vissza, ahogyan azt a megrendelőtől kaptuk. Igaz ez a betűtípusra, a bekezdésre, az oldal formázására, de különösen a programozási és formázási információkat tartalmazó címkékre. Többek között ilyen a HTML, de az egyéb jelölőnyelvek is (pl.: XML). Ezeket a kódokat soha nem szabad lefordítani, mert akár egyetlen karakter megváltoztatása is teljesen más eredményt hoz, mint ami az eredeti elképzelés volt. A fordítómemória eszközök szerencsére automatikusan is felügyelni tudják a helyességet.