Lean Localization Machine Marc van Grootel (iCtrl) XML User Group 12 November “ Publiceren in het tijdperk van Google, App...
Lean Translation Machine <ul><li>Het traditionele vertaalproces </li></ul><ul><li>Welke uitdagingen zijn er beide de proje...
Introductie <ul><li>7+ jaren als localization engineer / engineering manager bij  Bowne Global Solutions / Lionbridge </li...
Het traditionele vertaalproces <ul><li>XML bestandsanalyse (oa. validatie) </li></ul><ul><li>XML configuratie vertaaltool ...
De projecten van nu <ul><li>Veel meer XML, maar ook nog altijd veel  MS Word en Framemaker. </li></ul><ul><ul><li>Slechte ...
Hebben we een nieuwe visie nodig? <ul><li>De traditionele aanpak van vertaalprojecten is niet langer meer houdbaar. </li><...
laat ik een poging wagen...
Het nieuwe vertaalplatform (i) <ul><li>“ binnen vijf jaar bestaan er vertaalsystemen die bestaan uit een samenwerkings pla...
Het nieuwe vertaalplatform (ii) <ul><li>“ Het platform maakt gebruik van  open standaarden  en is  service-geori ë nteerd ...
Traditioneel team en workflow <ul><li>Sequentiële workflow met veel handoff’s </li></ul>
Samenwerkingsplatform <ul><li>Minder rigide workflow. </li></ul><ul><li>Team verbonden door moderne communicatietechnologi...
Trends en nieuwe ontwikkelingen
De vertaal gorilla’s <ul><li>Zetten zwaar in op technologie, elk op hun eigen wijze. ... de ontwikkelingen gaan snel, en e...
Technologische vernieuwingen <ul><li>Machinevertalingen </li></ul><ul><li>Social Media / Social Networks </li></ul><ul><li...
Crowdsourcing <ul><li>Facebook (1 – 100 talen in 2 jaar), Twitter </li></ul><ul><li>Is niet gratis: er is nog altijd PM, e...
Google Wave? <ul><li>Zeer interessant maar beetje gehyped. </li></ul><ul><li>Misschien niet de volgende email </li></ul><u...
Google Wave (ii)
Google Wave (iii)
XML Localization
Enabling technologies <ul><li>XSLT 2.0 – XSL Transformations </li></ul><ul><li>XQuery / XML database </li></ul><ul><ul><li...
Localisatie standaarden
Waarom zijn XML standaarden van belang? <ul><li>Makkelijkere uitwisseling van gegevens </li></ul><ul><li>Makkelijkere conv...
De localisatiestandaarden <ul><li>ITS - Internationalization Tag Set </li></ul><ul><ul><li>XML bestanden voorbereiden voor...
XML Internationalization best practices <ul><li>I18N bepaalt voor een groot deel de kosten van vertaling. </li></ul><ul><l...
ITS: Internationalization Tag Set <ul><li>W3C Recommendation 3 april 2007 </li></ul><ul><li>Nog geen brede ondersteuning <...
TMX: Translation Memory eXchange <ul><li>Lisa – the Localization Industry Standards Assocation </li></ul><ul><li>Eerste ve...
TMX: Translation Memory eXchange <ul><li>Lisa – the Localization Industry Standards Assocation </li></ul><ul><li>Eerste ve...
Wat is  XLIFF? <ul><li>OASIS – 1.1 October 2003, 1.2 February 2008 </li></ul><ul><li>Inmiddels brede ondersteuning </li></...
XML Localization Interchange File Format
XML Localization Interchange File Format
XML Localization Interchange File Format
XML Localization Interchange File Format
Van XML naar XLIFF en terug <ul><li>Bron XML wordt opgesplitst in onvertaalbare (Skelet) en vertaalbare informatie (XLIFF)...
XLIFF als spil van het vertaalproces <ul><li>Vertaalbestanden , Review spreadsheets, vertaalgeheugens worden uit XLIFF geg...
een XML/XLIFF toepassing iCtrl Project Managers, Language Engineering Vertalers Reviewers Klant Bron XML Skelet Vertaalde ...
XML Database
Links <ul><li>iCtrl   </li></ul><ul><li>Wiki over localization standards  (in aanbouw) </li></ul><ul><li>XML International...
Upcoming SlideShare
Loading in …5
×

A Lean Localization Machine (XML Holland 2009)

875 views

Published on

Presentation for XML Holland 2009 (available in Dutch only).

Published in: Technology, Travel, Business
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
875
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
7
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • Het vertaalproces voor producten was en is voor het belangrijkste deel een ambacht. Inmiddels zijn technische Computer Aided Translation (CAT) tools zoals vertaalgeheugens gemeengoed. Innovaties en vernieuwingen zoals machinevertaling en nieuwe fenomenen zoals sociale netwerken en crowdsourcing spelen echter ook steeds vaker een rol. Volgens schattingen wordt ongeveer 6% van alle geschreven content vertaald. In een steeds verder globaliserende economie lijkt dit erg weinig. Belangrijkste belemmeringen om meer te vertalen zijn de kosten. Maar ook is het duidelijk dat de traditionele hands-on aanpak van het schuiven met bestanden tussen de vele partijen in een vertaalproces niet schaalbaar genoeg is om efficiënt de hedendaagse uitdagingen tegemoet te treden.   In een wat radicalere visie op het vertaalproces van de toekomst speelt standaardisatie een belangrijke rol. Het verlaagt de kosten, maakt uitwisseling tussen verschillende systemen eenvoudiger, reduceert lock-in etc. Er bestaan inmiddels XML standaarden die tezamen bijna het gehele vertaaltraject beslaan. Samen met andere innovaties en vernieuwingen vormen ze een goede basis voor het innoveren van vertaaltools en systemen van de toekomst.   In deze presentatie geven we naast een summier overzicht van de spanningen die het traditionele vertaalproces parten spelen ook een visie op het vertaalproces van de nabije toekomst ( a lean translation machine ) en een overzicht van een aantal XML gebaseerde lokalisatiestandaarden (ITS, XLIFF, TMX) en hoe ze met bekendere XML enabling technologies (XQuery, XSLT en XProc) in het vertaalproces ingepast kunnen worden.
  • A Lean Localization Machine (XML Holland 2009)

    1. 1. Lean Localization Machine Marc van Grootel (iCtrl) XML User Group 12 November “ Publiceren in het tijdperk van Google, Apple en Amazon”
    2. 2. Lean Translation Machine <ul><li>Het traditionele vertaalproces </li></ul><ul><li>Welke uitdagingen zijn er beide de projecten van vandaag en morgen? </li></ul><ul><li>Is er een nieuwe visie nodig voor de vertaalprojecten van morgen? </li></ul><ul><li>Welke trends en vernieuwingen kunnen hierbij uitkomst bieden? </li></ul><ul><li>XML Internationalisatie en Localisatiestandaarden </li></ul>
    3. 3. Introductie <ul><li>7+ jaren als localization engineer / engineering manager bij Bowne Global Solutions / Lionbridge </li></ul><ul><ul><li>Localisatieprojecten (oa. MS Office, MSN, Navision, MedTronic) </li></ul></ul><ul><ul><li>Integraties CMS met vertaalportaal (oa. Dupont, Robeco) </li></ul></ul><ul><ul><li>Kwaliteitsverbetering door automatisering van localisatieprocessen </li></ul></ul><ul><li>3+ jaren als technisch consultant / ontwikkelaar / architect bij iCtrl </li></ul><ul><ul><li>iCtrl is specialist in het creëren, vertalen, publiceren en beheren van productinformatie en procesbeschrijvingen </li></ul></ul><ul><ul><li>Documentatiesystemen (oa. architectuur van NedTrain systeem) </li></ul></ul><ul><ul><li>Localisatieprojecten (oa. TomTom, Yamaha) </li></ul></ul><ul><ul><li>Documentatie migratie trajecten (oa. Vanderlande) </li></ul></ul><ul><ul><li>Implementatie Scrum (een Agile methodologie) </li></ul></ul><ul><li>10+ jaren inzet van XML-technologieën </li></ul><ul><li>Generaliserend specialist </li></ul>
    4. 4. Het traditionele vertaalproces <ul><li>XML bestandsanalyse (oa. validatie) </li></ul><ul><li>XML configuratie vertaaltool </li></ul><ul><li>Referentiemateriaal verzamelen en analyseren </li></ul><ul><li>Vertaling </li></ul><ul><li>Review (Editing, Proofing) </li></ul><ul><li>Review/approval door de klant </li></ul><ul><li>Linguistische en technische kwaliteitscontroles </li></ul><ul><li>Vertaalde XML bestanden leveren </li></ul>
    5. 5. De projecten van nu <ul><li>Veel meer XML, maar ook nog altijd veel MS Word en Framemaker. </li></ul><ul><ul><li>Slechte I18N vertaald zich in hogere kosten voor vertaling </li></ul></ul><ul><li>Kleine volumes, veel kleine projecten, veel updates </li></ul><ul><ul><li>Hierdoor komen proces inefficiënties genadeloos aan het licht </li></ul></ul><ul><li>Technische randvoorwaarden de technische complexiteit van projecten is toegenomen. </li></ul><ul><ul><li>Grens tussen software / documentatie vervaagd (bijvoorbeeld AJAX web-sites). </li></ul></ul><ul><li>Verwachtingspatroon van de klant </li></ul><ul><ul><li>Klant wil meer inzicht in projecten </li></ul></ul>
    6. 6. Hebben we een nieuwe visie nodig? <ul><li>De traditionele aanpak van vertaalprojecten is niet langer meer houdbaar. </li></ul><ul><li>Traditionele aanpak zit echter nog ingebakken in veel tools en systemen. </li></ul><ul><li>Nieuwe informatie en communicatie technologie kan misschien oplossingen bieden. </li></ul><ul><li>Een visie die recente ontwikkelingen uit verschillende gebieden combineert kan ons hiervan losweken. </li></ul><ul><li>Zo’n visie kan richting geven aan de experimenten van vandaag en de oplossingen van morgen. </li></ul>
    7. 7. laat ik een poging wagen...
    8. 8. Het nieuwe vertaalplatform (i) <ul><li>“ binnen vijf jaar bestaan er vertaalsystemen die bestaan uit een samenwerkings platform waarin alle betrokkenen samenwerken om producten te vertalen, nadruk ligt hierbij op communicatie tussen de teamleden. De werkwijze zal niet afgedwongen worden door een rigide workflow en elke vertaling (zin/paragraaf) kan individueel door het proces ‘stromen’ . ” </li></ul>
    9. 9. Het nieuwe vertaalplatform (ii) <ul><li>“ Het platform maakt gebruik van open standaarden en is service-geori ë nteerd . Via het platform kunnen verschillende services van derden naar behoefte gecombineerd worden. Routinewerk is zoveel mogelijk geautomatiseerd zodat men zich kan concentreren op het echte werk en kwaliteitscontroles zijn in de processen ingebakken – in plaats van door inspecties achteraf.” </li></ul>
    10. 10. Traditioneel team en workflow <ul><li>Sequentiële workflow met veel handoff’s </li></ul>
    11. 11. Samenwerkingsplatform <ul><li>Minder rigide workflow. </li></ul><ul><li>Team verbonden door moderne communicatietechnologie. </li></ul><ul><li>Het team werkt samen aan een project. </li></ul><ul><li>Werk ‘stroomt’ soepel door het systeem. </li></ul>
    12. 12. Trends en nieuwe ontwikkelingen
    13. 13. De vertaal gorilla’s <ul><li>Zetten zwaar in op technologie, elk op hun eigen wijze. ... de ontwikkelingen gaan snel, en er zijn heel wat nieuwkomers die het goed doen. </li></ul><ul><li>SDL </li></ul><ul><ul><li>Vertaaldiensten </li></ul></ul><ul><ul><li>Vertaalsystemen </li></ul></ul><ul><ul><li>Content Management – van vertaling naar content creatie </li></ul></ul><ul><li>Lionbridge </li></ul><ul><ul><li>Vertaaldiensten </li></ul></ul><ul><ul><li>Freeway platform, en nu Translation Workspace (GeoWorkz) </li></ul></ul><ul><ul><li>“ U krijgt de tools en wij uw vertaalwerk” </li></ul></ul><ul><ul><li>Integraties met Content Management Systemen </li></ul></ul><ul><ul><li>Recentelijk ook gebruik als ‘pay-as-you-go’ platform voor andere vertalers (PaaS) </li></ul></ul>
    14. 14. Technologische vernieuwingen <ul><li>Machinevertalingen </li></ul><ul><li>Social Media / Social Networks </li></ul><ul><li>Open Data / Data sharing (TAUS) </li></ul><ul><li>Crowdsourcing </li></ul><ul><li>Google Wave </li></ul>
    15. 15. Crowdsourcing <ul><li>Facebook (1 – 100 talen in 2 jaar), Twitter </li></ul><ul><li>Is niet gratis: er is nog altijd PM, en supervisie nodig en misschien zelfs vergoeding voor vertalers </li></ul><ul><li>Is niet makkelijk, kun je genoeg vertalers aantrekken </li></ul><ul><li>Bottom up model versus top down </li></ul><ul><li>Levert interessante lessen en ervaringen op (de tijd zal het leren) </li></ul><ul><li>Een systeem dat geschikt is voor crowdsourcing past perfect in de geschetste visie. </li></ul>
    16. 16. Google Wave? <ul><li>Zeer interessant maar beetje gehyped. </li></ul><ul><li>Misschien niet de volgende email </li></ul><ul><li>Maar misschien wel specifieke toepassingen: bijvoorbeeld review en proofreading </li></ul><ul><li>Ultimately a technology like Google Wave is probably best for specialized situations where smaller-time collaboration is key, just as smaller groups in the physical world often can get more done, faster, simultaneously than larger ones. </li></ul>
    17. 17. Google Wave (ii)
    18. 18. Google Wave (iii)
    19. 19. XML Localization
    20. 20. Enabling technologies <ul><li>XSLT 2.0 – XSL Transformations </li></ul><ul><li>XQuery / XML database </li></ul><ul><ul><li>Mark Logic, Exist, Qizx en vele anderen </li></ul></ul><ul><ul><li>RDBMS met XML features </li></ul></ul><ul><li>XProc – een XML pijplijn taal </li></ul>
    21. 21. Localisatie standaarden
    22. 22. Waarom zijn XML standaarden van belang? <ul><li>Makkelijkere uitwisseling van gegevens </li></ul><ul><li>Makkelijkere conversies (XML als lingua franca) </li></ul><ul><li>Minder vatbaar voor lock-in door leveranciers en hun producten </li></ul>
    23. 23. De localisatiestandaarden <ul><li>ITS - Internationalization Tag Set </li></ul><ul><ul><li>XML bestanden voorbereiden voor vertaling </li></ul></ul><ul><ul><li>Wat moet er vertaald worden </li></ul></ul><ul><li>XLIFF – XML Localization Interchange Format </li></ul><ul><ul><li>Het ‘vervoermiddel’ voor vertaalbestanden </li></ul></ul><ul><ul><li>Beter geschikt voor vertaling dan willekeurige XML </li></ul></ul><ul><ul><li>Vb. ITS regels bepalen de omzetting naar XLIFF </li></ul></ul><ul><li>TMX – Translation Memory Exchange Format </li></ul><ul><ul><li>De vertaaldatabase geschikt als referentiemateriaal om nieuwe bestanden mee te vertalen </li></ul></ul><ul><li>TBX – Termbase Exchange Format </li></ul><ul><li>GMX – Globalization Metrics </li></ul>
    24. 24. XML Internationalization best practices <ul><li>I18N bepaalt voor een groot deel de kosten van vertaling. </li></ul><ul><li>Een selectie: </li></ul><ul><li>Vermijd vertaalbare attributen </li></ul><ul><li>Vermijd menging van code en tekst </li></ul><ul><li>Geef aan welke elementen wel/niet vertaald moeten worden </li></ul><ul><li>Vermijd multilingual documents </li></ul><ul><li>Specificeer de taal van de content </li></ul><ul><li>Vermijd CDATA secties </li></ul><ul><li>Meer over dit onderwerp op de W3C web site </li></ul>
    25. 25. ITS: Internationalization Tag Set <ul><li>W3C Recommendation 3 april 2007 </li></ul><ul><li>Nog geen brede ondersteuning </li></ul>
    26. 26. TMX: Translation Memory eXchange <ul><li>Lisa – the Localization Industry Standards Assocation </li></ul><ul><li>Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling) </li></ul>
    27. 27. TMX: Translation Memory eXchange <ul><li>Lisa – the Localization Industry Standards Assocation </li></ul><ul><li>Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling) </li></ul>
    28. 28. Wat is XLIFF? <ul><li>OASIS – 1.1 October 2003, 1.2 February 2008 </li></ul><ul><li>Inmiddels brede ondersteuning </li></ul><ul><li>Interoperabiliteit echter nog lastig </li></ul><ul><li>Een XLIFF document bevat: </li></ul><ul><ul><li>Vertaalsegmenten met bron tekst en doel tekst </li></ul></ul><ul><ul><li>Alternatieve vertalingen (bijv. fuzzy matches of vertalingen uit eerdere fases) </li></ul></ul><ul><ul><li>Administratieve metadata </li></ul></ul><ul><ul><li>Proces metadata </li></ul></ul><ul><ul><li>Vertaal instructies, opmerkingen </li></ul></ul>Een gestandaardiseerde manier om vertaalbare informatie als XML op te slaan.
    29. 29. XML Localization Interchange File Format
    30. 30. XML Localization Interchange File Format
    31. 31. XML Localization Interchange File Format
    32. 32. XML Localization Interchange File Format
    33. 33. Van XML naar XLIFF en terug <ul><li>Bron XML wordt opgesplitst in onvertaalbare (Skelet) en vertaalbare informatie (XLIFF) </li></ul><ul><li>De vertaalde XLIFF wordt samengevoegd met het Skelet om de vertaalde XML te verkrijgen. </li></ul>Bron XML vertaalde xml XLIFF Skelet XLIFF XLIFF vertaalde xml Vertaalde XML
    34. 34. XLIFF als spil van het vertaalproces <ul><li>Vertaalbestanden , Review spreadsheets, vertaalgeheugens worden uit XLIFF gegenereerd. </li></ul><ul><li>Vertalingen, correcties en andere informatie worden weer in de XLIFF opgeslagen. </li></ul>XLIFF Vertaalgeheugens (TMX) TagEditor (TTX) Excel (XLS)
    35. 35. een XML/XLIFF toepassing iCtrl Project Managers, Language Engineering Vertalers Reviewers Klant Bron XML Skelet Vertaalde XML Vertaalde XML Vertaalde XML Vertalingen in XLS Vertalingen in XLS Vertalingen in XLS Skelet Skelet XLIFF Skelet Skelet Vertaal-geheugens Skelet Skelet Correctie spreadsheets Skelet Skelet Trados TTX
    36. 36. XML Database
    37. 37. Links <ul><li>iCtrl </li></ul><ul><li>Wiki over localization standards (in aanbouw) </li></ul><ul><li>XML Internationalization best practices </li></ul><ul><li>XML Localization Interchange format (XLIFF) </li></ul><ul><li>Translation Memory eXchange (TMX) </li></ul><ul><li>Internationalization Tag Set (ITS) </li></ul>

    ×