A Lean Localization Machine (XML Holland 2009)

  • 630 views
Uploaded on

Presentation for XML Holland 2009 (available in Dutch only).

Presentation for XML Holland 2009 (available in Dutch only).

More in: Technology , Travel , Business
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
630
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
4
Comments
0
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • Het vertaalproces voor producten was en is voor het belangrijkste deel een ambacht. Inmiddels zijn technische Computer Aided Translation (CAT) tools zoals vertaalgeheugens gemeengoed. Innovaties en vernieuwingen zoals machinevertaling en nieuwe fenomenen zoals sociale netwerken en crowdsourcing spelen echter ook steeds vaker een rol. Volgens schattingen wordt ongeveer 6% van alle geschreven content vertaald. In een steeds verder globaliserende economie lijkt dit erg weinig. Belangrijkste belemmeringen om meer te vertalen zijn de kosten. Maar ook is het duidelijk dat de traditionele hands-on aanpak van het schuiven met bestanden tussen de vele partijen in een vertaalproces niet schaalbaar genoeg is om efficiënt de hedendaagse uitdagingen tegemoet te treden.   In een wat radicalere visie op het vertaalproces van de toekomst speelt standaardisatie een belangrijke rol. Het verlaagt de kosten, maakt uitwisseling tussen verschillende systemen eenvoudiger, reduceert lock-in etc. Er bestaan inmiddels XML standaarden die tezamen bijna het gehele vertaaltraject beslaan. Samen met andere innovaties en vernieuwingen vormen ze een goede basis voor het innoveren van vertaaltools en systemen van de toekomst.   In deze presentatie geven we naast een summier overzicht van de spanningen die het traditionele vertaalproces parten spelen ook een visie op het vertaalproces van de nabije toekomst ( a lean translation machine ) en een overzicht van een aantal XML gebaseerde lokalisatiestandaarden (ITS, XLIFF, TMX) en hoe ze met bekendere XML enabling technologies (XQuery, XSLT en XProc) in het vertaalproces ingepast kunnen worden.

Transcript

  • 1. Lean Localization Machine Marc van Grootel (iCtrl) XML User Group 12 November “ Publiceren in het tijdperk van Google, Apple en Amazon”
  • 2. Lean Translation Machine
    • Het traditionele vertaalproces
    • Welke uitdagingen zijn er beide de projecten van vandaag en morgen?
    • Is er een nieuwe visie nodig voor de vertaalprojecten van morgen?
    • Welke trends en vernieuwingen kunnen hierbij uitkomst bieden?
    • XML Internationalisatie en Localisatiestandaarden
  • 3. Introductie
    • 7+ jaren als localization engineer / engineering manager bij Bowne Global Solutions / Lionbridge
      • Localisatieprojecten (oa. MS Office, MSN, Navision, MedTronic)
      • Integraties CMS met vertaalportaal (oa. Dupont, Robeco)
      • Kwaliteitsverbetering door automatisering van localisatieprocessen
    • 3+ jaren als technisch consultant / ontwikkelaar / architect bij iCtrl
      • iCtrl is specialist in het creëren, vertalen, publiceren en beheren van productinformatie en procesbeschrijvingen
      • Documentatiesystemen (oa. architectuur van NedTrain systeem)
      • Localisatieprojecten (oa. TomTom, Yamaha)
      • Documentatie migratie trajecten (oa. Vanderlande)
      • Implementatie Scrum (een Agile methodologie)
    • 10+ jaren inzet van XML-technologieën
    • Generaliserend specialist
  • 4. Het traditionele vertaalproces
    • XML bestandsanalyse (oa. validatie)
    • XML configuratie vertaaltool
    • Referentiemateriaal verzamelen en analyseren
    • Vertaling
    • Review (Editing, Proofing)
    • Review/approval door de klant
    • Linguistische en technische kwaliteitscontroles
    • Vertaalde XML bestanden leveren
  • 5. De projecten van nu
    • Veel meer XML, maar ook nog altijd veel MS Word en Framemaker.
      • Slechte I18N vertaald zich in hogere kosten voor vertaling
    • Kleine volumes, veel kleine projecten, veel updates
      • Hierdoor komen proces inefficiënties genadeloos aan het licht
    • Technische randvoorwaarden de technische complexiteit van projecten is toegenomen.
      • Grens tussen software / documentatie vervaagd (bijvoorbeeld AJAX web-sites).
    • Verwachtingspatroon van de klant
      • Klant wil meer inzicht in projecten
  • 6. Hebben we een nieuwe visie nodig?
    • De traditionele aanpak van vertaalprojecten is niet langer meer houdbaar.
    • Traditionele aanpak zit echter nog ingebakken in veel tools en systemen.
    • Nieuwe informatie en communicatie technologie kan misschien oplossingen bieden.
    • Een visie die recente ontwikkelingen uit verschillende gebieden combineert kan ons hiervan losweken.
    • Zo’n visie kan richting geven aan de experimenten van vandaag en de oplossingen van morgen.
  • 7. laat ik een poging wagen...
  • 8. Het nieuwe vertaalplatform (i)
    • “ binnen vijf jaar bestaan er vertaalsystemen die bestaan uit een samenwerkings platform waarin alle betrokkenen samenwerken om producten te vertalen, nadruk ligt hierbij op communicatie tussen de teamleden. De werkwijze zal niet afgedwongen worden door een rigide workflow en elke vertaling (zin/paragraaf) kan individueel door het proces ‘stromen’ . ”
  • 9. Het nieuwe vertaalplatform (ii)
    • “ Het platform maakt gebruik van open standaarden en is service-geori ë nteerd . Via het platform kunnen verschillende services van derden naar behoefte gecombineerd worden. Routinewerk is zoveel mogelijk geautomatiseerd zodat men zich kan concentreren op het echte werk en kwaliteitscontroles zijn in de processen ingebakken – in plaats van door inspecties achteraf.”
  • 10. Traditioneel team en workflow
    • Sequentiële workflow met veel handoff’s
  • 11. Samenwerkingsplatform
    • Minder rigide workflow.
    • Team verbonden door moderne communicatietechnologie.
    • Het team werkt samen aan een project.
    • Werk ‘stroomt’ soepel door het systeem.
  • 12. Trends en nieuwe ontwikkelingen
  • 13. De vertaal gorilla’s
    • Zetten zwaar in op technologie, elk op hun eigen wijze. ... de ontwikkelingen gaan snel, en er zijn heel wat nieuwkomers die het goed doen.
    • SDL
      • Vertaaldiensten
      • Vertaalsystemen
      • Content Management – van vertaling naar content creatie
    • Lionbridge
      • Vertaaldiensten
      • Freeway platform, en nu Translation Workspace (GeoWorkz)
      • “ U krijgt de tools en wij uw vertaalwerk”
      • Integraties met Content Management Systemen
      • Recentelijk ook gebruik als ‘pay-as-you-go’ platform voor andere vertalers (PaaS)
  • 14. Technologische vernieuwingen
    • Machinevertalingen
    • Social Media / Social Networks
    • Open Data / Data sharing (TAUS)
    • Crowdsourcing
    • Google Wave
  • 15. Crowdsourcing
    • Facebook (1 – 100 talen in 2 jaar), Twitter
    • Is niet gratis: er is nog altijd PM, en supervisie nodig en misschien zelfs vergoeding voor vertalers
    • Is niet makkelijk, kun je genoeg vertalers aantrekken
    • Bottom up model versus top down
    • Levert interessante lessen en ervaringen op (de tijd zal het leren)
    • Een systeem dat geschikt is voor crowdsourcing past perfect in de geschetste visie.
  • 16. Google Wave?
    • Zeer interessant maar beetje gehyped.
    • Misschien niet de volgende email
    • Maar misschien wel specifieke toepassingen: bijvoorbeeld review en proofreading
    • Ultimately a technology like Google Wave is probably best for specialized situations where smaller-time collaboration is key, just as smaller groups in the physical world often can get more done, faster, simultaneously than larger ones.
  • 17. Google Wave (ii)
  • 18. Google Wave (iii)
  • 19. XML Localization
  • 20. Enabling technologies
    • XSLT 2.0 – XSL Transformations
    • XQuery / XML database
      • Mark Logic, Exist, Qizx en vele anderen
      • RDBMS met XML features
    • XProc – een XML pijplijn taal
  • 21. Localisatie standaarden
  • 22. Waarom zijn XML standaarden van belang?
    • Makkelijkere uitwisseling van gegevens
    • Makkelijkere conversies (XML als lingua franca)
    • Minder vatbaar voor lock-in door leveranciers en hun producten
  • 23. De localisatiestandaarden
    • ITS - Internationalization Tag Set
      • XML bestanden voorbereiden voor vertaling
      • Wat moet er vertaald worden
    • XLIFF – XML Localization Interchange Format
      • Het ‘vervoermiddel’ voor vertaalbestanden
      • Beter geschikt voor vertaling dan willekeurige XML
      • Vb. ITS regels bepalen de omzetting naar XLIFF
    • TMX – Translation Memory Exchange Format
      • De vertaaldatabase geschikt als referentiemateriaal om nieuwe bestanden mee te vertalen
    • TBX – Termbase Exchange Format
    • GMX – Globalization Metrics
  • 24. XML Internationalization best practices
    • I18N bepaalt voor een groot deel de kosten van vertaling.
    • Een selectie:
    • Vermijd vertaalbare attributen
    • Vermijd menging van code en tekst
    • Geef aan welke elementen wel/niet vertaald moeten worden
    • Vermijd multilingual documents
    • Specificeer de taal van de content
    • Vermijd CDATA secties
    • Meer over dit onderwerp op de W3C web site
  • 25. ITS: Internationalization Tag Set
    • W3C Recommendation 3 april 2007
    • Nog geen brede ondersteuning
  • 26. TMX: Translation Memory eXchange
    • Lisa – the Localization Industry Standards Assocation
    • Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling)
  • 27. TMX: Translation Memory eXchange
    • Lisa – the Localization Industry Standards Assocation
    • Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling)
  • 28. Wat is XLIFF?
    • OASIS – 1.1 October 2003, 1.2 February 2008
    • Inmiddels brede ondersteuning
    • Interoperabiliteit echter nog lastig
    • Een XLIFF document bevat:
      • Vertaalsegmenten met bron tekst en doel tekst
      • Alternatieve vertalingen (bijv. fuzzy matches of vertalingen uit eerdere fases)
      • Administratieve metadata
      • Proces metadata
      • Vertaal instructies, opmerkingen
    Een gestandaardiseerde manier om vertaalbare informatie als XML op te slaan.
  • 29. XML Localization Interchange File Format
  • 30. XML Localization Interchange File Format
  • 31. XML Localization Interchange File Format
  • 32. XML Localization Interchange File Format
  • 33. Van XML naar XLIFF en terug
    • Bron XML wordt opgesplitst in onvertaalbare (Skelet) en vertaalbare informatie (XLIFF)
    • De vertaalde XLIFF wordt samengevoegd met het Skelet om de vertaalde XML te verkrijgen.
    Bron XML vertaalde xml XLIFF Skelet XLIFF XLIFF vertaalde xml Vertaalde XML
  • 34. XLIFF als spil van het vertaalproces
    • Vertaalbestanden , Review spreadsheets, vertaalgeheugens worden uit XLIFF gegenereerd.
    • Vertalingen, correcties en andere informatie worden weer in de XLIFF opgeslagen.
    XLIFF Vertaalgeheugens (TMX) TagEditor (TTX) Excel (XLS)
  • 35. een XML/XLIFF toepassing iCtrl Project Managers, Language Engineering Vertalers Reviewers Klant Bron XML Skelet Vertaalde XML Vertaalde XML Vertaalde XML Vertalingen in XLS Vertalingen in XLS Vertalingen in XLS Skelet Skelet XLIFF Skelet Skelet Vertaal-geheugens Skelet Skelet Correctie spreadsheets Skelet Skelet Trados TTX
  • 36. XML Database
  • 37. Links
    • iCtrl
    • Wiki over localization standards (in aanbouw)
    • XML Internationalization best practices
    • XML Localization Interchange format (XLIFF)
    • Translation Memory eXchange (TMX)
    • Internationalization Tag Set (ITS)