Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Case study ECM content migration SharePoint and Livelink
1. Case study Capgemini Enterprise Content Management
Content uit Livelink en SharePoint 2007,
gekoppeld in SharePoint 2010
Yvo Booisma
ECM Lead Capgemini Nederland
yvo.booisma@capgemini.com
06-52159343
Capgemini Enterprise Content Management – The way we do IT
2. Na de fusie van de Nederlandse en Duitse regio’s van een grote energiemaatschappij stond de
organisatie voor de uitdaging van het samenvoegen van twee verschillende intranetten tot één
corporate intranet. De twee regio’s gebruikten verschillende bronsystemen voor hun intranet:
SharePoint 2007 en Livelink. De keuze voor het doelsysteem viel op SharePoint 2010.
De samenvoeging van de twee verschillende omgevingen met enkele duizenden pagina’s en
documenten met deels overlappende content betekende een complexe taak voor de
communicatieafdelingen van de twee regio’s. Capgemini heeft hierin een adviserende rol kunnen
spelen en de technische uitvoering van de contentmigratie voor haar rekening genomen.
Inventarisatie en extractie
Het uitgangspunt van het uiteindelijke migratieproces was de inventarisatie van SharePoint 2007 en
Livelink, de bronsystemen van de twee intranetten. Daarvoor zijn op locatie een aantal robots
ontwikkeld die de gehele voorkant van de twee omgevingen crawlen om zo alle toegankelijke
content in kaart te brengen. Ook is er een reconstructie van de structuur van de content in de
omgevingen gemaakt. Tijdens dit proces werd elke geïnventariseerde pagina en document
geëxtraheerd, inclusief aanwezige metadata.
Mapping
Op basis van de inventarisatie zijn twee sitemaps gegenereerd die de structuur van alle content
eenduidig inzichtelijk maakten. Hiermee openbaarde zich de grote uitdaging om die twee structuren
deels samen te voegen tot één overkoepelende structuur. Aangezien de twee bronsites verschillend
van taal waren, is ervoor gekozen om de overkoepelende structuur in het Engels te definiëren.
Zodoende ontstond er een drietalig doelsysteem, waarbij het Engels het gemeenschappelijke deel
vertegenwoordigde. Dit betekende dat op basis van de twee sitemaps drie doelstructuren gemaakt
moesten worden die opgesteld werden in drie mappingsheets. De grote uitdaging was om
overeenkomstige pagina’s uit de twee bronsystemen te koppelen als gelokaliseerde versies van
dezelfde content. Dit werd opgelost door overeenkomstige pagina’s in de Nederlandse en Duitse
mappingsheet te koppelen aan een overeenkomstige nieuwe pagina in de Engelse mappingsheet
middels een gedeelde mapping ID.
De grote uitdaging was om overeenkomstige pagina’s uit de twee bronsystemen te koppelen als
gelokaliseerde versies van dezelfde content
Naast het herdefiniëren van de sitestructuur, werden ook de contenttypen opnieuw gedefinieerd.
Om de gegevens uit alle velden uit de bronsystemen te migreren naar de overeenkomstige velden in
het doelsysteem, is er ook een mapping gemaakt van oude naar nieuwe contenttypen en de
bijbehorende velden.
Transformatie
Nadat alle pagina’s op de gewenste posities in de mappingsheets gezet waren, kon de import naar
het doelsysteem voorbereid worden. In deze fase hebben alle pagina’s een aantal
transformatiestappen ondergaan: Case study – Content uit Livelink en SharePoint 2007, gekoppeld in
SharePoint 2010 2
Capgemini Enterprise Content Management – The way we do IT
3. Opschonen
Tussen de twee bronsystemen bestonden grote verschillen in de wijze waarin content opgemaakt
was. Ook binnen hetzelfde bronsysteem waren er soms grote variaties in de lay-out van de artikelen.
Daarom hebben alle pagina’s een geautomatiseerde schoonmaakbeurt ondergaan waabij alle
uitwassen uit de bron HTML verwijderd is, en uiteindelijk schone en consistente XHTML is
opgeleverd.
Verrijken
Naast het opschonen van de content is deze ook verrijkt met metadata die niet in de doelsystemen
aanwezig waren. Deze metadata kon eenvoudig door de redactie per pagina aan de drie
mappingsheets toegevoegd worden. Dit scheelde de redactie een grote nabewerkingsklus.
Conversie naar XML
De laatste transformatiestap was een conversie naar XML. Hierbij zijn alle pagina’s omgezet naar een
specifiek XML formaat zodat deze in een later stadium eenvoudig ingelezen konden worden door de
importer. Ook de mappingsheets waarin de structuur gedefinieerd is, zijn omgezet naar een XML
formaat, zodat ook deze verwerkt konden worden tijdens de import.
Import
Voor de uiteindelijke import naar SharePoint 2010 heeft Capgemini een generieke importer
ontwikkeld die rechtstreeks met de SharePoint API communiceert. Deze importer leest de
getransformeerde XML in en maakt op basis daarvan de pagina’s, subsites en documenten aan in
SharePoint 2010. Ook controleert de importer alle content op links, en worden alle interne
verwijzingen bijgewerkt.
Op deze manier werd de geautomatiseerde contentmigratie naar SharePoint 2010 uiteindelijk
gerealiseerd. Na afloop van de migratie werd er voor elke taal een testsheet opgeleverd waarin voor
elke pagina in de doelstructuur de url van de pagina in het bronsysteem en in SharePoint 2010
weergegeven werd. Dit bleek uiteindelijk een uitstekende referentie voor de testers om de content
in de bron- en doelsystemen met elkaar te vergelijken.
Resultaat
De gehanteerde methode van automatische content migratie heeft geleidt tot:
Geen Content Freeze periode;
Gebruikers hebben geen last ervaren;
Nauwelijks uitval van content tijdens de migratie (<0,5%);
De migratieperiode was significant korter dan een traditionele methode;
De kosten voor de conversie waren significant lager dan alternatieve methoden en
aanbieders.
Capgemini Enterprise Content Management – The way we do IT