Pourquoi le big data open source ?

Stefane Fermigier
Stefane FermigierFounder and CEO at Abilian
Le GTLL face au défi
du déluge des données
  Stefane Fermigier, Data Tuesday, fév. 2013
There is a tsunami of data that is crashing onto
 the beaches of the civilized world.This is a tidal
  wave of unrelated, growing data formed in bits
       and bytes, coming in an unorganized,
 uncontrolled, incoherent cacophony of foam. It's
 filled with flotsam and jetsam. It's filled with the
  sticks and bones and shells of inanimate and
animate life. None of it is easily related, none of it
   comes with any organizational methodology.
     Richard Saul Wurman, in “Information
                Architects” (1996)
Pourquoi le big data
  open source ?
Facteurs économiques




    Source: Michael Driscoll
Facteur technique
Pourquoi le big data open source ?
Pourquoi le big data
       open source ?
•   Expertise historique en scalabilité horizontale
    (cf. Beowulf, Google, etc.)

•   Majors de l’internet (cf. Google,Yahoo!,
    Facebook, Twitter) imprégnés de culture open
    source, et dont le business model tourne autour
    de l’accumulation des données

•   Efficience de l’open source comme modèle
    d’innovation ouverte, de développement et de
    diffusion de l’innovation
Pourquoi le big data open source ?
Pourquoi le big data open source ?
Mission du GT


“Développer l’écosystème du Libre
        en Ile-de-France”
17 Grands Groupes
                       65 PME/
                         ETI




         28 Etablissements
     de Recherche et Formation
Roadmap technologique




Distributed / Cloud   Embedded
Roadmap technologique


Dev. Tools   Middleware   Big / Open Data



 Distributed / Cloud        Embedded
Roadmap technologique
   Web 2.0 / 3.0          Enterprise Apps



Dev. Tools   Middleware     Big / Open Data



 Distributed / Cloud          Embedded
R&D collaborative depuis 5 ans


Projets: 33
Effort: 140 M€
Aide: 52 M€
3 “grands défis”

• Qualité logicielle
• “After PC”
• Déluge des données
Focus sur le Big Data
             Data Viz

           Indexation

   Traitement (MapReduce, etc.)

  Stockage (NoSQL, NewSQL)

      Collecte & injection

     Infra & sys. management
Pourquoi le big data open source ?
Plus d’infos




 Livre blanc disponible         Site Web:
sur www.fermigier.com     www.gt-logiciel-libre.org
1 of 19

Recommended

Ouverture des données publiques, à chacun ses enjeux! by
Ouverture des données publiques, à chacun ses enjeux!Ouverture des données publiques, à chacun ses enjeux!
Ouverture des données publiques, à chacun ses enjeux!eGov Innovation Center
1.1K views26 slides
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve... by
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...Charles Ruelle
2.8K views24 slides
CoDesign de data.gouv.fr à la Cantine Numérique Rennaise by
CoDesign de data.gouv.fr à la Cantine Numérique RennaiseCoDesign de data.gouv.fr à la Cantine Numérique Rennaise
CoDesign de data.gouv.fr à la Cantine Numérique RennaiseCharles Ruelle
2.9K views38 slides
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)" by
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Charles Ruelle
2.7K views19 slides
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé... by
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...Charles Ruelle
3.1K views42 slides
Une perspective européenne de l'impact du Big Data sur l'élaboration des poli... by
Une perspective européenne de l'impact du Big Data sur l'élaboration des poli...Une perspective européenne de l'impact du Big Data sur l'élaboration des poli...
Une perspective européenne de l'impact du Big Data sur l'élaboration des poli...Genève Lab
873 views20 slides

More Related Content

Viewers also liked

Demo Cup 2012 by
Demo Cup 2012Demo Cup 2012
Demo Cup 2012Stefane Fermigier
993 views6 slides
Nuxeo, an open source platform for content-centric business applications by
Nuxeo, an open source platform for content-centric business applicationsNuxeo, an open source platform for content-centric business applications
Nuxeo, an open source platform for content-centric business applicationsStefane Fermigier
1.1K views29 slides
Nuxeo EP 5 - A Seam Case Study by
Nuxeo EP 5 - A Seam Case StudyNuxeo EP 5 - A Seam Case Study
Nuxeo EP 5 - A Seam Case StudyStefane Fermigier
2.2K views30 slides
Jean-Paul Smets - Free Cloud Alliance by
Jean-Paul Smets - Free Cloud AllianceJean-Paul Smets - Free Cloud Alliance
Jean-Paul Smets - Free Cloud AllianceStefane Fermigier
930 views18 slides
Nuxeo Summer Seminar 2007 - Nuxeo Platform 5.1 (EN) by
Nuxeo  Summer Seminar 2007 -  Nuxeo Platform 5.1 (EN)Nuxeo  Summer Seminar 2007 -  Nuxeo Platform 5.1 (EN)
Nuxeo Summer Seminar 2007 - Nuxeo Platform 5.1 (EN)Stefane Fermigier
567 views39 slides
Four Python Pains by
Four Python PainsFour Python Pains
Four Python PainsStefane Fermigier
1.1K views32 slides

Viewers also liked(14)

Nuxeo, an open source platform for content-centric business applications by Stefane Fermigier
Nuxeo, an open source platform for content-centric business applicationsNuxeo, an open source platform for content-centric business applications
Nuxeo, an open source platform for content-centric business applications
Stefane Fermigier1.1K views
Nuxeo Summer Seminar 2007 - Nuxeo Platform 5.1 (EN) by Stefane Fermigier
Nuxeo  Summer Seminar 2007 -  Nuxeo Platform 5.1 (EN)Nuxeo  Summer Seminar 2007 -  Nuxeo Platform 5.1 (EN)
Nuxeo Summer Seminar 2007 - Nuxeo Platform 5.1 (EN)
Stefane Fermigier567 views
Nuxeo Corporate Presentation - April 2007 by Stefane Fermigier
Nuxeo Corporate Presentation - April 2007Nuxeo Corporate Presentation - April 2007
Nuxeo Corporate Presentation - April 2007
Stefane Fermigier533 views
Nuxeo Business and Technical Roadmap - Dec 2007 by Stefane Fermigier
Nuxeo Business and Technical Roadmap - Dec 2007Nuxeo Business and Technical Roadmap - Dec 2007
Nuxeo Business and Technical Roadmap - Dec 2007
Stefane Fermigier581 views
Some Scientific Challenges in the Cloud - Roberto Di Cosmo by Stefane Fermigier
Some Scientific Challenges in the Cloud - Roberto Di CosmoSome Scientific Challenges in the Cloud - Roberto Di Cosmo
Some Scientific Challenges in the Cloud - Roberto Di Cosmo
Stefane Fermigier880 views
Finance and Audit Predictive Analytics by Bob Samuels
Finance and Audit Predictive AnalyticsFinance and Audit Predictive Analytics
Finance and Audit Predictive Analytics
Bob Samuels4.5K views
Opensource Frameworks and BigData Processing by Amir Sedighi
Opensource Frameworks and BigData ProcessingOpensource Frameworks and BigData Processing
Opensource Frameworks and BigData Processing
Amir Sedighi6.6K views
The Synapse IoT Stack: Technology Trends in IOT and Big Data by InMobi Technology
The Synapse IoT Stack: Technology Trends in IOT and Big DataThe Synapse IoT Stack: Technology Trends in IOT and Big Data
The Synapse IoT Stack: Technology Trends in IOT and Big Data
InMobi Technology6.5K views

Similar to Pourquoi le big data open source ?

L'émergence d'une nouvelle filière de formation : data science by
L'émergence d'une nouvelle filière de formation : data scienceL'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data scienceKezhan SHI
1.7K views11 slides
Festival Online de la Data 2020 - La data devient l'affaire de tous by
Festival Online de la Data 2020 - La data devient l'affaire de tousFestival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tousAlexandra Loria
48 views36 slides
Besoin compétences-iconomie-et-question by
Besoin compétences-iconomie-et-questionBesoin compétences-iconomie-et-question
Besoin compétences-iconomie-et-questionRené MANDEL
604 views5 slides
Big Data ete learning Analytics by
Big Data ete learning AnalyticsBig Data ete learning Analytics
Big Data ete learning AnalyticsMokhtar Ben Henda
347 views16 slides
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io by
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.ioComment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.ioHervé Bourdon
236 views19 slides
Big Data Des méandres des outils au potentiel business by
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
1.8K views54 slides

Similar to Pourquoi le big data open source ?(20)

L'émergence d'une nouvelle filière de formation : data science by Kezhan SHI
L'émergence d'une nouvelle filière de formation : data scienceL'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data science
Kezhan SHI1.7K views
Festival Online de la Data 2020 - La data devient l'affaire de tous by Alexandra Loria
Festival Online de la Data 2020 - La data devient l'affaire de tousFestival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tous
Alexandra Loria48 views
Besoin compétences-iconomie-et-question by René MANDEL
Besoin compétences-iconomie-et-questionBesoin compétences-iconomie-et-question
Besoin compétences-iconomie-et-question
René MANDEL604 views
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io by Hervé Bourdon
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.ioComment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Hervé Bourdon236 views
Big Data Des méandres des outils au potentiel business by Mouhsine LAKHDISSI
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
Mouhsine LAKHDISSI1.8K views
Google case study by pellat
Google case studyGoogle case study
Google case study
pellat4.3K views
La data n’a pas besoin d’être « big » pour générer de la valeur by Microsoft Ideas
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
Microsoft Ideas1.3K views
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep... by Altares D&B
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Altares D&B1.2K views
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran... by Perrein Jean-Pascal
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...
Perrein Jean-Pascal1.5K views
AGMQ 2011 : Les données libres et le territoire by noucher
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
noucher578 views
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015 by IBM France Lab
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
IBM France Lab1.9K views
conférence/Conferentie - Big Data - Evoliris by Christina Galouzis
conférence/Conferentie -  Big Data - Evolirisconférence/Conferentie -  Big Data - Evoliris
conférence/Conferentie - Big Data - Evoliris
Christina Galouzis176 views
La plateforme OpenData 3.0 pour libérer et valoriser les données by Excelerate Systems
La plateforme OpenData 3.0 pour libérer et valoriser les données  La plateforme OpenData 3.0 pour libérer et valoriser les données
La plateforme OpenData 3.0 pour libérer et valoriser les données
Excelerate Systems1.6K views
Enjeux de la donnee 21 novembre18 by Laetitia Lycke
Enjeux de la donnee 21 novembre18Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18
Laetitia Lycke118 views
Introduction seminaire groupe flowline by pimp uncle
Introduction seminaire groupe flowlineIntroduction seminaire groupe flowline
Introduction seminaire groupe flowline
pimp uncle2.4K views
Introduction au BigData.pdf by ZkSadrati
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
ZkSadrati16 views
Introduction au BigData.pdf by ZkSadrati
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
ZkSadrati16 views

More from Stefane Fermigier

Pitch Abilian - Paris Open Source Summit 2015 by
Pitch Abilian - Paris Open Source Summit 2015Pitch Abilian - Paris Open Source Summit 2015
Pitch Abilian - Paris Open Source Summit 2015Stefane Fermigier
1.4K views43 slides
15 ans de politiques publiques du logiciel libre en France by
15 ans de politiques publiques du logiciel libre en France15 ans de politiques publiques du logiciel libre en France
15 ans de politiques publiques du logiciel libre en FranceStefane Fermigier
2.5K views43 slides
Créer une communauté open source: pourquoi ? comment ? by
Créer une communauté open source: pourquoi ? comment ?Créer une communauté open source: pourquoi ? comment ?
Créer une communauté open source: pourquoi ? comment ?Stefane Fermigier
1.8K views71 slides
L'open source professionnel - un business model open source by
L'open source professionnel - un business model open sourceL'open source professionnel - un business model open source
L'open source professionnel - un business model open sourceStefane Fermigier
2.3K views49 slides
Roadmap du GT Logiciel Libre 2013-2020 by
Roadmap du GT Logiciel Libre 2013-2020Roadmap du GT Logiciel Libre 2013-2020
Roadmap du GT Logiciel Libre 2013-2020Stefane Fermigier
5.9K views26 slides
Le MOOC powered by Abilian - Plateforme open source de MOOC by
Le MOOC powered by Abilian - Plateforme open source de MOOCLe MOOC powered by Abilian - Plateforme open source de MOOC
Le MOOC powered by Abilian - Plateforme open source de MOOCStefane Fermigier
4.8K views64 slides

More from Stefane Fermigier(20)

Pitch Abilian - Paris Open Source Summit 2015 by Stefane Fermigier
Pitch Abilian - Paris Open Source Summit 2015Pitch Abilian - Paris Open Source Summit 2015
Pitch Abilian - Paris Open Source Summit 2015
Stefane Fermigier1.4K views
15 ans de politiques publiques du logiciel libre en France by Stefane Fermigier
15 ans de politiques publiques du logiciel libre en France15 ans de politiques publiques du logiciel libre en France
15 ans de politiques publiques du logiciel libre en France
Stefane Fermigier2.5K views
Créer une communauté open source: pourquoi ? comment ? by Stefane Fermigier
Créer une communauté open source: pourquoi ? comment ?Créer une communauté open source: pourquoi ? comment ?
Créer une communauté open source: pourquoi ? comment ?
Stefane Fermigier1.8K views
L'open source professionnel - un business model open source by Stefane Fermigier
L'open source professionnel - un business model open sourceL'open source professionnel - un business model open source
L'open source professionnel - un business model open source
Stefane Fermigier2.3K views
Roadmap du GT Logiciel Libre 2013-2020 by Stefane Fermigier
Roadmap du GT Logiciel Libre 2013-2020Roadmap du GT Logiciel Libre 2013-2020
Roadmap du GT Logiciel Libre 2013-2020
Stefane Fermigier5.9K views
Le MOOC powered by Abilian - Plateforme open source de MOOC by Stefane Fermigier
Le MOOC powered by Abilian - Plateforme open source de MOOCLe MOOC powered by Abilian - Plateforme open source de MOOC
Le MOOC powered by Abilian - Plateforme open source de MOOC
Stefane Fermigier4.8K views
Pleniere du GT Logiciel Libre, janvier 2013 by Stefane Fermigier
Pleniere du GT Logiciel Libre, janvier 2013Pleniere du GT Logiciel Libre, janvier 2013
Pleniere du GT Logiciel Libre, janvier 2013
Stefane Fermigier599 views
Nuxeo on the Cloud - Nuxeo World 2011 by Stefane Fermigier
Nuxeo on the Cloud - Nuxeo World 2011Nuxeo on the Cloud - Nuxeo World 2011
Nuxeo on the Cloud - Nuxeo World 2011
Stefane Fermigier1.2K views
ECM Meets the Semantic Web - Nuxeo World 2011 by Stefane Fermigier
ECM Meets the Semantic Web - Nuxeo World 2011ECM Meets the Semantic Web - Nuxeo World 2011
ECM Meets the Semantic Web - Nuxeo World 2011
Stefane Fermigier1.6K views
GT Logiciel Libre - Convention Systematic 2011 by Stefane Fermigier
GT Logiciel Libre - Convention Systematic 2011GT Logiciel Libre - Convention Systematic 2011
GT Logiciel Libre - Convention Systematic 2011
Stefane Fermigier834 views
Challenges du recrutement pour un editeur de logiciel libre by Stefane Fermigier
Challenges du recrutement pour un editeur de logiciel libreChallenges du recrutement pour un editeur de logiciel libre
Challenges du recrutement pour un editeur de logiciel libre
Stefane Fermigier1.1K views
Plénière du GT Logiciel Libre - Février 2011 by Stefane Fermigier
Plénière du GT Logiciel Libre - Février 2011Plénière du GT Logiciel Libre - Février 2011
Plénière du GT Logiciel Libre - Février 2011
Stefane Fermigier373 views

Pourquoi le big data open source ?

  • 1. Le GTLL face au défi du déluge des données Stefane Fermigier, Data Tuesday, fév. 2013
  • 2. There is a tsunami of data that is crashing onto the beaches of the civilized world.This is a tidal wave of unrelated, growing data formed in bits and bytes, coming in an unorganized, uncontrolled, incoherent cacophony of foam. It's filled with flotsam and jetsam. It's filled with the sticks and bones and shells of inanimate and animate life. None of it is easily related, none of it comes with any organizational methodology. Richard Saul Wurman, in “Information Architects” (1996)
  • 3. Pourquoi le big data open source ?
  • 4. Facteurs économiques Source: Michael Driscoll
  • 7. Pourquoi le big data open source ? • Expertise historique en scalabilité horizontale (cf. Beowulf, Google, etc.) • Majors de l’internet (cf. Google,Yahoo!, Facebook, Twitter) imprégnés de culture open source, et dont le business model tourne autour de l’accumulation des données • Efficience de l’open source comme modèle d’innovation ouverte, de développement et de diffusion de l’innovation
  • 10. Mission du GT “Développer l’écosystème du Libre en Ile-de-France”
  • 11. 17 Grands Groupes 65 PME/ ETI 28 Etablissements de Recherche et Formation
  • 13. Roadmap technologique Dev. Tools Middleware Big / Open Data Distributed / Cloud Embedded
  • 14. Roadmap technologique Web 2.0 / 3.0 Enterprise Apps Dev. Tools Middleware Big / Open Data Distributed / Cloud Embedded
  • 15. R&D collaborative depuis 5 ans Projets: 33 Effort: 140 M€ Aide: 52 M€
  • 16. 3 “grands défis” • Qualité logicielle • “After PC” • Déluge des données
  • 17. Focus sur le Big Data Data Viz Indexation Traitement (MapReduce, etc.) Stockage (NoSQL, NewSQL) Collecte & injection Infra & sys. management
  • 19. Plus d’infos Livre blanc disponible Site Web: sur www.fermigier.com www.gt-logiciel-libre.org