• Save
Open Source Business Intelligence - TDWI 2007
Upcoming SlideShare
Loading in...5
×
 

Open Source Business Intelligence - TDWI 2007

on

  • 2,640 views

 

Statistics

Views

Total Views
2,640
Views on SlideShare
2,629
Embed Views
11

Actions

Likes
2
Downloads
0
Comments
0

1 Embed 11

http://www.slideshare.net 11

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Open Source Business Intelligence - TDWI 2007 Open Source Business Intelligence - TDWI 2007 Presentation Transcript

    • Open Source Business Intelligence – Grundlagen, Marktüberblick, Produktevaluationen, Chancen & Risiken – Christian Schieder TDWI Jahrestagung 2007 München 13. 06. 2007 1
    • Conference Review TDWI 2007: Focus Open Source Open Source Business Intelligence  Stephen Brobst („The Future of DW“): Within 5 years Open Source components will be commodity in BI-Infrastructure.  Mike Ferguson („Pervasive BI“): Open Source BI is putting major pressure on Cost of BI.  Frank Buytendijk („The Future of PM“): Open Standards utilization is crucial for DW-architecture success.  Larissa Moss („Extreme Scoping“): We need more agility in DW-projects. Christian Schieder Open Source Business Intelligence 2 TDWI Jahrestagung, München 2007
    • Open Source Paradebeispiel Apache Webserver (I) Open Source Business Intelligence 80% Apache 40% IIS 0% 1995 1997 1999 2001 2003 2005 2007 Relative Marktanteile im Webservermarkt (Anteil gehosteter Websiten global) Quelle: http://news.netcraft.com/archives/web_server_survey.html Christian Schieder Open Source Business Intelligence 3 TDWI Jahrestagung, München 2007
    • Open Source Paradebeispiel Apache Webserver (II) Open Source Business Intelligence 31 Mio. Apache 15 Mio. IIS 0 2000 2001 2002 2003 2004 2005 2006 2007 Absolute Marktanteile im Webservermarkt (Anzahl gehosteter Websiten global) Quelle: http://news.netcraft.com/archives/web_server_survey.html Christian Schieder Open Source Business Intelligence 4 TDWI Jahrestagung, München 2007
    • Bekannte OS-Beispiele Open Source Business Intelligence Christian Schieder Open Source Business Intelligence 5 TDWI Jahrestagung, München 2007
    • Open Source in aller Munde Open Source Business Intelligence * * Kleijn, A. : Business Intelligence mit Open Source, Heise open / Markt, Juni 2006, http://www.heise.de/open/artikel/73725 Christian Schieder Open Source Business Intelligence 6 TDWI Jahrestagung, München 2007
    • Open Source BI im Gartner Hype Cycle Open Source Business Intelligence visibility Virtual Data Federation/EII Dashboards/Scorecards Corporate Performance Management BAM/Real-Time BI SOA-Enabled BI EBISs Convergence ETL EBIS/BI Platforms Web Tools Analytics Advanced Production/ Analytics OLAP Formatted/ Collaborative BI Data Warehouse BI Platforms Web Appliance Metadata Tools Reporting Embedded Analytics Data Mining Workbenches Open Source BI ETL Embedded Visual BI Text Mining in DBMS Development Open Source DBMS ODBO/MDX and XML for Analysis Standard Tools Data Quality Cross-Enterprise Business 64-bit Analytics B2B BI Application Hardware Extranets Data Warehouses Analytical Process Controlling As of July 2005 Peak of Technology Trough of Plateau of Inflated Slope of Enlightenment Trigger Disillusionment Productivity Expectations maturity Plateau will be reached in: obsolete less than 2 years 2 to 5 years 5 to 10 years more than 10 years before plateau Quelle: Gartner 2005 Christian Schieder Open Source Business Intelligence 7 TDWI Jahrestagung, München 2007
    • Gliederung Open Source Business Intelligence 1. Einleitung & Grundlagen 2. Marktüberblick 3. Szenarien & Bedingungen für den Einsatz von Open Source Business Intelligence 4. Zusammenfassung & Ausblick Christian Schieder Open Source Business Intelligence 8 TDWI Jahrestagung, München 2007
    • Gliederung Open Source Business Intelligence 1. Einleitung & Grundlagen 2. Marktüberblick 3. Szenarien & Bedingungen für den Einsatz von Open Source Business Intelligence 4. Zusammenfassung & Ausblick Christian Schieder Open Source Business Intelligence 9 TDWI Jahrestagung, München 2007
    • Entwicklung des Open Source Phänomens (I) 1. Einleitung & Grundlagen  Entstehung des GNU-Projektes (1983)  Gründung der gemeinnützigen „Free Software Foundation“ (1985 – R. Stallman) 1980  Hersteller beenden Praxis des SW-Bundlings, Software wird zur Ware  Anfänge der Software-Industrie und (wissenschaftlich geprägter) Hacker-Communities 1970 1960  Am Anfang war (fast) alle Software frei  Hardwarehersteller geben Software zum Betrieb ihrer Hardware gratis und offen dazu (SW-Bundling) Christian Schieder Open Source Business Intelligence 10 TDWI Jahrestagung, München 2007
    • Entwicklung des Open Source Phänomens (II) 1. Einleitung & Grundlagen  Pragmatismus vs. Idealismus  Adoleszenz und Kommerzialisierung des Open Source Phänomens ?  Beginn der OSS 2.0-Ära (Fitzgerald)  Übertragung der OS-Prinzipien 2000 auf andere Bereiche (z.B. Open Content, Marketing)  Entstehung von GNU/Linux (1991 – Torvalds) 1990  Etablierung einer weltweiten Community von Programmieren (Verbreitung des Internet)  Gründung der „Open Source Initiative“ (1998 – Begriff „Open Source“) Christian Schieder Open Source Business Intelligence 11 TDWI Jahrestagung, München 2007
    • Open Source: Definition 1. Einleitung & Grundlagen Die Open Source Initiative wendet den Begriff Open Source auf all die Software an, deren Lizenzverträge den folgenden drei charakteristischen Merkmalen entsprechen:  Die Software (d. h. der Quelltext) liegt in einer für den Menschen lesbaren und verständlichen Form vor.  Die Software darf beliebig kopiert, verbreitet und genutzt werden.  Die Software darf verändert und in der veränderten Form weitergegeben werden. Quelle: http://de.wikipedia.org/wiki/Open_source Christian Schieder Open Source Business Intelligence 12 TDWI Jahrestagung, München 2007
    • Open Source: Spezifika 1. Einleitung & Grundlagen  Entwicklungsmodell  Hybrides Modell: formale und agile Elemente (Cathedral vs. Bazaar)1  Paradigmen: Kollaboration, Iteration, Modularisierung  “Community“-Phänomen  Lizenzierungsmodell  Copy-Right vs. Copy-Left  Im Business Intelligence Bereich häufig Dual Licensing 1 Raymond, E. (1997): The Cathedral and the Bazaar, http://www.catb.org/~esr/writings/cathedral-bazaar/cathedral-bazaar/ Christian Schieder Open Source Business Intelligence 13 TDWI Jahrestagung, München 2007
    • Open Source: Copy Left 1. Einleitung & Grundlagen Art des Starkes Copyleft Schwaches Copyleft Kein Copyleft Copyleft statisches und dynamisches Linken Kombinations- von Code mit Keine Vorgaben. möglichkeit keine Einbindung in proprietärer Software Der gesamte Code darf mit proprietären Code möglich. auch als proprietäre proprietärer möglich Eigen-Entwicklungen Software Software dürfen als proprietäre weitergegeben werden Software weitergegeben werden Beispiel-Lizenz GPL LGPL, MPL BSD, Apache Quelle: http://www.heise.de/open/artikel/75786 Christian Schieder Open Source Business Intelligence 14 TDWI Jahrestagung, München 2007
    • Open Source Lizenzen 1. Einleitung & Grundlagen Ungefähre Verteilung der Lizenzen im Open 12,5% 1,8% 8,0% Source Repository 7,7% Sourceforge: 70,0% GPL LGPL MPL BSD Andere Quelle: http://www.heise.de/open/artikel/75786/1 Christian Schieder Open Source Business Intelligence 15 TDWI Jahrestagung, München 2007
    • Warum Open Source funktioniert… 1. Einleitung & Grundlagen  Das Wesen von Software als öffentliches Gut  Kein Trittbrettfahrerproblem  Übernutzung nicht möglich  Positive Netzwerkeffekte (z.B. odf-Format von OpenOffice)  Motivatoren  Reputation  Lernen  Ideologie Christian Schieder Open Source Business Intelligence 16 TDWI Jahrestagung, München 2007
    • Warum Open Source funktioniert: Geschäftsmodelle 1. Einleitung & Grundlagen  Value-Added/Service-Enabling Model  Integration und Konfiguration von OS-Komponenten und Service/Support-Angebot  OSS-Beispiele: Suse, Red Hat  OSBI-Beispiele: Pentaho, SpagoBI, JasperIntelligence  Loss-Leader/Market-Creation Model  Vertrieb von OSS mit Ziel Up-/ Cross-Selling von closed source Software  OSS-Beispiele: IBM (Eclipse), MySQL (MySQL Enterprise Ed.)  OSBI-Beispiele: Actuate (Birt), Jedox (Palo) Vgl. Fitzgerald, B. 2006. The Transformation of Open Source Software. MIS Quarterly, 30 (3), S. 587–598. Christian Schieder Open Source Business Intelligence 17 TDWI Jahrestagung, München 2007
    • Gliederung Open Source Business Intelligence 1. Einleitung & Grundlagen 2. Marktüberblick 3. Szenarien & Bedingungen für den Einsatz von Open Source Business Intelligence 4. Zusammenfassung & Ausblick Christian Schieder Open Source Business Intelligence 18 TDWI Jahrestagung, München 2007
    • De facto Standard für BI-Architekturen 2. Marktüberblick Data Data Warehouse System Analytical Presentation Acquisition Layer Layer Layer DWH Layer Staging Layer ETL ETL ETL SQL based SQL based Bulk Load Insert/select Insert/select View build Performance Star-Schema Objects File System Quelle: IBM Christian Schieder Open Source Business Intelligence 19 TDWI Jahrestagung, München 2007
    • Gliederung Open Source Business Intelligence 1. Einleitung & Grundlagen 2. Marktüberblick 2.1 Datenbanken 2.2 Datenintegration 2.3 Analyse 2.4 Präsentation 2.5 Plattformen 3. Szenarien & Bedingungen für den Einsatz von Open Source Business Intelligence 4. Zusammenfassung & Ausblick Christian Schieder Open Source Business Intelligence 20 TDWI Jahrestagung, München 2007
    • De facto Standard für BI-Architekturen 2.1 Marktüberblick.Datenbanken Data Data Warehouse System Analytical Presentation Acquisition Layer Layer Layer DWH Layer Staging Layer ETL ETL ETL SQL based SQL based Bulk Load Insert/select Insert/select View build Performance Star-Schema Objects File System Quelle: IBM Christian Schieder Open Source Business Intelligence 21 TDWI Jahrestagung, München 2007
    • Datenbanken 2.1 Marktüberblick.Datenbanken  MySQL “most popular“  PostgreSQL “most advanced“  Ingres “most ranked“  MaxDB “most supported“  Firebird fgh “most challenging“ Christian Schieder Open Source Business Intelligence 22 TDWI Jahrestagung, München 2007
    • Open Source Datenbanken im Einsatz 2.1 Marktüberblick.Datenbanken Christian Schieder Open Source Business Intelligence 23 TDWI Jahrestagung, München 2007
    • Open Source Datenbanken im Feature-Vergleich (I) 2.1 Marktüberblick.Datenbanken Firebird Ingres MaxDB MySQL PostgreSQL Version v.2.0.1 v.9.0.4 v.7.6 v.5.1 v.8.2 Datenintegrität ACID-Transaktionen Ja Ja Ja Ja Ja 2-phasiges Commit Ja Ja Nein Ja Ja Fremdschlüssel Ja Ja Ja Ja Ja CHECK-Bedingung Ja Nein Ja Nein Ja Savepoints Ja Ja Ja Ja Ja MVCC und MVCC und MVCC und Locking MVCC zeilenweise zeilenweise zeilenweise zeilenweise Datenbankobjekte Schema Nein Ja Ja Ja Ja Temporäre Tabellen Nein Ja Ja Ja Ja Stored Procedures Ja Ja Ja Ja Ja Trigger Before/After After After Before/After Before/After View Ja Ja Ja Ja Ja Materialized View Coded Ja Coded Coded Coded Updatable View Ja Nein Ja Ja Ja Expression Index Ja Ja Nein Nein Ja Partial Index Nein Nein Nein Nein Ja Bitmap Index Nein Ja Nein Nein Ja Volltext Index Nein Nein Nein Ja Ja Christian Schieder Quelle: Horstmann, J. (2006), Freie Datenbanken im unternehmenseinsatz: Analyse und Vergleich der Open Source Business Intelligence wichtigsten Open-Source-Datenbanken, in: Open-Source-Jahrbuch 2006, S. 193. 24 TDWI Jahrestagung, München 2007
    • Open Source Datenbanken im Feature-Vergleich (I) 2.1 Marktüberblick.Datenbanken Firebird Ingres MaxDB MySQL PostgreSQL Version v.2.0.1 v.9.0.4 v.7.6 v.5.1 v.8.2 Datenintegrität ACID-Transaktionen Ja Ja Ja Ja Ja 2-phasiges Commit Ja Ja Nein Ja Ja Fremdschlüssel Ja Ja Ja Ja Ja CHECK-Bedingung Ja Nein Ja Nein Ja Savepoints Ja Ja Ja Ja Ja MVCC und MVCC und MVCC und Locking MVCC zeilenweise zeilenweise zeilenweise zeilenweise Datenbankobjekte Schema Nein Ja Ja Ja Ja Temporäre Tabellen Nein Ja Ja Ja Ja Stored Procedures Ja Ja Ja Ja Ja Trigger Before/After After After Before/After Before/After View Ja Ja Ja Ja Ja Materialized View Coded Ja Coded Coded Coded Updatable View Ja Nein Ja Ja Ja Expression Index Ja Ja Nein Nein Ja Partial Index Nein Nein Nein Nein Ja Bitmap Index Nein Ja Nein Nein Ja Volltext Index Nein Nein Nein Ja Ja Christian Schieder Quelle: Horstmann, J. (2006), Freie Datenbanken im unternehmenseinsatz: Analyse und Vergleich der Open Source Business Intelligence wichtigsten Open-Source-Datenbanken, in: Open-Source-Jahrbuch 2006, S. 193. 25 TDWI Jahrestagung, München 2007
    • Open Source Datenbanken im Feature-Vergleich (II) 2.1 Marktüberblick.Datenbanken Firebird Ingres MaxDB MySQL PostgreSQL Version v.2.0.1 v.9.0.4 v.7.6 v.5.1 v.8.2 SQL, Datentypen SQL-Standard 92, 99 92, 99 92 92, 99 92, 99, 03 Nutzerdef. Typen Nein Ja Nein Nein Ja Nutzerdef. Funktionen Ja Ja Ja Ja Ja GIS Nein Ja Nein Ja Ja Boolean Nein Nein Ja Nein Ja Sub-Select Ja Ja Ja Ja Ja Full Outer Join Ja Ja Ja Nein Ja Betrieb Multi-Threading Ja Ja Ja Ja Nein Multi-Processing Ja Ja Ja Ja Ja Abfrage-Parallelisierung Nein Ja Ja Ja Nein Replikation Ja Ja Ja Ja Ja Multimaster Repl. Ja Ja Nein Nein Nein Clustering Nein Ja Ja Ja Nein Load Balancing Nein Ja Nein Ja Nein Tablespaces Nein Nein Nein Ja Ja Partitionierung Nein Ja Nein Ja Ja Point-In-Time Recovery Nein Ja Ja Ja Ja Christian Schieder Quelle: Horstmann, J. (2006), Freie Datenbanken im unternehmenseinsatz: Analyse und Vergleich der Open Source Business Intelligence wichtigsten Open-Source-Datenbanken, in: Open-Source-Jahrbuch 2006, S. 193. 26 TDWI Jahrestagung, München 2007
    • Open Source Datenbanken im Feature-Vergleich (II) 2.1 Marktüberblick.Datenbanken Firebird Ingres MaxDB MySQL PostgreSQL Version v.2.0.1 v.9.0.4 v.7.6 v.5.1 v.8.2 SQL, Datentypen SQL-Standard 92, 99 92, 99 92 92, 99 92, 99, 03 Nutzerdef. Typen Nein Ja Nein Nein Ja Nutzerdef. Funktionen Ja Ja Ja Ja Ja GIS Nein Ja Nein Ja Ja Boolean Nein Nein Ja Nein Ja Sub-Select Ja Ja Ja Ja Ja Full Outer Join Ja Ja Ja Nein Ja Betrieb Multi-Threading Ja Ja Ja Ja Nein Multi-Processing Ja Ja Ja Ja Ja Abfrage-Parallelisierung Nein Ja Ja Ja Nein Replikation Ja Ja Ja Ja Ja Multimaster Repl. Ja Ja Nein Nein Nein Clustering Nein Ja Ja Ja Nein Load Balancing Nein Ja Nein Ja Nein Tablespaces Nein Nein Nein Ja Ja Partitionierung Nein Ja Nein Ja Ja Point-In-Time Recovery Nein Ja Ja Ja Ja Christian Schieder Quelle: Horstmann, J. (2006), Freie Datenbanken im unternehmenseinsatz: Analyse und Vergleich der Open Source Business Intelligence wichtigsten Open-Source-Datenbanken, in: Open-Source-Jahrbuch 2006, S. 193. 27 TDWI Jahrestagung, München 2007
    • Open Source Datenbanken: Forrester-Studie 2006 2.1 Marktüberblick.Datenbanken  MySQL  Ausgeglichen in allen DBMS-Features  Datenbankapplikationen und Hauptspeicherdatenbanken  Einfachheit der Benutzung  Ingres  Transaktions- und Data Warehouse Support  Programmierbarkeit  Verfügbarkeit & Sicherheit  PostgreSQL  Data Warehousing  Datentypen & Schnittstellen  Programmierbarkeit  Vielfalt der unterstützten Plattformen Quelle: Datenbankspektrum, 6. Jahrgang, Heft 19, November 2006 Christian Schieder Open Source Business Intelligence 28 TDWI Jahrestagung, München 2007
    • Weitere Informationen zu (Open Source) Datenbanken 2.1 Marktüberblick.Datenbanken  http://en.wikipedia.org/wiki/Comparison_of_relational_database _management_systems  http://www.heise.de/open/artikel/70100/0 (Open Source Jahrbuch 2006)  http://www.datenbank- spektrum.de/v2/archiv/produkte.html?nummer=19&id=2 (Datenbank Spektrum 19/2006 & 22/2007 [August!]) Christian Schieder Open Source Business Intelligence 29 TDWI Jahrestagung, München 2007
    • De facto Standard für BI-Architekturen 2.2 Marktüberblick.Datenintegration Data Data Warehouse System Analytical Presentation Acquisition Layer Layer Layer DWH Layer Staging Layer ETL ETL ETL SQL based Bulk Load SQL based Insert/select Insert/select View build Performance Star-Schema Objects File System Quelle: IBM Christian Schieder Open Source Business Intelligence 30 TDWI Jahrestagung, München 2007
    • ETL/EII 2.2 Marktüberblick.Datenintegration  Kettle  Talend Open Studio  CloverETL  KETL  Mule Christian Schieder Open Source Business Intelligence 31 TDWI Jahrestagung, München 2007
    • Projektsteckbrief Pentaho Data Integration 2.2 Marktüberblick.Datenintegration Pentaho Data Integration (Kettle)  Aktuelles Release: v.2.5.0  Lizenz: MPL  Kurzbeschreibung: Pentaho Data Integration delivers powerful Extraction, Transformation and Loading (ETL) capabilities using an innovative, metadata-driven approach. The ease of use in our graphical, drag-and-drop design increases productivity and our extensible, standards based architecture ensures that you will never be forced to adopt proprietary methodologies into your ETL solution.  Entwickler: Pentaho Inc., Orlando, Florida, USA  Projektbeginn: 2005 (2002)  Projektseite: http://kettle.pentaho.org/  Bemerkungen:  Reifstes OS ETL Tool  Bestandteil der Pentaho Suite  4 Komponenten: Spoon, Pan, Chef, Kitchen Christian Schieder Open Source Business Intelligence 32 TDWI Jahrestagung, München 2007
    • Bestandteile Pentaho Data Integration 2.2 Marktüberblick.Datenintegration Christian Schieder Open Source Business Intelligence 33 TDWI Jahrestagung, München 2007
    • Projektsteckbrief Talend Open Studio 2.2 Marktüberblick.Datenintegration Talend Open Studio  Aktuelles Release: v.2.0.0  Lizenz: GPL  Kurzbeschreibung: Talend Open Studio provides advanced capabilities to improve the productivity of data integration job design and proven scalability to ensure optimal execution. It is the most open, innovative and powerful data integration solution on the market today. It contains a Business Modeler, a Job Designer, a Metadata Repository and a scheduler. In selecting Java as the development language of Talend Open Studio, by relying on Java, Perl and SQL code generation, and by completely opening the solution, Talend is committed to the support of open standards that ensure the robustness of its products and services.  Entwickler: Talend SA, Frankreich  Projektbeginn: 2006 (2003)  Projektseite: http://www.talend.com  Bemerkungen:  Entwickler sind ehemalige Data Stage/Informatica ETL Consultants  Online Tutorials  Look&Feel am ehesten mit kommerziellen Produkten vegleichbar  Bestandteil von Spago BI & Jasper Intelligence Suite (Jasper ETL) Christian Schieder Open Source Business Intelligence 34 TDWI Jahrestagung, München 2007
    • Bestandteile von Talend Open Studio 2.2 Marktüberblick.Datenintegration Christian Schieder Open Source Business Intelligence 35 TDWI Jahrestagung, München 2007
    • Talend Open Studio vs. Data Integration Services 2.2 Marktüberblick.Datenintegration …extrem parallel ETL„ing… Christian Schieder Open Source Business Intelligence 36 TDWI Jahrestagung, München 2007
    • Open Source Service Bus “Mule” 2.2 Marktüberblick.Datenintegration Mule  Aktuelles Release: v.1.4.1  Lizenz: MPL-style  Kurzbeschreibung: Mule is the leading open source ESB (Enterprise Service Bus) and integration platform. It is a scalable, highly distributable object broker that can seamlessly handle interactions with services and applications using disparate transport and messaging technologies. Mule is a light-weight messaging framework. The Mule framework provides a highly scalable environment in which you can deploy your business components.  Entwickler: MuleSource & Community  Projektbeginn: 2006 (2005)  Projektseite: http://mule.codehaus.org/  Bemerkungen:  Viel beachtetes und prämiertes Projekt  Mittlerweile eigene Konferenz  Ziel: Unterstützung für Event-driven Systems (Next Generation SOA) Christian Schieder Open Source Business Intelligence 37 TDWI Jahrestagung, München 2007
    • Architekturüberblick Mule 2.2 Marktüberblick.Datenintegration Christian Schieder Open Source Business Intelligence 38 TDWI Jahrestagung, München 2007
    • De facto Standard für BI-Architekturen 2.3 Marktüberblick.Analyse Data Data Warehouse System Analytical Presentation Acquisition Layer Layer Layer DWH Layer Staging Layer ETL ETL ETL SQL based Bulk Load SQL based Insert/select Insert/select View build Performance Star-Schema Objects File System Quelle: IBM Christian Schieder Open Source Business Intelligence 39 TDWI Jahrestagung, München 2007
    • OLAP 2.3 Marktüberblick.Analyse  Mondrian  PALO  JPivot  Cubulus OLAP Christian Schieder Open Source Business Intelligence 40 TDWI Jahrestagung, München 2007
    • Projektsteckbrief Mondrian 2.3 Marktüberblick.Analyse Mondrian  Aktuelles Release: v.2.3.2  Lizenz: MPL  Kurzbeschreibung: Mondrian is an OLAP (online analytical processing) database written in Java. It reads from JDBC data sources, aggregates data in a memory cache, and implements the MDX language and XML/A API.  Entwickler: Pentaho Inc., Orlanda, Florida, USA  Projektbeginn: 2001  Projektseite: http://mondrian.pentaho.org/  Bemerkungen:  Open Source ROLAP Server  Schwesterprojekt jPivot als Front-End (http://jpivot.sourceforge.net/ )  Bestandteil der Pentaho Plattform Christian Schieder Open Source Business Intelligence 41 TDWI Jahrestagung, München 2007
    • Architekturschema Mondrian 2.3 Marktüberblick.Analyse Quelle:http://mondrian.pentaho.org/ documentation/architecture.php Christian Schieder Open Source Business Intelligence 42 TDWI Jahrestagung, München 2007
    • Projektsteckbrief Palo 2.3 Marktüberblick.Analyse Palo  Aktuelle Release: v.1.5.0  Lizenz: GPL + Kommerziell  Kurzbeschreibung: Palo-Server is a cell-oriented, multi-dimensional data server, specifically developed for spreadsheet data storage and analysis. Palo-Server provides a central database for Enterprise Spreadsheets in Microsoft Excel and offers interfaces to many third-party databases provided by SAP, IBM, Microsoft and Oracle.  Entwickler: Jedox GmbH, Freiburg  Projektbeginn: 2004  Projektseite: http://www.palo.net  Bemerkungen:  Einziger Open Source MOLAP Server  Excel Plug-In (Front-End) als Freeware verfügbar (Portierung auf Open Office findet derzeit statt => erster vollständiger Open Source MOLAP Stack in Reichweite: http://sourceforge.net/projects/palooca/)  Kommerzielles ETL Werkzeug Cubeware Importer unterstützt PALO (auch als Freeware verfügbar: http://www.imppalo.com/) Christian Schieder Open Source Business Intelligence 43 TDWI Jahrestagung, München 2007
    • Architekturschema eines Palo-basierten MOLAP-Systems 2.3 Marktüberblick.Analyse Palo Excel Integration MS Excel® Betriebssystem Windows Palo Data Server Betriebssystem Windows / Linux Cubeware Importer ImpPalo Daten Christian Schieder Open Source Business Intelligence 44 TDWI Jahrestagung, München 2007
    • OLAP - LiveDemo: Palo 2.3 Marktüberblick.Analyse Christian Schieder Open Source Business Intelligence 45 TDWI Jahrestagung, München 2007
    • Data Mining 2.3 Marktüberblick.Analyse  WEKA  RapidMiner  KNIME Christian Schieder Open Source Business Intelligence 46 TDWI Jahrestagung, München 2007
    • Projektsteckbrief RapidMiner (I) 2. Marktüberblick RapidMiner (Yale)  Aktuelles Release: v.4.0.0 [Yale v.3.5.0]  Lizenz: GPL + Kommerziell  Kurzbeschreibung: Yale is an environment for machine learning and data mining experiments. It allows experiments to be made up of a large number of arbitrarily nestable operators and they are described in XML files which can easily be created with YALE's GUI. Applications of YALE cover both research and real-world data mining tasks.  Entwickler:  Universität Dortmund (Lehrstuhl für Künstliche Intelligenz)  Rapid-i GbR (Spin-Off)  Projektbeginn: 2001  Projektseite:  http://rapid-i.com/  http://sourceforge.net/projects/yale/  Bemerkungen:  WEKA-Plug-In  Interaktives Online Demo Christian Schieder Open Source Business Intelligence 47 TDWI Jahrestagung, München 2007
    • Projektsteckbrief RapidMiner (II): Screens 2.3 Marktüberblick.Analyse Christian Schieder Open Source Business Intelligence 48 TDWI Jahrestagung, München 2007
    • Projektsteckbrief RapidMiner (III): Download Impact 2.3 Marktüberblick.Analyse Download History RapidMiner Christian Schieder Open Source Business Intelligence 49 TDWI Jahrestagung, München 2007
    • Projektsteckbrief KNIME (I) 2.3 Marktüberblick.Analyse KNIME: KoNstanz Information MinEr [naIm]  Aktuelles Release: v.1.2.1  Lizenz: LGPL ähnlich (Aladdin Free Public License) + Kommerziell  Kurzbeschreibung: KNIME, is a modular data exploration platform that enables the user to visually create data flow. Incorporates over 100 processing nodes for data I/O, preprocessing and cleansing, modelling, analysis and data mining. It includes all analysis modules of Weka data mining environment and additional plugins allow R-scripts to be run, offering access to a vast library of statistical routines. KNIME is based on the Eclipse platform and, through it's modular API, easily extensible.  Entwickler:  Universität Konstanz (Chair for Bioinformatics and Information Mining)  KNIME GmbH (Spin-Off)  Projektbeginn: 2005  Projektseite: http://www.knime.org  Bemerkung:  Eclipse Plug-In/RCP  Integration in OS-Reporting-Tools (BIRT, jFreeCharts) Christian Schieder Open Source Business Intelligence 50 TDWI Jahrestagung, München 2007
    • Projektsteckbrief KNIME (II): Screens 2.3 Marktüberblick.Analyse Christian Schieder Open Source Business Intelligence 51 TDWI Jahrestagung, München 2007
    • CRISP-DM: CRoss-Industry Standard Process for Data Mining 2.3 Marktüberblick.Analyse Business Data Understanding Understanding Schwerpunkte der Toolunterstützung Data Preparation Deployment Data Modeling Evaluation Quelle: http://www.crisp-dm.org/Process/index.htm Christian Schieder Open Source Business Intelligence 52 TDWI Jahrestagung, München 2007
    • Ergebnisse der Untersuchung 2.3 Marktüberblick.Analyse Dokumentation 10 8 Auswertungen Ergonomie 6 4 2 0 Methoden Projektmanagement Data Preparation Data Understanding © by Chemnitz UT WEKA YALE KNIME As of April 2007 Christian Schieder Open Source Business Intelligence 53 TDWI Jahrestagung, München 2007
    • Magic Quadrant für Open Source Data Mining Projekte 2.3 Marktüberblick.Analyse challengers leaders YALE KNIME Fitness for Use Weka Rattle Orange RKWard niche players visionaries Future Relevance © by Chemnitz UT As of April 2007 Christian Schieder Open Source Business Intelligence 54 TDWI Jahrestagung, München 2007
    • Unterstützungsgrad in den Phasen des CRISP-Zyklus 2.3 Marktüberblick.Analyse Business Data Understanding Understanding Data Preparation Deployment Data Modeling Kaum unterstützt Evaluation Teilweise unterstützt Größtenteils unterstützt Voll unterstützt Christian Schieder Open Source Business Intelligence 55 TDWI Jahrestagung, München 2007
    • De facto Standard für BI-Architekturen 2.4 Marktüberblick.Presentation Data Data Warehouse System Analytical Presentation Acquisition Layer Layer Layer DWH Layer Staging Layer ETL ETL ETL SQL based Bulk Load SQL based Insert/select Insert/select View build Performance Star-Schema Objects File System Quelle: IBM Christian Schieder Open Source Business Intelligence 56 TDWI Jahrestagung, München 2007
    • Reporting & Dashboards 2.4 Marktüberblick.Presentation Quelle: Microstrategy Webinar: Using Dashboards to Improve Corporate Performance: Top 10 Best Practices, http://www.microstrategy8.com/dynamicdashboards.asp Christian Schieder Open Source Business Intelligence 57 TDWI Jahrestagung, München 2007
    • Reporting & Dashboards 2.4 Marktüberblick.Presentation  Eclipse BIRT  JasperReports  Pentaho Reporting (jFreeReports)  jPivot  MARVELit Dash Portal Christian Schieder Open Source Business Intelligence 58 TDWI Jahrestagung, München 2007
    • Projektsteckbrief Eclipse BIRT (I) 2.4 Marktüberblick.Presentation Eclipse BIRT  Aktuelle Release: v.2.1.3 (2.2)  Lizenz: EPL (Eclipse Public License) [weitestgehend frei von Restriktionen]  Kurzbeschreibung: BIRT is an Eclipse-based open source reporting system for web applications, especially those based on Java and J2EE. BIRT has two main components: a report designer based on Eclipse, and a runtime component that you can add to your app server. BIRT also offers a charting engine that lets you add charts to your own application.  Entwickler: BIRT Project Management Committee (PMC) & Community & Eclipse Foundation  Projektbeginn: 2005 (2004)  Projektseite: http://www.eclipse.org/birt/  Bemerkungen:  Kommerziell potenteste Community  Eingebettet in das weit verbreitete Eclipse-Framework  Projekt mit sehr hohem Impact Christian Schieder Open Source Business Intelligence 59 TDWI Jahrestagung, München 2007
    • Projektsteckbrief Eclipse BIRT (II) 2.4 Marktüberblick.Presentation Christian Schieder Open Source Business Intelligence 60 TDWI Jahrestagung, München 2007
    • Höchster Impact bei Open Source Reporting Tools 2.4 Marktüberblick.Presentation 1000 Downloads BIRT Downloads 350 300 250 200 150 100 50 0 H1 05 H2 05 H1 06 H2 06 Quelle: www.actuate.de/BIRT-OnlineSeminar-2 Christian Schieder Open Source Business Intelligence 61 TDWI Jahrestagung, München 2007
    • Projektsteckbrief MarvelIT Dash Portal 2.4 Marktüberblick.Presentation MarvelIT Dash Portal  Aktuelles Release: v.1.0.1  Lizenz: GPL + Kommerziell  Kurzbeschreibung: MARVELit DASH is an open source Business Intelligence solution based on Apache Jetspeed. DASH attempts to simplify the process of creating and maintaining a web-based business intelligence dashboard and centralized reporting for companies of any size.  Entwickler: MarvelIT, USA  Projektbeginn: 2006 (2004)  Projektseite:  http://http://sourceforge.net/projects/marvelit/ (Open Source)  http://www.marvelit.com/ (Kommerziell)  Bemerkungen:  Open Source Ableger eines kommerziell erfolgreichen Produktes  Interaktives Online Demo (http://www.marvelit.com/demo.html) Christian Schieder Open Source Business Intelligence 62 TDWI Jahrestagung, München 2007
    • Building Dashboards. Open Source Style… 2.4 Marktüberblick.Presentation Christian Schieder Open Source Business Intelligence 63 TDWI Jahrestagung, München 2007
    • De facto Standard für BI-Architekturen 2.5 Marktüberblick.Plattformen Data Data Warehouse System Analytical Presentation Acquisition Layer Layer Layer DWH Layer Staging Layer ETL ETL ETL SQL based SQL based Bulk Load Insert/select Insert/select View build Performance Star-Schema Objects File System Quelle: IBM Christian Schieder Open Source Business Intelligence 64 TDWI Jahrestagung, München 2007
    • BI-Plattformen 2.5 Marktüberblick.Plattformen  Pentaho BI Project  JasperSoft BI Suite  SpagoBI  OpenI Christian Schieder Open Source Business Intelligence 65 TDWI Jahrestagung, München 2007
    • Projektsteckbrief Pentaho 2.5 Marktüberblick.Plattformen Pentaho  Aktuelle Release: v.1.2.1  Lizenz: MPL + Kommerziell  Kurzbeschreibung: The Pentaho BI Project provides enterprise-class reporting, analysis, dashboard, data mining and workflow capabilities that help organizations operate more efficiently and effectively. The software offers flexible deployment options that enable use as embeddable components, customized BI application solutions, and as a complete out-of-the-box, integrated BI platform. Ranked #1 in Open Source Business Intelligence.  Entwickler: Pentaho Inc., Orlando, Florida, USA  Projektbeginn: 2002  Projektseite:  http://www.pentaho.com/  http://sourceforge.net/projects/pentaho/  Bemerkungen:  Bekanntestes OSBI Projekt  Integration verschiedener etablierter OSBI Projekte: jFreeReport, Kettle, Mondrian, Weka  Vorkonfiguriertes Demo zum download Christian Schieder Open Source Business Intelligence 66 TDWI Jahrestagung, München 2007
    • BI-Plattformen: Pentaho 2.5 Marktüberblick.Plattformen Christian Schieder Open Source Business Intelligence 67 TDWI Jahrestagung, München 2007
    • Projektsteckbrief SpagoBI 2.5 Marktüberblick.Plattformen SpagoBI  Aktuelle Release: v.1.9.2  Lizenz: LGPL  Kurzbeschreibung: a complete Free/Open Source solution for the development of Business Intelligence projects. Entirely realized by means of the Free Open Source Software philosophy, it is an integrated Business Intelligence suite able to cover all its functional aspects, like: the (static and dynamic) data organization, inquiring, hidden information discovering by means of the data mining technique, the building of a structured and dynamic publishing and control suite. SpagoBI is structured with components in order to achieve each of the BI functionalities by a specific module.  Entwickler: Engineering Ingegneria Informatica, Italien & Community  Projektbeginn: 2005  Projektseite: http://www.spagobi.org/  Bemerkungen:  Europäische Alternative zu Pentaho und Jasper  Starker Community Fokus  Dynamische Entwicklung in den letzten Monaten Christian Schieder Open Source Business Intelligence 68 TDWI Jahrestagung, München 2007
    • Online-Demo: SpagoBI 2.5 Marktüberblick.Plattformen Christian Schieder Open Source Business Intelligence 69 TDWI Jahrestagung, München 2007
    • Zusammenfassung Marktüberblick 2. Marktüberblick  Fazit: Open Source Business Intelligence Tools erreichen heute (noch) nicht (in allen Bereichen) die Leistungsfähigkeit kommerzieller Produkte  Aber: OS-Tools entwickeln sich sehr dynamisch  Folgen:  wachsender Reifegrad von Open Source Tools  steigende Relevanz von OS Tools  zunehmender Preisdruck für Anbieter  Stärkung der Kundenposition  Tipp: Anforderungen genau definieren und OS-Tools im Einzelfall untersuchen Christian Schieder Open Source Business Intelligence 70 TDWI Jahrestagung, München 2007
    • Gliederung Open Source Business Intelligence 1. Einleitung & Grundlagen 2. Marktüberblick 3. Szenarien & Bedingungen für den Einsatz von Open Source Business Intelligence 4. Zusammenfassung & Ausblick Christian Schieder Open Source Business Intelligence 71 TDWI Jahrestagung, München 2007
    • OSBI Nutzen: What’s new? 3. Szenarien & Bedingungen für den Einsatz von OSBI Alternativen zum Aufbau einer BI-Lösung: Adapt Build Individualentwicklung Manufacturing Buy Source Open MarketSourcing Open sourcing Christian Schieder Open Source Business Intelligence 72 TDWI Jahrestagung, München 2007
    • OSBI Nutzen: Kostenvorteile 3. Szenarien & Bedingungen für den Einsatz von OSBI Kommerzielle Lösungen Open Source basierte TCO Lösungen Go Live Zeit Quelle: BI Journal Dez. 2006 Christian Schieder Open Source Business Intelligence 73 TDWI Jahrestagung, München 2007
    • OSBI Nutzen: Hinweise zum Einstieg in OSBI 3. Szenarien & Bedingungen für den Einsatz von OSBI  »Think big – start small«:  Klein beginnen, schnellen Nutzen erzielen  Lösungen wachsen mit Anforderungen  Kosten und Nutzen:  Open Source bedeutet nicht zwingend günstiger  Keine Lizenzkosten  Investition in Anforderungsdefinition  Deutlich höherer (Initial-) Nutzen  Flexibilität:  Erweiterbarkeit durch Offenheit  Offene Standards gewährleisten Interoperabilität im IT-Ökosystem Christian Schieder Open Source Business Intelligence 74 TDWI Jahrestagung, München 2007
    • Hinweise zum Einstieg in OSBI: Support 3. Szenarien & Bedingungen für den Einsatz von OSBI Grundsätzlich 2 Möglichkeiten:  Community  Klassisches OS Support-Modell  Größe und Vitalität der Community entscheidend  Sponsoren  Kommerzieller Support  wie gewohnt  wachsende Anzahl von Firmen (Mittelstand) Christian Schieder Open Source Business Intelligence 75 TDWI Jahrestagung, München 2007
    • Gliederung Open Source Business Intelligence 1. Einleitung & Grundlagen 2. Marktüberblick 3. Szenarien & Bedingungen für den Einsatz von Open Source Business Intelligence 4. Zusammenfassung & Ausblick Christian Schieder Open Source Business Intelligence 76 TDWI Jahrestagung, München 2007
    • Durchbruch von OSS und OSBI ist voll im Gange 4. Zusammenfassung & Ausblick  MIS Quarterly, Sept. 2006: “OSS 2.0-Ära hat bereits begonnen.”  Sourceforge.net: mehr als 200 OSS-Projekte mit BI-Bezug  Venture Capital: 2-stellige Millionen-$ Beträge werden in OSBI-Firmen/Projekte investiert Christian Schieder Open Source Business Intelligence 77 TDWI Jahrestagung, München 2007
    • Verbreitungsgrad (US-Studie 2006) 4. Zusammenfassung & Ausblick  Verbreitungsgrad von OSBI: 83% der Firmen die BI einsetzen, evaluieren oder setzen auch OSBI ein  Zufriedenheit mit OSBI: 65% planen den verstärkten Einsatz von OSBI 4% steigen wieder aus  Reifegrad von OSBI: 54% sagen, OSBI hat den gleichen Reifegrad wie proprietäre BI  TCO von OSBI: 59% sind überzeugt, dass OSBI einen niedrigeren TCO hat  Interoperabilität und Flexibilität 58% sehen Vorteile bei OSBI Quelle: Ventana Research 2006 Christian Schieder Open Source Business Intelligence 78 TDWI Jahrestagung, München 2007
    • Ausblick: Warum OSBI für Sie wichtig sein könnte 4. Zusammenfassung & Ausblick  Wenn Sie Anwender sind:  Niedrige Eintrittsbarrieren (einfach mal ausprobieren)  BI-KnowHow erwerben  Verhandlungsposition gegenüber Anbietern stärken  Wenn Sie Hersteller sind:  Innovationen antizipieren  Marktanteile durch hybride Strategien sichern/gewinnen Christian Schieder Open Source Business Intelligence 79 TDWI Jahrestagung, München 2007
    • Ausblick: Thesen 4. Zusammenfassung & Ausblick  Die Frage lautet nicht mehr, ob OSBI eine Rolle spielen wird oder nicht, sondern nur noch welche  Hybride Geschäftsmodelle werden sich weiter verbreiten (Kommerzielle Anbieter werden OSBI-Komponenten anbieten und integrieren)  Der Reifegrad von OSBI wird sich proprietären Lösungen weiter nähern  OSBI ist (größtenteils) Business Ready  OSBI verringert die BI-Eintrittsbarrieren für den Mittelstand signifikant  OSBI-Komponenten sind prädestiniert für den Einsatz in leichtgewichtigen webbasierten BI-Lösungen  OSBI ist eine ideale Spielwiese für IT-Abteilungen zum Aufbau von BI-KnowHow Christian Schieder Open Source Business Intelligence 80 TDWI Jahrestagung, München 2007
    • Weitere Informationen 4. Zusammenfassung & Ausblick  http://press.teleinteractive.net/oss  http://www.squidoo.com/osbi  http://www.heise.de/open/  http://biteam.wordpress.com/ Christian Schieder Open Source Business Intelligence 81 TDWI Jahrestagung, München 2007
    • Gliederung Open Source Business Intelligence 1. Einleitung & Grundlagen 2. Marktüberblick 3. Szenarien & Bedingungen für den Einsatz von Open Source Business Intelligence 4. Zusammenfassung & Ausblick Anhang Christian Schieder Open Source Business Intelligence 82 TDWI Jahrestagung, München 2007
    • OSBI-Beispiel (I): Palo Excel Plug-In “Lizenzarchitektur” 2.3 Marktüberblick.Analyse Palo Excel Integration MS Excel® Betriebssystem Windows Palo Data Server Betriebssystem Linux Cubeware Importer ImpPalo Daten Christian Schieder Open Source Business Intelligence 83 TDWI Jahrestagung, München 2007
    • OSBI-Beispiel (I): Palo Excel Plug-In Anhang.Weitere Beispiele Christian Schieder Open Source Business Intelligence 84 TDWI Jahrestagung, München 2007
    • OSBI-Beispiel (I): PalOOCa Open Office Calc Plug-In Anhang.Weitere Beispiele Christian Schieder Open Source Business Intelligence 85 TDWI Jahrestagung, München 2007
    • Architekturschema eines Palo-basierten MOLAP-Systems 2.3 Marktüberblick.Analyse PalOOCa Plug-In Open Office Calc Betriebssystem Linux Palo Data Server Betriebssystem Linux Cubeware Importer ImpPalo Daten Christian Schieder Open Source Business Intelligence 86 TDWI Jahrestagung, München 2007
    • OSBI-Beispiel (I) Anhang.Weitere Beispiele Open Source MOLAP: PalOOCa – Palo Plug-in for OpenOffice Calc  Kooperationsprojekt zwischen dem Lehrstuhl Wirtschaftsinformatik II an der TU Chemnitz und der Jedox GmbH (Freiburg) sowie einer Reihe internationaler Sponsoren  Ziel: Entwicklung eines vollständig Open Source-basierten MOLAP Stacks  Projektstart: 03 / 2007 (11 / 2006)  Technologie: Open Source OLAP Server PALO, Open Office Calc, Java  Status: Beta-Stadium erreicht  Projektseite: http://sourceforge.net/projects/palooca/ Weitere Infos unter: http://www.jedox.com/en/news/216/Palo_for_OpenOffice.org_Calc.html Christian Schieder Open Source Business Intelligence 87 TDWI Jahrestagung, München 2007
    • OSBI-Beispiel (II): UweX++ Anhang.Weitere Beispiele Operational BI – UweX++: Analytische Erweiterung in einer Software zum Gebrauchtwagenhandel im VW-Vertriebsnetz  Kooperationsprojekt zwischen dem Lehrstuhl Wirtschaftsinformatik II an der TU Chemnitz und der myMotion KG (Chemnitz)  Ziel: Entwicklung analytischer Funktionen für Gebrauchtwagenhandelssoftware UWE-X  Projektstart: 05 / 2007  Technologie: MySQL, Mondrian, jPivot, UWE-X  Durchführung: Im Rahmen eines studentischen BI-Praktikums  Weitere Info: http://www.my-motion.de/ Christian Schieder Open Source Business Intelligence 88 TDWI Jahrestagung, München 2007
    • OSBI-Beispiel (II): UweX++ Anhang.Weitere Beispiele Operational BI – UweX++: Analytische Erweiterung in einer Software zum Gebrauchtwagenhandel im VW-Vertriebsnetz  Kooperationsprojekt zwischen dem Lehrstuhl Wirtschaftsinformatik II an der TU Chemnitz und der myMotion KG (Chemnitz)  Ziel: Entwicklung analytischer Funktionen für Gebrauchtwagenhandelssoftware UWE-X  Projektstart: 05 / 2007  Technologie: MySQL, Mondrian, jPivot, UWE-X  Durchführung: Im Rahmen eines studentischen BI-Praktikums  Weitere Info: http://www.my-motion.de/ Christian Schieder Open Source Business Intelligence 89 TDWI Jahrestagung, München 2007