Infosecurity 2013- Social it-balanceren tussen vrijheid en veiligheidJohan Jacobs
Keynote gegeven op Infosecurity 2013 beurs. Trends zoals Social Media, Mobile Communications, het Nieuwe Werken, Cloud Computing en Bring Your Own Device (BYOD) hebben ontegensprekelijk hun invloed op het beheer van IT in de bedrijven. Het is balanceren tussen de werknemers voldoende vrijheid te geven en tegelijkertijd toch de nodige veiligheid in te bouwen zodat het eigen netwerk en de integriteit van de bedrijfsgegevens niet in gevaar worden gebracht. Datanews bracht een mooi verslag van deze keynote op http://datanews.knack.be/ict/nieuws/infosecurity-be-nood-aan-balans-tussen-vrijheid-en-security/article-4000265249320.htm
How To Interview a Data Scientist
Daniel Tunkelang
Presented at the O'Reilly Strata 2013 Conference
Video: https://www.youtube.com/watch?v=gUTuESHKbXI
Interviewing data scientists is hard. The tech press sporadically publishes “best” interview questions that are cringe-worthy.
At LinkedIn, we put a heavy emphasis on the ability to think through the problems we work on. For example, if someone claims expertise in machine learning, we ask them to apply it to one of our recommendation problems. And, when we test coding and algorithmic problem solving, we do it with real problems that we’ve faced in the course of our day jobs. In general, we try as hard as possible to make the interview process representative of actual work.
In this session, I’ll offer general principles and concrete examples of how to interview data scientists. I’ll also touch on the challenges of sourcing and closing top candidates.
Titan is an open source distributed graph database build on top of Cassandra that can power real-time applications with thousands of concurrent users over graphs with billions of edges. Graphs are a versatile data model for capturing and analyzing rich relational structures. Graphs are an increasingly popular way to represent data in a wide range of domains such as social networking, recommendation engines, advertisement optimization, knowledge representation, health care, education, and security.
This presentation discusses Titan's data model, query language, and novel techniques in edge compression, data layout, and vertex-centric indices which facilitate the representation and processing of Big Graph Data across a Cassandra cluster. We demonstrate Titan's performance on a large scale benchmark evaluation using Twitter data.
Presented at the Cassandra 2012 Summit.
Infosecurity 2013- Social it-balanceren tussen vrijheid en veiligheidJohan Jacobs
Keynote gegeven op Infosecurity 2013 beurs. Trends zoals Social Media, Mobile Communications, het Nieuwe Werken, Cloud Computing en Bring Your Own Device (BYOD) hebben ontegensprekelijk hun invloed op het beheer van IT in de bedrijven. Het is balanceren tussen de werknemers voldoende vrijheid te geven en tegelijkertijd toch de nodige veiligheid in te bouwen zodat het eigen netwerk en de integriteit van de bedrijfsgegevens niet in gevaar worden gebracht. Datanews bracht een mooi verslag van deze keynote op http://datanews.knack.be/ict/nieuws/infosecurity-be-nood-aan-balans-tussen-vrijheid-en-security/article-4000265249320.htm
How To Interview a Data Scientist
Daniel Tunkelang
Presented at the O'Reilly Strata 2013 Conference
Video: https://www.youtube.com/watch?v=gUTuESHKbXI
Interviewing data scientists is hard. The tech press sporadically publishes “best” interview questions that are cringe-worthy.
At LinkedIn, we put a heavy emphasis on the ability to think through the problems we work on. For example, if someone claims expertise in machine learning, we ask them to apply it to one of our recommendation problems. And, when we test coding and algorithmic problem solving, we do it with real problems that we’ve faced in the course of our day jobs. In general, we try as hard as possible to make the interview process representative of actual work.
In this session, I’ll offer general principles and concrete examples of how to interview data scientists. I’ll also touch on the challenges of sourcing and closing top candidates.
Titan is an open source distributed graph database build on top of Cassandra that can power real-time applications with thousands of concurrent users over graphs with billions of edges. Graphs are a versatile data model for capturing and analyzing rich relational structures. Graphs are an increasingly popular way to represent data in a wide range of domains such as social networking, recommendation engines, advertisement optimization, knowledge representation, health care, education, and security.
This presentation discusses Titan's data model, query language, and novel techniques in edge compression, data layout, and vertex-centric indices which facilitate the representation and processing of Big Graph Data across a Cassandra cluster. We demonstrate Titan's performance on a large scale benchmark evaluation using Twitter data.
Presented at the Cassandra 2012 Summit.
Presentation given by Dr. Diego Kuonen, CStat PStat CSci, on November 20, 2013, at the "IBM Developer Days 2013" in Zurich, Switzerland.
ABSTRACT
There is no question that big data has hit the business, government and scientific sectors. The demand for skills in data science is unprecedented in sectors where value, competitiveness and efficiency are driven by data. However, there is plenty of misleading hype around the terms big data and data science. This presentation gives a professional statistician's view on these terms and illustrates the connection between data science and statistics.
The presentation is also available at http://www.statoo.com/BigDataDataScience/.
We at Revolution Analytics are often asked “What is the best way to learn R?” While acknowledging that there may be as many effective learning styles as there are people we have identified three factors that greatly facilitate learning R. For a quick start:
- Find a way of orienting yourself in the open source R world
- Have a definite application area in mind
- Set an initial goal of doing something useful and then build on it
In this webinar, we focus on data mining as the application area and show how anyone with just a basic knowledge of elementary data mining techniques can become immediately productive in R. We will:
- Provide an orientation to R’s data mining resources
- Show how to use the "point and click" open source data mining GUI, rattle, to perform the basic data mining functions of exploring and visualizing data, building classification models on training data sets, and using these models to classify new data.
- Show the simple R commands to accomplish these same tasks without the GUI
- Demonstrate how to build on these fundamental skills to gain further competence in R
- Move away from using small test data sets and show with the same level of skill one could analyze some fairly large data sets with RevoScaleR
Data scientists and analysts using other statistical software as well as students who are new to data mining should come away with a plan for getting started with R.
Finding Our Happy Place in the Internet of ThingsPamela Pavliscak
In the future, we will all be better people. And our technology will be better too. Or will it? With connected devices becoming a canvas for our lives, we need new principles and practices to design with greater humanity.
Big Data [sorry] & Data Science: What Does a Data Scientist Do?Data Science London
What 'kind of things' does a data scientist do? What are the foundations and principles of data science? What is a Data Product? What does the data science process looks like? Learning from data: Data Modeling or Algorithmic Modeling? - talk by Carlos Somohano @ds_ldn at The Cloud and Big Data: HDInsight on Azure London 25/01/13
Presentatie Marc Lelijveld how big data keeps us rollingCentric
Ook treinen behoren tegenwoordig tot het Big Data Analytics-arsenaal. Zo heeft Stukton Rail al langere tijd de mogelijkheid de kritische installaties in treinen te monitoren. Centric en Rolling Stock (een onderdeel van Strukton Rail) zetten de volgende stap in monitoring. Waar de sensorgegevens eerder voornamelijk werden gebruikt voor het constateren van defecten, biedt Big Data Analytics nu de mogelijkheid een brug te slaan naar Predictive Maintenance. Steekproeven maken plaats voor Big Data Analytics. De ambities zijn groot en de verwachtingen hooggespannen! Nieuwsgierig welke verbanden er zijn gelegd, welke interne en externe factoren worden gecombineerd, hoe open data daarbij een rol kan spelen en welke technieken zijn ingezet? Of wilt u weten wat het businesspotentieel van een case als deze is?
Beter onderbouwde business beslissingen en effectiever beleid dankzijn een strategie op basis van location analytics. Haal meer uit bedrijfsgegevens door de locatie beter te benutten. Geografische kaarten en analyses geven aanvullende inzichten, leggen verborgen patronen bloot en inspireren tot nieuwe en scherpere strategische keuzes.
Esri Maps for Office is add-on die een set geografische functionaliteit toevoegt aan Excel. Uniek, eenvoudig in gebruik maar krachtig in zijn uitkomsten.
Kennisalliantie Nieuwjaarsreceptie 31 januari 2013:
Mark van Rijmenam MSc: "Big Data is nu net zo ver als het Internet was in 1993"
Ondernemer (bureau Kiura) en oprichter/blogger www.bigdata-startups.com
Presentation was held at the Meet-the-Press event, March 22nd 2013 in Hoofddorp The Netherlands. Presenters were Marcel Warmerdam from The METISfiles and Ruud Aleards from Keala Consulting
The event program included the release of the 2015 GRESB Survey results and presentations on "Sustainability in Action" by Olaf Rutten, Commercial Clients Real Estate, ABN AMRO;
Bernardo Korenberg, Bouwinvest; Marieke van Kamp, Real Estate & Alternatives, NN Group; Rinus Vader, Leading Professional Asset & Facility Management, Royal Haskoning.
Summary of Multi Client study on Big Data in the Netherlands
combining end-user perceptions of medium and large organizations and vendor product/market strategies.
Kennisssessie Google Analytics | 2013 | Estate Internet tilburgTom Broekhoven
Deze kennissessie behandeld in het kort een aantal vragen die je als gebruiker van Google Analytics zou kunnen stellen ter ondersteuning van het betekenis geven aan je statistieken.
Hoe kan analytics je helpen?
- Wat wil je weten van bezoekers?
- Welke data helpt om inzicht te krijgen in gedrag en acties?
- Welke data helpt je beslissingen te nemen?
Wat levert analytics wel en wat niet:
- (Ordening van) ruwe data;
- Interpretatie en keuzes.
Van bezoekersstromen, verkeersbronnen, mobiele statistieken en plaats gegevens tot aan conversies en realtime gebeurtenissen.
Meetplan, implementatie en inrichting:
- Welk stappenplan volg je;
- Wat moet er worden gemetenl
- Wat dient er te worden gerapporteerd;
- Wat zijn de KPi's;
- Welke technische aanpassingen heb je nodig om alles door te meten.
Welke doelen zijn er:
- Verkopen;
- Leads genereren
- Informeren en ontzorgen
Wat je standaard niet kunt meten, maar je wel kunt implementeren:
- Doelen;
- Campagnes;
- Klikken op elementen zoals e-mail adressen en uitgaande links;
- E-commerce;
- Downloaden van bestanden;
- Sociale interactie;
- Eigen variabelen (bijv. is de gebruiker een man of vrouw).
Welke data wil je meten:
- Zijn rapporten wel zuiver (sluit je eigen organisatie uit/neem deze apart op)
- Gebruik extra profielen;
- Maak gebruik van filters.
Houd je rekening met:
- Aanpassingen werken nooit met terugwerkende kracht;
- Verwijderde informatie = en blijft verwijderd;
- Dat is niet exact en 100% betrouwbaar;
- Gebruik het programma voor trends.
Trends op het gebied van webanalytics:
- De cookiewetgeving;
- Live segmentatie
- Conversie attributie;
- Remarketing;
- Integratie van online/offline.
Info.nl organized a knowledge session on Big Data on August 9. In this presentation strategy director Iskander Smit introduces the Big Data developments.
Robert Dackus - Change in Real Estate | Masterclass Vastgoed 3.0 | www.vastgo...Roger
Op 9 februari 2011 vond de Masterclass Vastgoed 3.0 plaats, georganiseerd door Robert Dackus (3W Vastgoed) & Roger Heijsters (Smartcheck SME). Een bijeenkomst waar 40 vastgoedprofessionals hun ziel bloot gaven en zich openstelden voor een nieuwe toekomst aan de in zwaar weer verkerende vastgoedmarkt. Een zeer geslaagde dag met zeer inspirerende sprekers. Meer details op www.vastgoed30.com.
Big Data Expo 2015 - Doorbraakproject Big DataBigDataExpo
Big data komt in vele vormen en maten en biedt een breed scala aan mogelijkheden, zoals het categoriseren van alle vacatures van alle websites waar ook en het voorspellen van product-populariteit door sentimentanalyse van Twitterberichten. Door de snelle vooruitgang van mogelijkheden voor data opslag en analyse komen Big Data toepassingen in het bereik van kleinere bedrijven. Open data, cloud opslag, open source software en crowdsourcing dragen daar aan bij.
Is het iets voor jou? Hoe pak je dat aan? Waar begin je? Wie kunnen helpen? Eric van Tol neemt je mee in de eerste stappen naar een succesvolle big data business case.
Op 30-10-12 was ik te gast tijdens de IT Innovation Briefing van Systemation. Het onderwerp: de data-gedreven onderneming. In mijn presentatie ging ik vooral in op de mogelijkheden voor ondernemingen om te profiteren van Big Data die onder andere in de online (social) media voor het oprapen liggen.
Presentation given by Dr. Diego Kuonen, CStat PStat CSci, on November 20, 2013, at the "IBM Developer Days 2013" in Zurich, Switzerland.
ABSTRACT
There is no question that big data has hit the business, government and scientific sectors. The demand for skills in data science is unprecedented in sectors where value, competitiveness and efficiency are driven by data. However, there is plenty of misleading hype around the terms big data and data science. This presentation gives a professional statistician's view on these terms and illustrates the connection between data science and statistics.
The presentation is also available at http://www.statoo.com/BigDataDataScience/.
We at Revolution Analytics are often asked “What is the best way to learn R?” While acknowledging that there may be as many effective learning styles as there are people we have identified three factors that greatly facilitate learning R. For a quick start:
- Find a way of orienting yourself in the open source R world
- Have a definite application area in mind
- Set an initial goal of doing something useful and then build on it
In this webinar, we focus on data mining as the application area and show how anyone with just a basic knowledge of elementary data mining techniques can become immediately productive in R. We will:
- Provide an orientation to R’s data mining resources
- Show how to use the "point and click" open source data mining GUI, rattle, to perform the basic data mining functions of exploring and visualizing data, building classification models on training data sets, and using these models to classify new data.
- Show the simple R commands to accomplish these same tasks without the GUI
- Demonstrate how to build on these fundamental skills to gain further competence in R
- Move away from using small test data sets and show with the same level of skill one could analyze some fairly large data sets with RevoScaleR
Data scientists and analysts using other statistical software as well as students who are new to data mining should come away with a plan for getting started with R.
Finding Our Happy Place in the Internet of ThingsPamela Pavliscak
In the future, we will all be better people. And our technology will be better too. Or will it? With connected devices becoming a canvas for our lives, we need new principles and practices to design with greater humanity.
Big Data [sorry] & Data Science: What Does a Data Scientist Do?Data Science London
What 'kind of things' does a data scientist do? What are the foundations and principles of data science? What is a Data Product? What does the data science process looks like? Learning from data: Data Modeling or Algorithmic Modeling? - talk by Carlos Somohano @ds_ldn at The Cloud and Big Data: HDInsight on Azure London 25/01/13
Presentatie Marc Lelijveld how big data keeps us rollingCentric
Ook treinen behoren tegenwoordig tot het Big Data Analytics-arsenaal. Zo heeft Stukton Rail al langere tijd de mogelijkheid de kritische installaties in treinen te monitoren. Centric en Rolling Stock (een onderdeel van Strukton Rail) zetten de volgende stap in monitoring. Waar de sensorgegevens eerder voornamelijk werden gebruikt voor het constateren van defecten, biedt Big Data Analytics nu de mogelijkheid een brug te slaan naar Predictive Maintenance. Steekproeven maken plaats voor Big Data Analytics. De ambities zijn groot en de verwachtingen hooggespannen! Nieuwsgierig welke verbanden er zijn gelegd, welke interne en externe factoren worden gecombineerd, hoe open data daarbij een rol kan spelen en welke technieken zijn ingezet? Of wilt u weten wat het businesspotentieel van een case als deze is?
Beter onderbouwde business beslissingen en effectiever beleid dankzijn een strategie op basis van location analytics. Haal meer uit bedrijfsgegevens door de locatie beter te benutten. Geografische kaarten en analyses geven aanvullende inzichten, leggen verborgen patronen bloot en inspireren tot nieuwe en scherpere strategische keuzes.
Esri Maps for Office is add-on die een set geografische functionaliteit toevoegt aan Excel. Uniek, eenvoudig in gebruik maar krachtig in zijn uitkomsten.
Kennisalliantie Nieuwjaarsreceptie 31 januari 2013:
Mark van Rijmenam MSc: "Big Data is nu net zo ver als het Internet was in 1993"
Ondernemer (bureau Kiura) en oprichter/blogger www.bigdata-startups.com
Presentation was held at the Meet-the-Press event, March 22nd 2013 in Hoofddorp The Netherlands. Presenters were Marcel Warmerdam from The METISfiles and Ruud Aleards from Keala Consulting
The event program included the release of the 2015 GRESB Survey results and presentations on "Sustainability in Action" by Olaf Rutten, Commercial Clients Real Estate, ABN AMRO;
Bernardo Korenberg, Bouwinvest; Marieke van Kamp, Real Estate & Alternatives, NN Group; Rinus Vader, Leading Professional Asset & Facility Management, Royal Haskoning.
Summary of Multi Client study on Big Data in the Netherlands
combining end-user perceptions of medium and large organizations and vendor product/market strategies.
Kennisssessie Google Analytics | 2013 | Estate Internet tilburgTom Broekhoven
Deze kennissessie behandeld in het kort een aantal vragen die je als gebruiker van Google Analytics zou kunnen stellen ter ondersteuning van het betekenis geven aan je statistieken.
Hoe kan analytics je helpen?
- Wat wil je weten van bezoekers?
- Welke data helpt om inzicht te krijgen in gedrag en acties?
- Welke data helpt je beslissingen te nemen?
Wat levert analytics wel en wat niet:
- (Ordening van) ruwe data;
- Interpretatie en keuzes.
Van bezoekersstromen, verkeersbronnen, mobiele statistieken en plaats gegevens tot aan conversies en realtime gebeurtenissen.
Meetplan, implementatie en inrichting:
- Welk stappenplan volg je;
- Wat moet er worden gemetenl
- Wat dient er te worden gerapporteerd;
- Wat zijn de KPi's;
- Welke technische aanpassingen heb je nodig om alles door te meten.
Welke doelen zijn er:
- Verkopen;
- Leads genereren
- Informeren en ontzorgen
Wat je standaard niet kunt meten, maar je wel kunt implementeren:
- Doelen;
- Campagnes;
- Klikken op elementen zoals e-mail adressen en uitgaande links;
- E-commerce;
- Downloaden van bestanden;
- Sociale interactie;
- Eigen variabelen (bijv. is de gebruiker een man of vrouw).
Welke data wil je meten:
- Zijn rapporten wel zuiver (sluit je eigen organisatie uit/neem deze apart op)
- Gebruik extra profielen;
- Maak gebruik van filters.
Houd je rekening met:
- Aanpassingen werken nooit met terugwerkende kracht;
- Verwijderde informatie = en blijft verwijderd;
- Dat is niet exact en 100% betrouwbaar;
- Gebruik het programma voor trends.
Trends op het gebied van webanalytics:
- De cookiewetgeving;
- Live segmentatie
- Conversie attributie;
- Remarketing;
- Integratie van online/offline.
Info.nl organized a knowledge session on Big Data on August 9. In this presentation strategy director Iskander Smit introduces the Big Data developments.
Robert Dackus - Change in Real Estate | Masterclass Vastgoed 3.0 | www.vastgo...Roger
Op 9 februari 2011 vond de Masterclass Vastgoed 3.0 plaats, georganiseerd door Robert Dackus (3W Vastgoed) & Roger Heijsters (Smartcheck SME). Een bijeenkomst waar 40 vastgoedprofessionals hun ziel bloot gaven en zich openstelden voor een nieuwe toekomst aan de in zwaar weer verkerende vastgoedmarkt. Een zeer geslaagde dag met zeer inspirerende sprekers. Meer details op www.vastgoed30.com.
Big Data Expo 2015 - Doorbraakproject Big DataBigDataExpo
Big data komt in vele vormen en maten en biedt een breed scala aan mogelijkheden, zoals het categoriseren van alle vacatures van alle websites waar ook en het voorspellen van product-populariteit door sentimentanalyse van Twitterberichten. Door de snelle vooruitgang van mogelijkheden voor data opslag en analyse komen Big Data toepassingen in het bereik van kleinere bedrijven. Open data, cloud opslag, open source software en crowdsourcing dragen daar aan bij.
Is het iets voor jou? Hoe pak je dat aan? Waar begin je? Wie kunnen helpen? Eric van Tol neemt je mee in de eerste stappen naar een succesvolle big data business case.
Op 30-10-12 was ik te gast tijdens de IT Innovation Briefing van Systemation. Het onderwerp: de data-gedreven onderneming. In mijn presentatie ging ik vooral in op de mogelijkheden voor ondernemingen om te profiteren van Big Data die onder andere in de online (social) media voor het oprapen liggen.
GEO2.0 - Locatie als verbindende schakeledietvorst
De mogelijkheden om op basis van een lokatie gericht informatie op te vragen of te geven, zijn de laatste jaren enorm gegroeid.
Autonavigatie, mobiele telefoons, bankpasjes en bonuskaarten: bijna dagelijks maken we (ongemerkt) gebruik van lokatiegebonden informatie. Maar over welke informatie hebben we het nu? Wat is de rol van de overheid, het bedrijfsleven en de maatschappij? Hoe is het gesteld met de privacy? Deze sessie laat zien wat de mogelijkheden van lokatiegegevens zijn, maar gaat daarbij samen met u ook dieper in op de dilemma's en de keuze die we daarin kunnen maken.
20130618 presentatie big data in financiële sector v1.0 DutchPascal Spelier
Deze presentatie over big data in de financiële sector gaf ik op de IT Auditdag van De Nederlandsche Bank. Wil je het verhaal ook een keer horen, neem dan contact met mij op.
In dit artikel ga ik in op de rol van de manager in de digitale economie. In dit artikel geef ik een beschouwing over de rol van de manager in de digitale economie. Het is dan de vraag of de digitale economie überhaupt een effect heeft op de rol van de manager, of blijft deze rol toch min of meer gelijk? Neemt de vraag naar managers en/of de managementtaken dan toe of af? Etcetera.
Hoofdstuk in boek "Bedrijfskunde door de jaren heen"
8. There was 5 Exabytes of
information created between
the dawn of civilization
through 2003, but that much
information is now created
every 2 days and the
Pace is
Increasing
21. Structured data
- Spreadsheets;
- Log files;
- Sensor data;
- GPS data;
- Flat files.
Semi-structured data
- RSS Feeds;
- Documents with meta
tags;
- XML objects.
Complex Structured data
- Hierarchically structured
data
Unstructured data
- Image objects;
- Social data;
- Documents;
- Voice data;
- Business records.
22. Youtube: 100 uur video wordt elke minuut geüpload
Twitter: 400 miljoen tweets per dag
Facebook: 1.2 miljard gebruikers, 4,5 miljard likes per dag, 500 terabyte aan
data en… $ 19 miljard voor WhatsApp
Flickr: 51 miljoen leden met elk 1 terabyte aan data = 50 exabyte
WhatsApp verwerkt regelmatig > 60 miljard berichten per dag
204 miljoen emails worden elke minuut verstuurd