• Save
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Upcoming SlideShare
Loading in...5
×
 

Analyse hochdimensionaler Daten und deren zufällige Erzeugung

on

  • 507 views

Analyse hochdimensionaler Daten und deren zufällige Erzeugung am Beispiel des BwFuhrpark

Analyse hochdimensionaler Daten und deren zufällige Erzeugung am Beispiel des BwFuhrpark

Statistics

Views

Total Views
507
Views on SlideShare
507
Embed Views
0

Actions

Likes
0
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Analyse hochdimensionaler Daten und deren zufällige Erzeugung Analyse hochdimensionaler Daten und deren zufällige Erzeugung Presentation Transcript

    • Grundlagen Analyse der FuhrparkdatenErzeugung realistischer Fuhrparkdaten Zusammenfassung Analyse hochdimensionaler Daten und deren zuf¨llige Erzeugung a am Beispiel des BwFuhrpark Stephan Tzschoppe, B. Sc. Marc Uwe Simon, B. Sc Institut f¨r Theoretische Informatik, u Mathematik und Operations Research Fakult¨t f¨r Informatik a u 22.02.2011 1 / 28
    • Grundlagen Analyse der Fuhrparkdaten Erzeugung realistischer Fuhrparkdaten ZusammenfassungInhaltsverzeichnis 1 Grundlagen Verteilungen Zufallszahlen Allgemeines zu Zufallszahlen Lineare Kongruenzgeneratoren 2 Analyse der Fuhrparkdaten Vorbereitung Auswertung 3 Erzeugung realistischer Fuhrparkdaten Datenmodell und Grundannahmen Verteilungen der zu erzeugenden Daten G¨te der generierten Daten u 4 Zusammenfassung Fazit Ausblick 2 / 28
    • Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen ZusammenfassungRelevante Verteilungen Definition (Wahrscheinlichkeitsfunktion nach [Bra92]) Man betrachte eine Zufallsvariable x1 und eine reelle Zahl x2 , die jeden Wert zwischen −∞ und +∞ annehmen kann. Dann ist die Wahrscheinlichkeit f¨r das Ereignis x1 < x2 eine Funktion von x u und heißt die Verteilungsfunktion von x F (x) = P(x1 < x2 ). diskrete Verteilungen stetige Verteilungen Gleichverteilung Gleichverteilung Geometrische Verteilung Exponentialverteilung 3 / 28
    • Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen ZusammenfassungGrafiken relevanter Verteilungen p 0.2 Λ 0.25 Λ .0.5 p 0.4 Λ 1 p 0.7 Λ 2 2.0 p 0.9 0.8 1.5 0.6 1.0 0.4 0.5 0.2 1 2 3 4 5 2 4 6 8 10 Abbildung: Dichtefunktion der Abbildung: Dichtefunktion der Exponentialverteilung Geometrischen Verteilung λe−λx x ≥ 0 fλ (x) = f (x) = p(1 − p)x 0 x <0 4 / 28
    • Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen ZusammenfassungVerwendung der Gleichverteilung Definition (Indifferenzprinzip nach [Car59]) Das Indifferenzprinzip (auch Prinzip vom unzureichenden Grund genannt) der Wahrscheinlichkeitstheorie besagt, dass bei n > 1 unterscheidbaren und sich gegenseitig ausschließenden Ereignism¨glichkeiten die Eintrittswahrscheinlichkeit jedes o 1 Ereignisses ohne Vorliegen weiterer Informationen mit p = n anzusetzen ist, d. h. eine diskrete Gleichverteilung angenommen wird. 5 / 28
    • Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen ZusammenfassungAllgemeines zu Zufallszahlen Echte und Pseudo-Zufallszahlen Unterscheidung durch Art der Gewinnung Eigenschaften bestimmen Anwendungsgebiete Charakteristik PRNG TRNG Effizienz ausgezeichnet schecht Determinismus deterministisch nichtdeterministisch Periodizit¨t a periodisch aperiodisch Tabelle: Vergleich der Erzeugung von echten (TRNG) und Pseudozufallszahlen (PRNG) [Haa11] 6 / 28
    • Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen ZusammenfassungErzeugung von Pseudo-Zufallszahlen Arbeitsweise Startwert (auch Seed) x0 M¨glichst einfache Funktion f : Z/mZ → Z/mZ o x0 , x1 = f (x0 ) , . . . , xn = f (xn−1 ) Random numbers should not be generated with a ” method chosen at random.“ Donald E. Knuth ([Knu98]) Lineare Kongruenzgeneratoren ([Knu98], [Gre61], [Mar03]) Mersenne-Twister ([MN98]) 7 / 28
    • Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen ZusammenfassungLineare Kongruenzgeneratoren Iterationsfunktion f F¨r lineare Kongruenzgeneratoren hat die oben eingef¨hrte u u Funktion f : Z/mZ → Z/mZ die Form: x → f (x) = (a x + c) mod m a − Multiplikator c − Inkrement m − Modulus 8 / 28
    • Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen ZusammenfassungLineare KongruenzgeneratorenVorteile Nachteile Gutes Laufzeitverhalten Zusammenhang der Geringe Spreicherkomplexit¨t a Folgenglieder ([Mar03]) Geringe Periode der niedrigen Bits bei m = 2n Anwendung ungeeignet f¨r: u Monte Carlo Simulation Kryptographie (Schl¨sselerzeugung) u m¨gliche Anwendung: o Einsatz auf Systemen mit beschr¨nkten Ressourcen a 9 / 28
    • Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen ZusammenfassungLineare Kongruenzgeneratoren 1D 2D 3D 1.0 1.0 q q q qq q q q q q q qq q q q qq q q q q q q qq q q q q q q q q q q q q q qq q q qq q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q qq q qq q q q qq qqq qq q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q qq q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q qq qq q q q qq q qq q q q q q q qq q q q q q q qq q q q q q q q q q q q q q qq q q q qq q q q q q q q q q q q q q q q q q q qqq q q qqq qq qq q q q q q q q q qq q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q qq q q q qq qq qq q q qq q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q qqq q q q q q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q qqq q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q qq q q qq q q q qq q q q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q qqq q qqq q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q q q q q q q q qq q qq q q qq q q q q q q q qqqq q q q qq q q qq q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q qq q q q qq q qq q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q q q q qq q q q q q q q q q q q q q qq q q q q q q q q q qq q q q q q q q qq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q q qq q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q q qq q qq q q q q q q qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq q q q q q q q q qq q qq q q q q q qq q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q qq qq q q qq qq q qq q q q q q q q q q q q qq q q q q q q q q q q q q q qq qq qq qq q qq q q q q q q q q q qq q q q q q q q q q q q q q q q q q q qq q qq q q q q q q qq q q q q 0.8 0.8 q q q q q q q qqq q q q q qq q q q q q q q q q q q q q qq q q q q q qq q q q q q q q q q q qq q q q q q q q q qq q qq qqq q q q q q qqqq q q q qq q q q q q q qq qq q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q qq q q q q q q q q q qq qq q q q qq q q q q q qq q q q q q q q q q q q q qq q q q qq q qqq q qq q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q q q qq q q q q qq q q q qq q q q q q q q q q q q q qq q qq qq q qqq q q q q q q q q q q qq q q q q q q q q qqq q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q qq qq qq qq q q qq q q q q q q q q qq qq q qq q q q q q q q q q qq q q q q q q q q q q qq q q q q qq q q q q q qq q q q qq q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q qq qq q q qq qq q q qq q q qq q q q q q q q q q q q q q q q q q q qq q q q q q q qq q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q qq qq qq qq q q qq q q q q qq q q qq q q q qq q qq q q q q q q q q q q q q q q q q qq qq q q q qq q qq q q qq q qq q qq q q qq q q q q q q q q q q q q q q q q q q qq qq q qq qq qq q qq q q q qq qq q q q q q qq q q q qqq qq qq q q q q q q q q q q q q q qq qq q q q q q qq q q q q q qq q q qqq q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq qq q q q qqq qqq q q q q q q q qq q q q q q q q q q qq q q q q q q q q q q q q q q q q q q qq q qq q q q q q q qq q q q q q q qq q q q q q qq q q q q q q q q q q q q q q q q q q q qq q q qq qq qq qq q q q q q q qq q qq q q q qq q q qq q q q qq qq q q q q q q q 1.0 q qq qq q q q qq q q q q q q q q q q q q q q q q qq qq q qq q qq q qq qq q qq qq q q q qq q q qq q q q qq q qq q q q q q q q q q qq q qq q q q q q qq q qq qq q q q q q q q q q q q q q qq q q qq q qq q q q q q q q q q q q q q qq qq q q qq q q q q q q q q q q qq qq qq qq q q q qq q q q qq q qq q q q q q q q q qq qq q qq qq q q q qq q q q q q qq q q q q q q q q qqq q q q q q q q q q q q q q q q qqq q q q q q q q q q q q q qq q q q q q qq q q q q qq q q q q q q q q q q q q q q q q q q q qq q q qq q qq qq q qq q qq qq q qq q q q q qq q q q q q q q q q q q q qq qq q q q qq q q q qq q q q q q qq q q q qq q qq qq q q q q qq q qq q q q q q q q q q q q q qq qq qq q qq qq q q q q q q q q q q q qq q q q q qq q q q qq q q q q q q q qq qq qq qq q q q q q qq q qq q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq qq qq qq q qq qq q qq q q qq q q q q q q q q q q q q q q qq q q q q q q q qq qq q q qq q q q q qq q q q q q q q q q q q q qq q q q q q q q qq qq q q q q q q q q q qq q q q q q q q q qq qq qq qq qq q q q qq q q q q qq q q q q q qq qq q q q q q q qq q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq qq qq qq q qq qq q qq qqq q q q q q q q q q q q q qqq q q q q q q q q q q q q q q q q q q q q q q q qq q qq qq q qq qq qq q q q q q q q q qq q qq q qq qq q q q q q q qq q q q q q q q qq qq q q qq q q q q q q qq q q 0.6 0.6 q qq qq q q q q q qqq q q q q qqq q q q q q q q q q q q q q q q q q q q q q q q qq qq qq q qq q q qq qq q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq qq qq q qq qq q qq qq q q q q qq q q q qq q qq q qq q q q q q q q q q q q q qq q q q q q q q q qq q q q q q q q q q q q q q q q q q q q qq q q q q qq q qq q q q q q qq q q q qqq q qq q q q q q q q q q q q q qq q q qq q qq q q q q q q q q q q q q q q q q q qq q q qq q qq q qq qq qq q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q qq q qq q q qq qq q 0.8 q q q q q q q q qq qqq q q q q q q qq q q q q q q q q qq q q qqq q qq qq q qqq q q q q q q q qq q q q q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q q qq q qq qq q qq qq q qq qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q qqq q q qq q q qq q q q q q q q q q q q qq qq q qq q qq qq q qq q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q qq qq q qq q q qq q qq q qq q q q q q q q q q q q q qq q qq q q q q q q qq q qq q q qq q q q q q q q q q q q qq q qq q q qq q q q q q q q q qq q q q q q qq q q q qq q q q q q q qq qq q qq qq q X[i+1] q q q q q q q q q q qq qq q qq q q q q qq q q qq q q q q q q q q qq q q q q q q q q q q q q qq q q q q qq q q q q q q q qq q qqqq q q q qq q q q q q q q qq q q qq qqqq q q q qq q q q qq q q q q q q q q q q q q q qqq q q q q qqq q q X[i] q q q qq q qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq qq qq q q qq qq q qq q q q q q q qq qqq qq q q q q q q qq qqq q q q q q q q q q q q q q q q qq qq q q q q qq qq qq qq qq qq q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qqq qq q qq q qq q qq q q qq q qq q q q q qq q q q q q q q qq q q q qqq q q qq q qq q qqq q q q q q q q q q q q q q q q q q q q q q q qq qq qq q qq qq qq q qq q q q q q q q q q q q q qq qq qq q q q q q q q q qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq q q q qq q qq qqq qq q q qq q q q q qq q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q q q q q q q q q q qq q q q q q q q q q q q qq qq q qq q q q q q q qq q q q q qq q q q q q qq q q q q q q q q q q qq q qq q q q qq qq q q q q q qq q q q q q q q q q q q q q q q q qq q q qq q q qq qq qq q q qq q qq q q q qq q qq q qq q q q q q qq q qq q q q qq q qq q q q q q qq qq qq q qq qq q qq q qq q q q qq qq q q q q q q q q q q q q q q q q q q q q q qq q qq q q qq q qq qq qq q q q q q q q q qq q 0.6 q q q q qq q q q q qq q q q q q q q q q q q q q qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q qq qq q q qq qq q q q q q q q q qq q q q qq q qq q q q q q qq 0.4 0.4 q q q q q q q qq qq qq q q q q q q q qq qq q q q q q q q q q q q q q q q q q q q q q q qq q q q qq qq q q qq qq qq q q q q q q q qq qq q q qq q q q q q q qq q q q q q q q q q q q qq qq q qq q qq q q q qq qq q qq q q q qq q q q q qq q q q q q q q q q q q q q q q q qq qq qq q q qq q q qq qq qq q q q X[i+2] q q q q q q qq q qq q qq q q q q q qq q q q q q q q q q qqq q q q qq q q q q qq q q q qq q q q q q q q q q q q q q q q q q q q q qq qq qq q q q qq qq qq q q qq q q q q qq q qq q qq q q q q q qq q q qq q q q q q q qq q q q q q qq q q q q q qq q q q qq q q q q q q q q q q q q q q q q q q q q qq q qq qq q q qq qq qq q q q q q q q q qq q qq q q q q q q q q q q q qq qq q q qq q q q qq q q qq q qq q q q q qq qqq q q q q q q q q q q qq q qq qq q q q q q qq q qq q qq qq q qq q q q q q q q q q q q q q q q q q q q q q qq q qq q qq q X[i+1] q qq qq q q q q qq qq q q q q q q q q q q q q q q q q q q q q qq qq q qq qq qq q qq q qq qq qq qq qq q q q qq q qq q q q q q qq q qq qq qq q q q qq q q q qq qq q q q q q q q q q q q q q q q qq qq q qq q qq qq q q qq q qq q q q q q qq q qq qq q qq q q q q qq q q q q q qq q q q q q q q q q q qq qq q qq q q q q q q q q q q q q q q q qq q qq qq q q q q qq q q qq qq q qq q qq q q q q q q q qqq q q q q q qq qq q q q qq q q q q q q q q q q q q q q q q q q qq qq qq q qqq q q qq q q qq qq q q qq q q qq q q q q q qq q qq q q q q qq qq q q q q q q qq q q q q q qq q q qq q q qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq qq qq q q qq q qq qq q q qq qq q q q qq qq qq q qq q q qq q q qq qq q qq q q q qq q q qq q q q q q q 1.0 q qq q q q qq q 0.4 q q q qq q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q qq q qq qq q qq qq q qq q qq q q qq q q q q qq q q q q q q q qq q q q q q q q q q q qq qq qq q q q qq qq q q qq q q q qq qq q q q q q q q q q q q q q qq qq qq q qq q q q q q qq q q qq q qq q q qq q q q q q q qqq q q q q q qq q q q q q q q q q q q q q q q qq q q qq q q qq qq qq qq q q q q qq q q q q q q q q q q q q q q q q q qq q q qq qq q q q qq q q q qq qq q q q qq q q q q q qq q q q q q qq q qq q q q q q q q q qq qq q qq q q qq q q q qq qq q q q q q q q qq qq q q q q q q q q q q q q q q q qq q q qq qq q q qq q q q qq qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q qq q q qq q qq q q q q q qq qq q q q qq q qq qq q q qq qq q q q q 0.8 q qq q qq q q q qq qq qq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q qq qq qq q q q qq q q qq qq qq q q q q q q qqq q q q q qqq q q q q q q q q q q qq qq qq qq qq q 0.2 0.2 q q q q q q q q q q q q q qq qq qq q q qq q q q q q q q q q q q q q q qq qq qqq q qq q q q q q q q q q q q q q q q q q q q q q q q qq qq q q q q qq q qq q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q qqq q q q q q q qq q qq q q q q q q q q q qq q q q qq q q q q q q q q q qq q q q q q q q qq q q q q q q q qqq qq q q qq qq q q qq q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq qq qq qq q qq q q q qq q q q qq qq q q q qq q q 0.6 q q q q q q q q q q q qqq q q q q q q q q qq q q q q q qq q q q q q qq q qqqq q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q qq q qq q q q q q q q q q q q 0.2 q q q qq q q q q q q q q q q q q q q qq q q qq q q q q q q q q q qqq qq q q qq q q qq q q q q qq q qq qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qqq q q q q q qq q q q q q q q q q q qq qqq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q q q q q qq q qq q q q q q q q q q qq q q q q q q qq q q qq q q q q q q q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q 0.4 q q qq q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q qq q q q qqq q q q q q q qq q q q qqq q q q q q q q q q q q q q q q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q qq q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q q q q q q q q q qq q q q q q q q q q q q q q qq q q q q qq qq q q q q q q q qq q q qq q q q q q q q qqq q q q q q q q q q qqq q q q q q q q qq q q q q q q q q qq q qq q qq qq q q qq qqq q q q q q q qqq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 0.2 q q q q qq q q q q q q q qqq q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q qq q q q q qq q q q q q q q q q qq q q q q q q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q q q 0.0 q q qq q q qq q q q q q q q q q 0.0 0.0 qq q qq q q q q qq q qq q q q q qq q q q q q q q q q q q q q q q q 0.0 0.0 0.2 0.4 0.6 0.8 1.0 0 500 1000 1500 2000 2500 3000 0.0 0.2 0.4 0.6 0.8 1.0 X[i] i X[i] Abbildung: Streudigramm einer mittels LCG erzeugten Zahlenfolge Xi ∝ U(0, 1), i ∈ {n ∈ N | n ≤ 3000} 10 / 28
    • Grundlagen Analyse der Fuhrparkdaten Vorbereitung Erzeugung realistischer Fuhrparkdaten Auswertung ZusammenfassungErhaltene Daten Daten ungeeignet zur direkten Bearbeitung Daten enthalten uberfl¨ssige Information ¨ u Daten enthalten gesch¨tzte Daten u Daten enthalten Redundanz 11 / 28
    • Grundlagen Analyse der Fuhrparkdaten Vorbereitung Erzeugung realistischer Fuhrparkdaten Auswertung ZusammenfassungUmformung der Daten 12 / 28
    • Grundlagen Analyse der Fuhrparkdaten Vorbereitung Erzeugung realistischer Fuhrparkdaten Auswertung ZusammenfassungHypothesen Aufgestellte Hypothesen: 1 Je l¨nger ein Fahrauftrag, desto h¨her ist die Laufleistung a o 2 An Samstagen und Sonntagen bleibt die Anzahl der Fahrzeuge gleich, da kaum Fahrzeuge abgegeben oder gemietet werden 3 In der Mitte der Woche (Dienstag oder Mittwoch) sind die meisten Fahrzeuge ausgeliehen 4 Innerhalb einer Woche (Sonntag bis Samstag) ergibt sich eine Binomialverteilung der Daten 5 Sehr viele Fahrzeuge werden mit einer Dauer bis zu zwei Tagen ausgeliehen 6 Viele Fahrzeuge werden zudem auch von Montag bis Freitag (5, 12 Tage) oder Montag bis Montag (7, 14, 21 Tage) ausgeliehen 7 13 / 28
    • Grundlagen Analyse der Fuhrparkdaten Vorbereitung Erzeugung realistischer Fuhrparkdaten Auswertung ZusammenfassungBoxplots der Laufleistungen Laufleistung korrigiert Laufleistung korrigiert Laufleistung korrigiert Laufleistung 1000 1500 2000 2500 3000 1000 1500 2000 2500 3000 1000 1500 2000 2500 3000 1000 1500 2000 2500 3000 q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 500 500 500 500 0 0 0 0 q Laufleistung Laufleistung Laufleistung Laufleistung 1000 1500 2000 2500 3000 1000 1500 2000 2500 3000 1000 1500 2000 2500 3000 1000 1500 2000 2500 3000 q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 500 500 500 500 q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q 0 0 0 0 q Januar Februar März April 14 / 28
    • Grundlagen Analyse der Fuhrparkdaten Vorbereitung Erzeugung realistischer Fuhrparkdaten Auswertung Zusammenfassung¨Ubersicht uber die ausgeliehenen Fahrzeuge ¨ Anzahl ausgeliehener Fahrzeuge pro Tag q 170 q q 150 qq q q Anzahl der ausgeliehenen Fahrzeuge qq q qq q q q q q q 130 q q qq q q q q q q q q q q q qq qq q 110 q q q q q q q q q q q q q 15 30 45 60 75 90 q q q qq q q q q q q q q q q q q q q q q q q qq qq q q q q qq q qq qq qq qqqq q q q q q qq qq q qq q q q qqq q q qqq q qqqqqq q 0 0 7 14 21 28 35 42 49 56 63 70 77 84 91 98 105 112 119 126 Tag ¨ Abbildung: Ubersicht ausgeliehener Fahrzeuge Januar bis April 2007 in K¨ln-Wahn o 15 / 28
    • Grundlagen Analyse der Fuhrparkdaten Vorbereitung Erzeugung realistischer Fuhrparkdaten Auswertung ZusammenfassungHistogramm uber die Anmietdauer von PKWs ¨ Dauer der Fahraufträge in Tagen Dauer der Fahraufträge in ganzen Wochen 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.3 rel. Hk. der Fahraufträge rel. Hk. der Fahraufträge 0.2 0.1 0.0 0 7 14 21 28 0 7 14 21 28 Dauer in Tagen Dauer in Tagen Abbildung: Diagramm uber die Fahrauftragsdauern (untersuchte Daten, ¨ Jan-Apr 2007) 16 / 28
    • Grundlagen Datenmodell und Grundannahmen Analyse der Fuhrparkdaten Verteilungen der zu erzeugenden Daten Erzeugung realistischer Fuhrparkdaten G¨te der generierten Daten u ZusammenfassungDatenmodell f¨r die auszugebenden Daten u Bezeichnung Kurzbezeichner Eigenschaften Start s s ∈ N+ Ende e e ∈ {n ∈ N+ | n > s} Distanz (L¨nge der Wegstrecke) a l l ∈ N0 Fahrzeugklasse (Typ) t t ∈ {1, 2, 3, 5} Tabelle: Datenmodell f¨r die auszugebenden Daten u 17 / 28
    • Grundlagen Datenmodell und Grundannahmen Analyse der Fuhrparkdaten Verteilungen der zu erzeugenden Daten Erzeugung realistischer Fuhrparkdaten G¨te der generierten Daten u ZusammenfassungInternes Datenmodell Bezeichnung Kurzbezeichner Eigenschaften Start sg sg ∈ N+ Distanz (L¨nge der Weg- a lg lg ∈ N0 strecke) Dauer dg dg ∈ N0 day day Wochentag des Starts sg 0 ≤ sg ≤ 6 day day Wochentag des Endes eg 0 ≤ eg ≤ 6 Fahrzeugklasse (Typ) tg 0 ≤ tg ≤ 4 Dauer in Wochen dgweek week ∈ N , dg 0 week = 0 → s day ≤ e day dg g Tabelle: Datenmodell f¨r die intern erzeugten Daten u 18 / 28
    • Grundlagen Datenmodell und Grundannahmen Analyse der Fuhrparkdaten Verteilungen der zu erzeugenden Daten Erzeugung realistischer Fuhrparkdaten G¨te der generierten Daten u ZusammenfassungGrundannahmen 1 Erzeugung der Daten erfolgt wochenweise 2 Start eines Fahrauftrages f¨llt mit gleicher Wahrscheinlichkeit a in eine der Wochen 3 Wochentag von Ausleihe und R¨ckgabe und Typ des u Fahrzeugs anhand der relativen H¨ufigkeit aus den a untersuchten Daten 4 Wochentag von Ausleihe und R¨ckgabe und Typ des u Fahrzeugs sind unabh¨ngig a 5 Laufleistung h¨ngt nur von der Dauer ab a 19 / 28
    • Grundlagen Datenmodell und Grundannahmen Analyse der Fuhrparkdaten Verteilungen der zu erzeugenden Daten Erzeugung realistischer Fuhrparkdaten G¨te der generierten Daten u ZusammenfassungVerteilung der Dauer eines Fahrauftrages Dauer der Fahraufträge in Tagen Dauer der Fahraufträge in ganzen Wochen 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.3 rel. Hk. der Fahraufträge rel. Hk. der Fahraufträge 0.2 0.1 0.0 0 7 14 21 28 0 7 14 21 28 Dauer in Tagen Dauer in Tagen Abbildung: Diagramm uber die Fahrauftragsdauern (untersuchte Daten, ¨ Jan-Apr 2007) 20 / 28
    • Grundlagen Datenmodell und Grundannahmen Analyse der Fuhrparkdaten Verteilungen der zu erzeugenden Daten Erzeugung realistischer Fuhrparkdaten G¨te der generierten Daten u ZusammenfassungVerteilung der Dauer eines Fahrauftrages Verteilung der Auftragsdauer Seien Vs und Ve die Wahrscheinlichkeitsverteilungen der Anmiet- und R¨ckgabetage wie in den Grundannahmen gefordert und seien u Xs ∝ Vs und Xe ∝ Ve die Wochentage, an denen der Fahrauftrag beginnt bzw. endet. Sei weiterhin dgweek ∝ Geo 0 (p) mit p ∈ (0, 1]. Dann ergibt sich die Auftragsdauer dg wie folgt:  7 dgweek + X − X , mit Wkt. 75%   e s  0, mit Wkt. 18,625% dg =  14, wenn Xs = 0 sonst.     0, sonst 21 / 28
    • Grundlagen Datenmodell und Grundannahmen Analyse der Fuhrparkdaten Verteilungen der zu erzeugenden Daten Erzeugung realistischer Fuhrparkdaten G¨te der generierten Daten u ZusammenfassungVerteilung der Dauer eines Fahrauftrages Dauer der Fahraufträge in Tagen Dauer der Fahraufträge in ganzen Wochen 0.12 0.30 rel. Hk. der Fahraufträge rel. Hk. der Fahraufträge 0.08 0.20 0.04 0.10 0.00 0.00 0 7 14 21 28 35 42 0 7 14 21 28 35 42 Dauer in Tagen Dauer in Tagen Abbildung: Diagramm uber die Fahrauftragsdauern (erzeugte Daten, ¨ Parameter: p = 0.78) 22 / 28
    • Grundlagen Datenmodell und Grundannahmen Analyse der Fuhrparkdaten Verteilungen der zu erzeugenden Daten Erzeugung realistischer Fuhrparkdaten G¨te der generierten Daten u ZusammenfassungG¨te der generierten Daten u Qualitative Bewertung erzeugte Fahrauftragsdauern ¨hneln den originalen Daten stark a aber: Schw¨chen im Nachbilden der irrationalen Leihdauern a Quantitative Bewertung bleibt der Betrachtungen der hierauf aufsetzenden Masterarbeit uberlassen ¨ m¨glicher Ansatz: χ2 -Anpassungstest o 23 / 28
    • Grundlagen Datenmodell und Grundannahmen Analyse der Fuhrparkdaten Verteilungen der zu erzeugenden Daten Erzeugung realistischer Fuhrparkdaten G¨te der generierten Daten u ZusammenfassungMeta-Bewertungskriterium Anzahl ausgeliehener Fahrzeuge pro Tag q 135 q q q Anzahl der ausgeliehenen Fahrzeuge q q q q 120 q q q q q q q q q q q q q q q qq q q q q qq q 105 q q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q 20 30 40 50 60 70 80 90 q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq qq q q qq q q qq qq qq q q q q qq q q qq q q q qq q q 0 7 14 21 28 35 42 49 56 63 70 77 84 91 98 105 112 119 126 Tag Abbildung: Anzahl ausgeliehener Fahrzeuge pro Tag. Erzeugte Daten (2547 Datens¨tze). a 24 / 28
    • Grundlagen Analyse der Fuhrparkdaten Fazit Erzeugung realistischer Fuhrparkdaten Ausblick ZusammenfassungFazit Vorhandene Daten umfangreich, aber teilweise inkonsistent Best¨tigung der Echtheit der Daten durch Analyse m¨glich a o Intuitive Hypothesen nur zum Teil korrekt → statistische Analyse der Daten notwendig Extrahieren typischer Merkmale anhand eines abstrakten Modells Erzeugung brauchbarer Daten nach Umsetzung des Modells 25 / 28
    • Grundlagen Analyse der Fuhrparkdaten Fazit Erzeugung realistischer Fuhrparkdaten Ausblick ZusammenfassungKritik und Ausblick Kritik Untersuchte Daten zu niedrig aufgel¨st, inkonsistent, o Merkmale unzweckm¨ßig erfasst a Aufgestelltes Modell noch zu abstrakt, statistische Untersuchung der Daten noch nicht ausgereizt Fehlen quantitativer Messverfahren f¨r G¨te erzeugter Daten u u Ausblick Sammeln neuer und qualitativ h¨herwertiger Daten o (Telemetrie) Anwenden von Verfahren der Computational Intelligence Anwendung statistischer Tests (χ2 -Anpassungstest,etc.) 26 / 28
    • LiteraturverzeichnisLiteraturverzeichnis I Brandt, Siegmund: Datenanalyse. BI-Wiss.-Verl, Mannheim, 1992. Carnap, Rudolf: Induktive Logik und Wahrscheinlichkeit. Springer, Wien, 1959. Greenberger, Martin: Notes on a New Pseudo-Random Number Generator. Journal of the ACM, 8(2):163–167, 1961. Haahr, Mads: Introduction to Randomness and Random Numbers, 2011. 27 / 28
    • LiteraturverzeichnisLiteraturverzeichnis II Knuth, Donald Ervin: The art of computer programming. - 2: Seminumerical algorithms, Band 2 der Reihe Seminumerical algorithms. Addison-Wesley, Reading, Mass, 3 Auflage, 1998. Marsaglia, George: Random Number Generators. Journal of modern applied statistical methods: JMASM (J Mod Appl Stat Meth), 2(1):2–13, 2003. Matsumoto, Makoto und Takuji Nishimura: Mersenne twister: a 623-dimensionally equidistributed uniform pseudo-random number generator. ACM Transactions on Modeling and Computer Simulation, 8(1):3–30, 1998. 28 / 28