Leo 1402
Upcoming SlideShare
Loading in...5
×
 

Leo 1402

on

  • 197 views

 

Statistics

Views

Total Views
197
Views on SlideShare
197
Embed Views
0

Actions

Likes
0
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Der erste Use Case, den wir Ihnen heute präsentieren möchten, ist ein Immobilienportal. Ich nehme an, dass jeder weiss was mit Immobilienportal gemeint ist. Sie suchen eine neuen Wohnung oder Haus zur Miete oder zum Kauf. Also gesehen sie auf eine Internetseite, geben dort ihre gewuenschte Wohnlage, ihre Preisvorstellungen und sonstigen Wünsche ein, die sie an ihre Wohnung stellen und erhalten von der Internetseite hoffentlich die gewünschten Ergebnisse.Wir möchten ihnen jedoch heute ein ganz besondere Portal vorstellen. Unser Portal ist naemlich mit Linked Open Data angereichert. Hier haben sie nicht nur die Möglichkeit Standardkriterien wie Wohnungsgröße und Mietpreis in die Suche einfließen zu lassen, sondern auch für Sie relevante Informationen, welche wir aus dem öffentlichen Sektor beziehen. Diese haben den Vorteil, dass sie verlässlich sind und bei entsprechender Pflege auch immer topaktuell.
  • Dies kann zum Beispiel die Entfernung zur nächsten Kita, einer Schule, zu einem Arzt, einer Apotheke oder einem Museum sein. Ebenfalls kann der maximale Lärmpegel und die Feinstaubbelastung in die Suche eingebracht werden.Wir haben hier also einen ganz klaren Vorteil für den Wohnungssuchenden, da er seine Suche feiner granulieren kann. Und je besser ihre Suche ist, desto eher werden Menschen ihr Immobilienportal aufsuchen und es benutzen.Wir wollen natürlich nicht nur den Wohnungssuchenden Mühe ersparen, sondern auch den Inserenten.
  • Auf unserem Immobilienportal inserieren sie ganz gewöhnlich ihre Immobilien, jedoch bekommen sie im Vergleich zur Konkurrenz bei uns noch interessante Zusatzinformationen, die sie sonst hätten mühsam zusammensuchen müssen. So wird Ihnen in diesem Beispiel angezeigt, dass sich keinerlei kulturelle oder erzieherische Einrichtungen befinden und sie Anzahl der Kriminaldelikte erschreckend hoch ist. Sie müssen dies nicht in Inserat einfließen lassen, können es jedoch tun, wenn sie es für nötig halten.So haben auch Inserierende etwas von öffentlichen Daten.
  • 1) Wir werden jetzt ein mal Beispielanfrage an den Server stellen.Friedrichstraße 129, BerlinUnd jetzt binden wir noch [irgendwas mit Lärmpegel und Schule] ein.Und da haben wir schon unsere Ergebnisse.2) So, jetzt zeig ich ihnen noch wie man inseriert.[Gute-Str guteZahl]Läuft.
  • Wir haben versucht möglichst viele öffentliche Datenquellen in unsere Suche einzubinden. Schulen, Kitas, Ärtze, Apotheken, Krankenhäuser und Museen haben wir auf berlin.de gefunden. Auf Anfrage an das Amt des Polizeipräsidenten, bekamen wir 420MB Kriminmalitätsstatistik per Mail. Wir lassen die Anzahl der Kriminaldelikte beim Inserieren als Zusatzinformation anzeigen.Die Lärm- und Feinstaubbelastung haben wir von der FIS Broker-Seite. FIS Broker ist ein von der Stadt Berlin bereitgestelltest Tool.Die Suche basiert auf Postleitzahlen, diese haben wir von der nicht-öffentlichen Seite postleitzahlen-berlin.com. Bei den Inseraten handelt es sich um erfundene Wohnungen, jedoch existieren die Adressen tatsächlich.
  • Die Daten zu diesem Use Case lagen uns als HTML-Dateien oder als PDFs vor. Die Umwandlung der HTML-Dateien zu RDF erfolgte mittels Java-Crawler. Die Daten aus den PDFs wurden manuell extrachiert und zu RDF umgewandelt.
  • Wir haben versucht möglichst viele Implementierungsmöglichkeiten in unserem Projekt unterzubringen. So wurde dieser Use Case in PHP und den gängigen Frontendsprachen implementiert. Der Zugriff auf den SPARQL-Endpoint erfolgt über ARC2. ARC2 ist eine gängige SPARQL-Anfrage-Engine für PHP. Es wird unter der W3C Software License und der GPL 2 und 3 veröffentlicht. Dementsprechend ist es also auch für den kommerziellen Gebrauch geeignet.
  • Als nächsten Use Case möchten wir Ihnen unser Zeitungsportal vorstellen. Wir verstehen unter einem Zeitungsportal, eine zu einer Zeitung gehörende Internetseite, die ihre Publikationen auch online vertreibt. Nun haben solche Portale aber ein grundlegendes Problem: Wenn ein Benutzer zusätzliche Informationen über ein im Artikel vorkommendes Wort haben möchte, muss er die Seite verlassen und mühselig im Internet nach dem gesuchten Wort recherchieren. Dies ist für den Benutzer unangenehm und zeitaufreibend.Auf der anderen Seite, sinken die Werbeeinnahmen der Webseitenbetreiber, weil die Verweildauer der Benutzer auf ihrer Seite sinkt. [je laenger Verweildauer auf Internetseite, desto mehr kann Betreiber fuer Werbung verlangen]Einfacher wäre es doch, wenn der Redakteur bestimmte „schwierige“ Wörter selber taggen würde und zu diesen Wörtern Informationen aus einer öffentlichen Hand am Rande der Internetseite eingeblendet werden. So muss der Benutzer die Internetseite nicht verlassen und hat gleich Informationen aus verlässlichen, öffentlichen Quellen.
  • Und genau das haben wir gemacht. Wenn wir jetzt auf einen Artikel klicken, gelangen wir zur Artikelseite. In der linken Spalte sehen sie einen Artikel aus der Sächsischen Zeitung. In der rechten haben sie die vom Redakteur markieren Wörter. Wir haben hier eine kleine Vorauswahl von Informationen getroffen, die unserer Meinung nach am relevantesten waren. Wenn wir jetzt auf eins der Dreiecke klicken [Click!]…
  • …, expandiert die Content Box und wir erhalten zusätzliche Informationen zu dem angeklickten Objekt.Wir müssen also nicht mehr die Seite verlassen, wenn uns eine Abkürzung nicht bekannt ist oder wir eine Person des politischen Lebens nicht kennen. Wir erhalten alle notwendigen Informationen aus einer Hand und was das wichtigste daran ist: Es sind zuverlässige Informationen. Sie entstammen nicht der Anarchie des Webs, wo jeder Hinz und Kunz alles behaupten kann, wonach ihm gerade ist. Nein, diese Informationen sind geprüft und von öffentlicher Hand herausgegeben.
  • Kommen wir zu den Datenquellen: Wir haben für Orte, Personen, Parteien etc. Schema erstellt mit den anzuzeigenden Eigenschaften wie z.B. Name, Alter, Geburtsdatum bei Personen. Dann haben wir versucht diese Informationen aus öffentlichen Datenquellen zu beziehen, falls dies nicht möglich war, haben wir auf nichtöffentliche Datenquellen zurückgegriffen.Das größte Problem bei nichtöffentlichen Daten war die Informationsmenge und wie man diese Filtert. So ist Angela Merkel z.B. ein Politiker und gleichzeitig ein Menschen. Dementsprechend hat sie als Politiker und als Mensch ein Geburtsdatum. Damit aber nicht beide Geburtsdaten in der Content Box angezeigt werden, hat das Team ein Regelsystem implementiert, welches Redundanz verhindert. [das Team hat darauf bestanden, dass dies erwaehnt wird]
  • Die vorliegenden Daten wurden alle manuell von den Quellen kopiert. Die Umwandlung zu RDF erfolgte [warten aus Saschas Antwort].
  • Dieser Use Case nutzt statische HTML-Seiten. JavaScripts greifen auf ein Use Case-eigenes Servlet zu. Das Servlet wiederum greift mit JENA auf den SPARQL-Endpoint zu und gibt dessen Antwort an das JavaScript zurück. Auf der Webseite wird das Ergebnis der SPARQL-Anfrage mit Hilfe von JavaScript in die Content Boxen geparst.
  • Bei dem nächsten Use Case handelt es sich um ein Suchportal für Rehabilitationskliniken. Dieser Use Case unterstützt Patienten bei der Suche nach einer ihren Bedürfnissen angepassten Rehaklinik. Die wenigen Seiten, die im Netz eine Suche nach Rehakliniken ermöglichen, beschränken sich der bei der Auswahl der Daten auf wesentliche Eigenschaften der Kliniken. Eine geeignete Rehaklinik zeichnet sich jedoch nicht allein durch ihre Ausstattung aus. Immer mehr Patienten liegt die Qualität des Services am Herzen. Für Pflegeheime gibt es bereits ein öffentliches Bewertungssystem, welches Auskunft über den Service des Pflegeheimes gibt. Wir haben angenommen, dass es solch ein System in absehbarer Zeit auch für Rehakliniken geben wird und haben dieses von uns erfundene Bewertungssystem in unsere Suche einfließen lassen. So kann der Patient,nicht nur die beste, sondern auch die freundlichste Rehaklinik für sich suchen Neben der Qualität des Services ist für den Patienten wichtig, ob die Krankenkasse, bei der er versichert ist, die Kosten für eine Behandlung in der entsprechenden Klinik übernimmt, dies ist nämlich nicht immer der Fall. Auch dieses Suchkriterium haben wir in unsere Suche einfließen lassen.
  • Wenn wir jetzt auf Suche klicken, gelangen wir zu der Suchmaske. Hier kann der Benutzer nicht nur sein Krankheitsbild, die Art der Reha und den Ort der Rehaklinik eingeben, sondern auch zu welcher Krankenkasse er gehört und wie gut die durchschnittliche Bewertung seiner Wunschrehaklinik sein soll.
  • Auf der Ergebnisseite bekommt er dann das Ergebnis zu seiner Suchanfrage. Hier sieht er grundlegende Informationen zu den ihm vorgeschlagenen Rehakliniken. Mit einem Klick auf „weitere Informationen“ werden zusätzliche Informationen zu der entsprechenden Rehaklinik angezeigt.
  • Dazu zählt eine genauere Aufschlüsselung der Bewertung, allgemeine Hinweise (in diesem Beispiel Verkehrshinweise) und eine Karte.
  • Folgende Datenquellen haben wir verwendet: Die von uns verwendeten Rehakliniken stammen von arzt-auskunft.de. Die Krankheitsbilder und Krankheiten wurden Wikipedia entnommen.Da es für Rehakliniken noch kein Bewertungssystem wie für Pflegeeinrichtungen gibt, sind die Bewertungsdaten frei erfunden. Die von uns angefragten Krankenkassen wollten unser Projekt nicht unterstützen und haben uns die Information, mit welchen Rehas sie zusammenarbeiten, nicht zur Verfügung gestellt. Daher sind die Verbindungen zwischen den Rehas und den Krankenkassen ebenfalls nur Dummydaten.
  • Alle uns vorliegenden Daten waren in HTML und wurden mit Hilfe von Crawlern in MySQL umgewandelt. Alle „öffentlichen“ Daten wurden gleich als RDF geparst. Krankheitsbilder wurden manuell ins System übernommen.
  • Dieser Use Case wurde ebenfalls wie der Use Case Immobilien in PHP implementiert. Der Datenzugriff erfolgte mittels ARC2.
  • Als nächstes möchten wir Ihnen den Use Case Touristik vorstellen. Dieser spricht zwei mögliche Zielgruppen an. Zum einen Touristen, die auf der Suche nach einem Hotel oder einem Restaurant sind und zum anderen einfach alle anderen Leute, die ein passendes Restaurant suchen.Sie selber kennen das vielleicht aus dem Urlaub: Als Tourist kann einem nicht nur Sonnenschein und Gastfreundschaft widerfahren, sondern auch die Schattenseite der Gastlandes. Reiseführer geben nur selten genaue Auskünfte über die Lärmbelästigung oder Kriminalität einer bestimmten Umgebung und so sind Touristen bei ihrer Suche nach “friedlichen und ruhigen” Hotels meist auf sich allein gestellt. Reiseportale versuchen mit Hilfe von Bewetrtungen anderer Reisender genau dieses Informationsloch zu stopfen, jedoch widersprechen sie die Meinungen dieser User meist so stark, dass man meinen könnte, sie hätten gänzlich verschiedene Orte besucht. Genau an dieser Stelle setzt unser Use Case an. Wir haben hier ein Portal entwickelt, dass uns die Möglichkeit bietet auf Grund fundierter öffentlicher Daten nicht nur das beste Hotel für unsere Reisebedürfnisse zu finden, sondern auch das sicherste und ruhigste. Ebenfalls lassen wir eine Blacklist in unsere Suche einfließen. So können sich Reisende auch gleichzeitig über die vor Ort herrschenden Hygienebedingungen der Einrichtung informieren.Die zweite mögliche Zielgruppe sind Menschen, die ein Restaurant oder Cafe für ein gemütliches Abendessen oder eine Cafekränzchen suchen. Wie oft habe sie schon neben pulsierenden Hauptstraßen oder donnernden Presslufthämmern speißen müssen, nur weil es einfach keine Internetseite gab, die den Lärmpegel der Umgebung angezeigt hat. Und genau diese zwei Informationslücken stopft unser Use Case.Wenn wir jetzt zum Beispiel ein Restaurant der gehobenen Art suchen würden, …

Leo 1402 Leo 1402 Presentation Transcript

  • Immobilien - Übersicht
  • Immobilien - Übersicht
  • Immobilien - Übersicht
  • Immobilien – Demo
  • Immobilien – Daten
    • öffentliche Datenquellen
    • berlin.de (Schulen, Kitas, Ärzte etc)
    • Polizeipräsident von Berlin (Kriminalität)
    • stadt-berlin.de (Lärm- und Luftbelastung)
    • andere Datenquellen
    • postleitzahlen-berlin.com (PLZ)
    • Inserate sind Dummydaten
  • Immobilien – Umwandlung
    • manuell
    • mit Java-Crawler
  • Immobilien – Technik
    • Webapplikation (PHP)
    • mit ARC2
  • Zeitung - Übersicht
  • Zeitung - Übersicht
  • Zeitung - Übersicht
  • Zeitung - Demo
  • Zeitung - Daten
    • öffentliche Datenquellen
    • auswertiges-amt.de
    • Internetpräsenzen der Länder
    • andere Datenquellen
    • Wikipedia, DBPedia
    • Parteiwebseiten
    • imdb.com
  • Zeitung - Umwandlung
    • manuell
  • Zeitung - Technik
    • statische Internetseiten
    • mit JavaScript+Java
  • Krankenhaus - Übersicht
  • Krankenhaus - Übersicht
  • Krankenhaus - Übersicht
  • Krankenhaus - Beschreibung
  • Krankenhaus - Demo
  • Krankenhaus - Daten
    • Datenquellen
    • arzt-auskunft.de (Rehakliniken)
    • Wikipedia (Krankheitsbilder)
    • Dummydaten
    • Bewertungen
    • Versicherungsdaten
  • Krankenhaus - Umwandlung
    • mit Crawlern
    • manuell
  • Krankenhaus - Technik
    • Webapplikation (PHP)
    • mit ARC2
  • Touristik - Übersicht
  • Touristik - Übersicht
  • Touristik - Übersicht
  • Touristik - Übersicht
  • Touristik - Demo
  • Touristik - Daten
    • öffentliche Datenquellen
    • Polizeipräsident von Berlin (Kriminalität)
    • stadt-berlin.de (Lärmbelästigung)
    • Bezirksamt Pankow (Zertifikat)
    • Dummydaten
    • Black- & Whitelist
    • Restaurants & Hotels
    • Bewertungen
  • Touristik - Umwandlung
    • manuell
  • Touristik - Technik
    • Wepapplikation (Grails)
  • Living Standards - Übersicht
  • Living Standards - Übersicht
  • Living Standards - Daten
    • öffentliche Daten
    • poznan.pl
  • Living Standards - Umwandlung
    • mit Crawlern
  • Living Standards - Technik
    • Wepapplikation (Struts)