Wissenschaftlicher Mitarbeiter bei Hamburg University of Applied Sciences (HAW) at Hamburg University of Applied Sciences (HAW)
Apr. 22, 2022•0 likes•16 views
1 of 46
Lebensmittelkontrolle 2.0: Das AAPVL Projekt
Apr. 22, 2022•0 likes•16 views
Download to read offline
Report
Science
Lebensmittelkontrolle 2.0: Das AAPVL Projekt
Alexandra Krewinkel, Sebastian Sünkler, Dirk Lewandowski, Niklas Finck, Boris Tolg, Lothar W. Kroh & Jan Fritsche
Food Science Dialog Hamburg 2015, September 14-18, 2015, Hamburg Germany
2. Onlinehandel mit Lebensmitteln
Was gibt es zu kaufen?
Einführung
Steigerung des jährlichen Online-Umsatzes
auf 20 Milliarden Euro bis 2020
(Prognose von Ernst & Young)
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 2
3. Rechtlicher Hintergrund
§ 3 Nr. 1 LFGB in Verbindung mit Art. 3 Nr. 8 der Lebensmittel-
Basisverordnung (EG) Nr. 178/2002
„Inverkehrbringen“ bedeutet das Bereithalten von Lebensmitteln für
Verkaufszwecke einschließlich das Anbieten zum Verkauf oder jede
andere Form der Weitergabe, gleichgültig ob unentgeltlich oder nicht,
sowie der Verkauf, der Vertrieb oder andere Formen der Weitergabe
selbst.19
Leitfaden für die Durchführung einzelner Bestimmungen der
Verordnung (EG) Nr. 852/2004 über Lebensmittelhygiene
(SANCO/1731/2008 Rev. 6)
- 3.9. Lebensmittelunternehmen und Internet-Verkäufe
Einige Unternehmen bieten ihre Waren im Internet zum Verkauf an.
Wenngleich diese Art von Handel nicht speziell in der Verordnung
aufgeführt ist, fallen die betreffenden Unternehmen unter die Definition
des „Lebensmittelunternehmens“ und unterliegen den einschlägigen
Vorschriften des Lebensmittelrechts.
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 3
4. Entwicklung von automatisierten Analyseverfahren
zur Identifizierung und Bewertung von nicht
verkehrsfähigen Produkten des virtuellen
Lebensmittelmarktes
• finanziert durch BMEL mit ca. 500.000 € (3 Jahre)
• Projektträgerschaft durch die Bundesanstalt für
Landwirtschaft und Ernährung (BLE) im Rahmen des
Programms zur Innovationsförderung
• Projektstart: 15.02.2013
• Projektende: 14.02.2016
Kontrolle des Online-Lebensmittel-
handels in Deutschland
AAPVL
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 4
5. Interdisziplinäres Forschungsprojekt
• Department Information: Websuche
Prof. Dr. Dirk Lewandowski, Sebastian Sünkler
• Department Medizintechnik: Text- und Bildanalyse
Prof. Dr. Boris Tolg, Niklas Finck
• Department Ökotrophologie/ Food Science: Applikation & Bewertung
Prof. Dr. Jan Fritsche, Alexandra Krewinkel
• Bundesamt für Verbraucherschutz und Lebensmittelsicherheit
Dr. Georg Schreiber, G@ZIELT
Das Projekt
AAPVL
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 5
6. Das Projekt
AAPVL
Ziele des Projekts
Automatisierte Produktkontrolle
Entwicklung eines Systems zur automatischen Identifizierung von potentiell
nicht-konformen Lebensmitteln (inklusive Händlerinformationen) und deren
sachkundige Bewertung:
• Optimierung der Relevanz der Suchmaschinentreffer
• Integration von Text-, Logo- und Bilderkennungsverfahren zur
erweiterten Identifizierung nicht konformer Lebensmittel unter
besonderer Berücksichtigung von spezielle Auslobungen und
Kenntlichmachungen
• Entwicklung einer Monitoring-Komponente zur regelmäßigen
automatisierten und risikoorientierten Abfrage definierter Lebensmittel,
Inhaltsstoffe oder Händler
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 6
7. Entwicklung der prototypischen Software
• Automatisierte Umsetzung der Abläufe der Produktrecherche
– Auftragsrecherchen
• Automatisierte Produktbewertung
– nicht zugelassene Inhaltsstoffe (z.B. pharmakologisch aktive
Substanzen)
– Health Claims
– Logo- und Siegelmissbrauch
• kontinuierliche Überwachung von Anbietern und Produkten in einem
steuerbaren Monitoring über Risikoprofile
Das Projekt AAPVL
Operative Umsetzung
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 7
9. Pilotstudie
Hintergrund und Zielsetzung
• Zusammenarbeit mit dem Bayerischen Landesamt für
Gesundheit und Lebensmittelsicherheit
• Ermittlung aller Internetangebote von Produkten die zwei spezifische
pharmakologisch aktive Substanzen enthalten (Alkaloide)
• Substanzen stehen im Verdacht in Kombination
gesundheitsschädlich zu sein
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 9
10. Hintergrund und Zielsetzung
• Suchmaschinensuche in google.de und bing.de
• Verwendung von 11 spezifischen Suchanfragen
• Relevanzbeurteilung der Suchmaschineergebnisse anhand der
Produktangebote im gesamten Shop
• Ermittlung der Händlerinformationen
Pilotstudie
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 10
24. Technische Anforderungen
• Aufteilung der Software in Module zwecks vereinfachter Wartung und
Erweiterung (z. B. Trennung zwischen Grafischer Benutzerschnittstelle und
Analyse Applikationen)Verwendung von 11 spezifischen Suchanfragen
• Zentraler Zugriff auf die Anwendung (Web-Anwendung)
• Zentrale Kommunikationsschnittstelle (Datenbank)
• Verarbeitung unstrukturierter Daten (Webseiten) und Bilder aus dem World
Wide Web (Speicherung, Analyse, Export)
• Parallele Verarbeitung rechenintensiver Analyseprozesse (Performance)
Realisierung der Anforderungen
• Nutzung standardisierter Entwurfsmuster für die Entwicklung von
Teilkomponenten der Software
• Drei-Schichten-Architektur für den gesamten Prototyp
• Rechencluster zur Umsetzung eines verteilten Systems
24
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Anforderungen
26. Technologien:
• MySQL: Relationales Datenbankmanagementsystem
• HTML: Quelltext für die Strukturierung von Webseiten
• XLSX: Microsoft Office Excel-Format
• JPG, PNG, GIF: BildformateVerarbeitung unstrukturierter Daten
(Webseiten) und Bilder aus dem World
26
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Data Tier (Datenhaltung)
27. Technologien (Datenanalye)
• C#: Objektorientierte Programmiersprache mit Komponenten für die
Realisierung von verteilten Prozessen
• RegEx: Zeichenketten zur Beschreibung des Aufbaus von Text-
Mengen (Pattern Matching)
• OpenCV: Programmbibliothek zur Bildverarbeitung (Extraktion von
Texten in Bildern, Musterkennung in Bildern)
27
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Application Tier
Technologien (Datenerfassung)
• Apache: Standard Webserver mit hoher Verbreitung mit MySQL und PHP-
Unterstützung
• cURL: Anwendung zur Simulierung von HTTP-Clients für den Aufruf und die
Speicherung von Webseiten
• XPath: XML Path Language zur Extraktion von Inhalten aus XML-Dateien
und HTML-Dateien
28. 28
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
ClientTier (Benutzerschnittstelle)
Technologien
• HTML & CSS: De-facto-Standard für Layout und Design von Webseiten
• JavaScript: Nutzung von jQuery (Programmbibliothek zur vereinfachten
Implementierung von asynchronen Prozessen und Echtzeit Manipulation
von Webseiten)
• PHP: weit verbreitete Programmiersprache zur Entwicklung von Web-
Anwendungen
• PHPExcel: Programmbibliothek zur Erstellung von Excel-Tabellen z. B. aus
Datensätzen in Datenbanken
30. 30
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Recherch
eauftrag Anwender
GUI
Technischer Ablauf
1. curl https://www.google.de/q=synephrin&start=1 (Erfassen der
Google Suchergebnisseiten)
2. xpath->evaluate(//h[@class='r']/a]) (Extraktion der Links aus den
Suchtreffern)
3. Abgleich der Links mit einer Negativliste zur Filterung nicht gewollter
Webseiten
4. Speichern der Metadaten der URLs in der Datenbank
5. curl http://miramix.com/product-tag/synephrin/ (Speichern aller
extrahierten URLs in HTML)
Software-Prototyp:
Software Frontend
31. 31
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Shopidentifikation
Lebensmittel-
shopidentifikation
Wissensbasis
• 6500 Internetseiten geclustert nach Kategorien
(Shops, Lebensmittelshops, Informationseiten)
• Quellen für die Seiten sind u. a.:
• Ergebnisse zuvor durchgeführter
Teststudien (manuelle Klassifikation von
Internetseiten)
• dmoz.de (Webverzeichnis)
• eTrustedShops (Zertifizierungsstelle für
Online-Shops)
• preis.de (Preisvergleichsportal)
Software-Prototyp:
Software Backend
32. 32
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Shopidentifikation
Lebensmittel-
shopidentifikation
Technischer Ablauf
1. Wörter werden abhängig von dem Kontext in dem
sie in die Webseite eingebettet sind gespeichert,
z.B.
- <script>wörter</script> als script::wörter
- <title>text</title> als title::text
- <a ...>link</a> als a::link
- <tag atribut=value> als tag::atribut::value
2. Bewertung der Wörter nach Relevanz(anhand
der Wissensbasis)
Relevanz:
- Wahrscheinlichkeit p
- Häufigkeit h
- e := p * log(h)
3. Bewertung der Seiten anhand der
aussagekräftigsten Wörter und Ausgabe einer
"Sicherheit"
Software-Prototyp:
Software Backend
34. 34
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Technischer Ablauf
1. curl http://miramix.com/product-tag/synephrin/ (Aufruf der gespeicherten
URLs)
2. xpath->evaluate(//a) (Extraktion der Links und Linktexte auf der
Webseite)
3. Abgleich der extrahierten Inhalte mit Positivliste (gewichtete
Suchterme)
4. curl http://miramix.com/impressum
5. Auslesen der Daten mit Regulären Ausdrücken angelehnt an DIN 5008
Software-Prototyp:
Software Backend
36. 36
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Software Backend
Technischer Ablauf
1. Anfrage an die Datenbank für die Zusammenstellung von
Abschlussberichten (MySQL Statements)
2. Speicherung der Werte in Arrays
3. Aufteilung der Ergebnistabellen nach Bundesländern
4. Nutzung von Funktionen in PHPExcel für Erstellung der Excel-Tabellen
5. Benachrichtigung über Fertistellung des Berichts per E-Mail
37. 37
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Manuelle Bewertung
GUI
Technischer Ablauf
1. Zusammenstellung der nachzubewertenden Webseiten
nach definierten Auswahlkriterien aus der Datenbank
2. Darstellung der Webseiten im Browser mit Formularen
Software-Prototyp:
Manuelle Bewertung
38. Pilotstudie
Demo-Beispiel
Ziel:
• Identifikation von möglichst Bio-Lebensmittelshops
• Testlauf der bisher umgesetzten Module des Prototypen
Datenerfassung
Dublettenfilterung
und Abgleich der
Negativliste
Shopidentifikation
Lebensmittel-
shopidentifikation
Impressums-
erkennung
Dubletten-
filterung
Food Science Dialog 2015: Lebensmittelkontrolle 2.0 38
42. 42
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Logoerkennung
Ausgangslage
• Keine gesetzliche Norm bezüglich des Logos und seiner Verwendung im Internet
• Logos im Internet unterscheiden sich durch u. a. durch:
• Hohe Farbvarianz
• "Falsche" Seitenverhältnisse
• Zugeschnittene Logos
• Sehr kleine Logos
• Verdeckte Logos
• Auf der "offiziellen" Seite des Bio-Logos werden alleine drei verschiedene
Farbwerte verwendet
43. Bisherige Umsetzung
• Fokus auf “grünes” Bio Logo der EU
• Bild-Segmentierung:
• Reduktion auf Farbbereich des Logos
• Reduktion der gefundenen Bereiche (Kleine Bereiche
verschwinden)
• Zusammenhängende Bereiche einzeln verarbeiten
• Zu kleine Bereiche verwerfen
• Anteil heller Teile (potentielle Sterne) muss Mindestmaß
überschreiten
43
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
Software-Prototyp:
Logoerkennung
45. Fazit und Ausblick
• Das AAPVL Projekt hat die technologischen Grundlagen für die
Entwicklung eines automatisierten Analyseverfahrens für die
Lebensmittelkontrolle im Internet geschaffen.
• Das APPVL Konzept liefert einen effektiven Beitrag, um auf
effizienter Weise, die hohe Lebensmittelsicherheit im Onlinehandel
zu gewährleisten.
• Anhand einer Fallstudie konnte die Praxistauglichkeit des APPVL
Konzept für die Lebensmittelkontrolle im Internet gezeigt werden.
• Weitere Fallbeispiele und Optimierung des APPVL Konzepts folgen
(z.B. Weiterentwicklung der Reduktionsstufen).
45
Food Science Dialog 2015: Lebensmittelkontrolle 2.0
46. Danke für die Aufmerksamkeit
46
Food Science Dialog 2015: Lebensmittelkontrolle 2.0