Mateusz Richtscheid: Wraz z rozwojem machine learningu zwiększają się zdolności maszyn do postrzegania rzeczywistości. Szczególnie popularna w dziedzinie wizji komputerowej jest klasyfikacja obiektów na zdjęciach. W trakcie prezentacji pokażę, na przykładzie serwera OpenCPU i sieci Inception, w jaki sposób wzbogacić projekt webowy o tę możliwość.
12. But what does it mean?
• More neurons and layers
• Sophisticated models and learning algorithms
• Very long training times on high-end hardware
• Gigabytes of training data
• More network abilities
12
27. Inception network
(GoogLeNet)
• ImageNet classification challenge 2014
• 1000 object classes
• Top-5 accuracy 93.33%
• Trained on a few high-end GPUs within a week
• 1.2 million images for training
• Dumped model weights around 40MB
27
29. OpenCPU
• HTTP API for methods implemented in R packages
• Data scientists can provide useful methods
• Web developers can use them in various apps
29
32. Possible improvements
• Use of Natural Language Processing
• Using multiple cameras
• Run on Raspberry Pi
• Use ML platform
• Microsoft Computer Vision API
• Google Vision API
• Amazon Rekognition
32