ConveyorVision Applikation – Industrielle Bildverarbeitung für Förderbänder

Erfahren Sie, wie wir mit moderner Kamerasteuerung, optimierter OCR und intelligenter Logik eine schlanke, aber extrem leistungsfähige Lösung geschaffen haben – von den ersten Hürden bis zur finalen Echtzeit-Auswertung.

Kurzform

ConveyorVision vereint robuste Kamerasteuerung, performante OCR, smarte Förderband-Logik, modulare Plugin-Architektur und aussagekräftige Statistiken in einer .NET-Architektur. Dank Simulator, Live-Histogramm und transparentem Feedback können neue Features schnell entwickelt, getestet und beim Kunden sofort eingesetzt werden.

Die Entwicklung war nach 1 Monat abgeschlossen.

Einleitung

ConveyorVision ist eine .NET-basierte WPF-Applikation, die speziell dafür entwickelt wurde, Datumsaufdrucke auf Verpackungsschachteln in Echtzeit auf Förderbändern zu erkennen und auszuwerten. Hinter der Oberfläche verbirgt sich ein modularer Aufbau aus:

  • Kameraservice (DirectShow-basiert)
  • OCR-Service (Deep-Learning)
  • Segmentierungs- und Logik-Engine
  • Statistik- und Visualisierungsmodul
  • PLC-Anbindung (Siemens LOGO! per Modbus)
  • Simulator und Unit-Tests

Kern-Features

  1. Dynamische Kamerasteuerung
    • Auflösung, FPS, Bildformat (RGB24 / MJPG), Flip & Rotation in 90°-Schritten
    • Manuelle Belichtungszeit, Gain, Helligkeit, Kontrast, Weißabgleich
    • ROI (Region of Interest) für Cropping & Histogramm-Overlay
    • Bis zu 30 FPS im beschnittenen Ausschnitt
  2. Hochperformante OCR-Pipeline
    • Tesseract-Konfiguration mit Bruteforce-Optimierung
    • Deep-Learning-Fallbackmodelle für schwierige Cases
    • Whitelist-Filter, DPI-Anpassung, Graustufen-Conversion, 24 bpp-Modus
    • ROI-Crop für fokussierte Erkennung
  3. Intelligente Förderband-Logik
    • Erkennung, ob eine Schachtel bereits im Sichtfeld ist (keine Lichtschranke nötig)
    • Automatisches Auslösen von Aktoren per Siemens LOGO! über Modbus
    • Handling von Mehrfachschachteln, Stausituationen und „Leerlauf“
  4. Echtzeit-Statistik & Visualisierung
    • Gestapelte Zeitintervalle (10 Sekunden bis Minuten) für valide vs. invalide Schachteln
    • Live-Diagramme ohne Achsenbeschriftung, nur dezente Rasterlinien
    • Kennzahlen: Gesamt, Min/Max, Durchschnitt, Start-/End-Zeit
  5. Simulations-Modus & UI-Feedback
    • Integrierter Dispatcher-Timer zum Testen von Modulen
    • Histogramm-Overlay und transparente Masken für intuitive ROI-Justage
    • „Ampel“-Feedback (grün/rot) mit kontrastäquivalentem Vordergrundtext
  6. Modulare Architektur & Qualitätssicherung
    • Plugin-Verfahren erlaubt einfache Erweiterung um neue Module
    • Saubere Trennung von Services, ViewModels und Utilities
    • Umfangreiche Unit-Tests für Kamera, OCR, Segmenter und Statistik
    • Funktionsgarantie dank automatisierter Testläufe
  7. Daten-Logging & Cloud-Anbindung
    • Lokale CSV/TXT-Protokolle für Frames, Performance und Segmente
    • Optionaler Upload auf Server oder Cloud (REST/FTP)
    • Persistente Settings via JSON und Reflection

Entwickler-Einblicke: Herausforderungen & Lösungen

  • Falsche SPS-Server-IP
    Stundenlanges Debugging:
    ✓ Kabel?
    ✓ LOGO!-Firmware?
    ✓ .NET-Modbus-Client?
    Am Ende half nur end-to-end-Tracing im BackgroundWorker.
  • Relaiskarte vs. LOGO!
    Ursprünglich planten wir, Ventile direkt per Relais anzusteuern. Dank stabiler Bildlogik konnten wir dies umgehen und die SPS-LOGO! per Modbus zuverlässig nutzen.
  • Wegfall der Lichtschranke
    Intelligente Bild-Erkennung erkennt „Schachtel da/Schachtel weg“ rein softwarebasiert – die externe Lichtschranke wurde obsolet.
  • Statistik-Darstellung
    OOTB kein fertiges Diagramm für gestapelte Buckets verfügbar. Wir haben mit OxyPlot eigene RectangleBar-Series und fest definierte Zeitraster (10 s / 1 min) implementiert.

Performance-Optimierung

  1. Kamera-Tuning
    • Kürzere Belichtungszeiten, MJPG-Encoding
    • Dynamische Framerate-Limits → Förderband schneller
  2. OCR-Modelle
    • Bruteforce-Tuning (Englisch/Deutsch, PSM-Varianten, DPI, Whitelist etc.)
    • Deep-Learning-Fallback für komplexe Texte
  3. ROI & Filterketten
    • Nur relevante Bildteile verarbeiten
    • Kontrast- und Scharfzeichnungsfilter steigern Erkennungsrate

Ergebnis:
Statt 0,2 Bilder/s auf altem Laptop heute 5–10 FPS (bis 30 FPS im ROI) auf moderner Hardware.


Qualitätssicherung & Bruteforce-Tuning

  • Brute-Force-Skripte über Tage:
    Testen aller OCR-Kombinationen auf Videomaterial
  • Automatisierte Auswertung:
    CSV- und Performance-Metrics pro Konfiguration
  • Unit-Tests für alle kritischen Klassen:
    Kamera-Initialisierung, Formatwechsel, Puffer-Callbacks, Segmenter-Logik

Test-Video aus der Entwicklungszeit (Alphaversion)

Jetzt mehr erfahren und testen:
https://tb-software.ch/page/conveyorvision-applikation-industrielle-bildverarbeitung-fuer-foerderbaender/