Kombinierte Nutzung mit bildbasiertem Tracking
Die Cloud-Bildererkennung kann auch mit bildbasiertem Tracking kombiniert werden, um einen Hybridmodus aus "Erkennung + kontinuierlichem Tracking" zu realisieren. Dieser Artikel erklärt die Nutzung und analysiert die Vorteile sowie geeignete Anwendungsszenarien.
Arbeitsablauf
Der Kern des Hybridmodus liegt im nahtlosen Übergang zwischen Cloud-Erkennung und lokalem Tracking. Der Ablauf ist wie folgt:
Cloud-Erkennungsphase
- Anfrage senden: Die Gerätekamera erfasst das aktuelle Bild und lädt es auf den CRS-Server hoch.
- Cloud-Matching: CRS durchsucht die Zielbibliothek und gibt die ID des erkannten Ziels sowie die Bilddaten (Base64-kodiert) zurück.
- Ergebnisempfang: Der Client empfängt das Erkennungsergebnis und löst die nachfolgende Verarbeitungslogik aus.
Lokale Tracking-Phase
- Bilddekodierung: Der Client dekodiert die Base64-Daten in ein Bild und erstellt darauf basierend eine
ImageTarget-Instanz lokal. - Tracking initialisieren: Initialisiert den
ImageTrackerund ruft dieloadTarget-Methode auf, um das bildbasierte Tracking zu starten. - Kontinuierliches Tracking: Das Gerät berechnet lokal die 6DoF-Position. Virtuelle Inhalte folgen dem Bild in Echtzeit.
Vorteile der hybriden Nutzung
Im Vergleich zur alleinigen Cloud-Erkennung bietet der Hybridmodus in folgenden Bereichen Vorteile:
Reduzierte Falscherkennungsrate
Bei reiner Cloud-Erkennung können ähnliche Bilder in der Bibliothek zu falschen Treffern führen. Durch das lokale Tracking werden Bildmerkmale kontinuierlich validiert. Stimmt der Inhalt nicht mit dem Erkennungsergebnis überein, bricht das Tracking ab und löst eine Neuerkennung aus. Dadurch sinkt die Falscherkennungsrate deutlich.Unterstützt kontinuierliches Tracking und Interaktion
Reine Cloud-Erkennung liefert nur die Ziel-ID, ermöglicht aber keine Rotation, Skalierung oder kontinuierliche Interaktion. Der Hybridmodus wechselt nach der Erkennung sofort zum lokalen Tracking mit 6DoF-Positionsupdates. Virtuelle Inhalte folgen Bewegungen – ideal für AR-Spiele oder Produktpräsentationen.Geringere Cloud-Last
Häufige Cloud-Erkennungsaufrufe (z.B. 1x/Sekunde) erhöhen Serverlast und Latenz. Im Hybridmodus übernimmt nach erfolgreicher Erkennung das lokale Gerät das Tracking, ohne Bilder hochzuladen. Nur bei Trackingverlust erfolgt eine Neuerkennung. Dies reduziert Cloud-Anfragen und mobilen Datenverbrauch erheblich.Robustheit bei schwachem Netz
Reine Cloud-Erkennung scheitert oft bei instabiler Verbindung. Im Hybridmodus funktioniert das lokale Tracking auch bei Netzausfall. Kombiniert mit einer lokalen Zielbibliothek ermöglicht dies eine Notfalllösung bis zur Netzwerk-Wiederherstellung.
Best Practices
Bei der Wahl zwischen Cloud-Erkennung, bildbasiertem Tracking oder Hybridmodus sind folgende Kriterien relevant:
Funktionsauswahl
| Anwendungsmerkmal | Empfohlene Lösung | Begründung |
|---|---|---|
| Ziele < 100 | Bildbasiertes Tracking | Ausreichender lokaler Speicher, netzwerkunabhängig |
| Kein Netz/instabiles Netz | Bildbasiertes Tracking | Vermeidet Erkennungsfehler, offline nutzbar |
| Dynamische Zielaktualisierung | Cloud-Erkennung | Änderungen sofort wirksam, für dynamische Inhalte |
| Eingeschränkte Geräteleistung | Cloud-Erkennung | Eingebettete Systeme oder strikte Stromsparanforderungen |
| Kein kontinuierliches Tracking | Cloud-Erkennung | Einmaliges Scannen ohne Positionsverfolgung |
Wann der Hybridmodus sinnvoll ist
- Große Zielanzahl (>100): Cloud-Speicher unbegrenzt, lokales Gerät lädt nur aktuelles Ziel (speichereffizient).
- Interaktive Anwendungen: Z.B. AR-Bildung (3D-Modelle nach Lehrbucherkennung drehen) oder AR-Marketing (3D-Produktdemos).
- Hohe Erkennungsgenauigkeit erforderlich: Kritische Bereiche wie Medizin oder Industrie.
- Netzausfall-Resilienz: Tracking funktioniert nach Erkennung auch offline weiter.
Zusammenfassung und Erweiterung
Der Hybridmodus kombiniert die Cloud-Kapazität mit lokalem Tracking – ideal für komplexe Szenarien mit hohen Anforderungen an Genauigkeit und Interaktion. Entwickler sollten basierend auf Zielanzahl, Aktualisierungsfrequenz, Netzwerkbedingungen und Interaktionsbedarf zwischen Einzelmodi oder Hybridlösung wählen.