Ob Zoom, Teams oder Google Meet. Videocalls gehören heute zum Arbeitsalltag selbstverständlich dazu. Für Carsten Kraus aber haben sie eine Schwachstelle: der fehlende Blickkontakt. Die KI-Software von Casablanca.ai soll diesen Blickkontakt automatisch herstellen – und das mit realistischer und natürlicher Mimik.
Acht Videocalls pro Tag sind aktuell der Durchschnitt in Deutschland. Jeder kennt die Unsicherheit: Soll ich jetzt in die Kamera schauen oder auf den Bildschirm? Häufig wissen die Teilnehmenden nicht, wohin mit ihren Augen und entscheiden sich dazu, die Kamera gleich ganz auszulassen. Dabei sind 93% unserer Kommunikation nonverbal, sagt Psychologe Prof. Albert Mehrabian. Blickkontakt und Mimik sind die wichtigsten Bestandteile. Bei Videocalls ging dieser Blickkontakt bisher verloren. Insbesondere in Meetings, in denen es um Vertrauen geht, wie beispielsweise Bewerbungsgespräche, Vertriebstermine oder in Gesprächen mit Investoren, ist der Blickkontakt aber ein wichtiger Bestandteil.
Das Startup Casablanca hat hierfür eine Lösung entwickelt, zwei Jahre geforscht und drei Patente entwickelt. Herausgekommen ist eine Technologie, die mittels künstlicher Intelligenz den natürlichen Blickkontakt in Videocalls herstellt – allerdings nur, wenn man sich auch wirklich anschauen möchte. Die Software arbeitet, als hätte man eine Kamera mitten auf dem Bildschirm angebracht – nur ohne die störende Kamera. Casablanca verarbeitet das ganze Gesicht via KI. Dadurch ist es möglich, dass man sich auch in die Augen schaut, wenn man eigentlich auf den Bildschirm schaut.
Natürliche Mimik dank Künstlicher Intelligenz
In Casablanca stecken verschiedene Technologien und jetzt wird es kurz technisch: Einerseits erzeugt die KI ein 3D-Abbild des Kopfes mit einem eigens entwickelten Deep-Learning-Verfahren. Ergänzend wird ein um zusätzliche Diskriminatoren erweitertes GAN (Generative Adversarial Network) eingesetzt, um fehlende Bildteile zu ergänzen. So kann beispielsweise der Hals rekonstruiert werden, wenn die Kamera diesen nicht erfassen kann.
Erst diese Kombination ermöglicht die realistische Ausrichtung des Kopfes, natürlichen Blickkontakt und authentische Mimik. Andererseits sorgen neue Interpolationsverfahren dafür, dass Casablanca weniger Daten behandeln muss, um die Bilddrehung zu vollziehen – das sichert eine flüssige Anwendung in Echtzeit.
Casablanca lässt sich mit allen Videocall-Systemen anwenden, denn es wird tatsächlich als (virtuelle) Kamera installiert, obwohl es reine Software ist. Man wählt dann in Zoom, Teams usw. statt der „Front Camera“ einfach die „Casablanca Camera“ aus. Ebenso wie das NVIDIA System benötigt Casablanca auf Windows-Notebooks eine Grafikkarte für die KI-Berechnungen. Auf einem Mac mit M1 oder M2 Prozessor läuft Casablanca laut der Gründer problemlos, da diese Prozessoren bereits die erforderliche KI-Rechenleistung mitbringen. Casablanca ist derzeit im Beta-Stadium, man kann sich kostenlos registrieren und die Beta-Version in allen Videocalls nutzen.
Das Team hinter Casablanca
In fünf Jahren erinnert sich niemand mehr, wie Videokonferenzen ohne Casablanca waren – das ist die Vision von Carsten Kraus und seinem Team. Doch die Idee, eine einfache Lösung für Blickkontakt in Videocalls zu entwickeln, stellte sich als große Herausforderung dar.
Als 2020 die Corona-Pandemie startete, waren Videocalls der Retter in der Not, um zumindest etwas Persönlichkeit und Nähe zu Geschäftspartnern und seinem Team zu halten. Für Carsten Kraus, KI-Experte, Seriengründer und Investor, waren Videocalls zwar Mittel zum Zweck, aber so richtig ersetzen konnten sie persönliche Meetings nicht. Denn der Blickkontakt war für ihn essenziell. Seine ursprüngliche Idee basierte auf dem Einsatz von Cycle-GANs. Eines der bekanntesten Beispiele dieser Methodik ist die Synthese von Pferden zu Zebras und anders herum. Im Fall von Casablanca sollte die KI auf Bilder vieler Menschen trainiert werden – allerdings kam dabei nicht die gleiche, sondern nur eine ähnlich aussehende Person heraus. Zudem war die Architektur zu langsam für den Einsatz.
Carsten Kraus gab nicht auf. Er wollte eine Lösung finden und holte Ivan Alles, heute CTO von Casablanca.ai, mit an Bord. Der Software-Ingenieur und Experte für Machine Learning hatte die Idee zum Einsatz eines Modells, das auf 3D-Transformation basiert und diese mit GANs kombiniert. Seine Lösung beinhaltete auch die Geschwindigkeitsoptimierung. Insgesamt entwickelte das Team, das mittlerweile aus elf Leuten besteht, über zwei Jahre Casablanca und hat drei Patente angemeldet. Casablanca steht kurz vor dem Launch 2023, der Beta-Test ist in den finalen Zügen.
Über eine Million Euro flossen bisher in Casablanca, der Großteil wurde von Carsten Kraus und seinem Unternehmen CK Holding investiert. Dafür verkaufte er einen Großteil seiner Anteile an Fact Finder, eine KI-basierte Technologie für Suche, Navigation und Merchandising, die den Umsatz im Online-Shop steigert. Sein Ziel ist es, dass Casablanca zum Standard in Videocalls wird und sich jeder dabei in die Augen schauen kann – für mehr Authentizität und Persönlichkeit im Business-Alltag.