“Hallo IoT” – Warum scheitert die Konversation mit Dingen in der Industrie?

  • IoT-Geräte in der Industrie lassen sich theoretisch auch wie ein Smart Home mit Alexa oder ähnlichen Sprachassistenten steuern
  • Warum sind Sprachassistenz-Plattformen meist Cloud-Dienste?
  • Warum ist das heute nicht realistisch?

Inzwischen haben die drei Technologie-Giganten aus dem Consumer Space, Amazon, Google und Apple ihre Smart Speaker auch in deutschen Haushalten positionieren können. Amazons Echo, Googles Home und Apples HomePod bringen die Wahrnehmung von sprachgesteuerten Systemen in die breite Bevölkerung. Allein der Smart Speaker Markt wächst im nächsten Jahr weltweit auf 1,8 Milliarden Euro. Und dabei ist der Lautsprecher gar nicht entscheidend. Vielmehr sind für den langfristigen Erfolg zwei Dinge wichtig:

  • Das Geschäftsmodell bestimmt die Verbreitung. Ob ein Konsument über einen original Amazon Echo oder über einen der vielfältigen alternativen Smart Speaker mit dem Alexa-Assistent redet ist vollkommen egal. Kommerzielle Umsätze wie Retail-Umsätze oder Musik-Abos kommen immer primär bei Amazon an. Der Retail-Gigant könnte die kleine Echo-Version anstelle für €59,99 auch gleich ganz verschenken. Der Folgeumsatz bringt den Ertrag wie bei einem 1-Euro Handy der Mobilfunkanbieter. Natürlich gibt es auch Smart Speaker wie die Geräte der Firma Sonos, die sich durch herausragende Soundqualität im Markt differenzieren. Hier stellt sich aber rasch die Frage wie viel Umsatz davon eigentlich in den neuen Smart Speaker Markt und wie viel in den Premium-Audio-Equipment-Markt gehört, in dem auch nicht-smarte Audioprodukte sind.
  • Die Sprachassistenz-Plattform entscheidet über die Intelligenz. Einfachen Text in natürliche Sprache umzusetzen, auch “Text-to-Speech” genannt, ist inzwischen recht trivial. Anders herum, Sprache in Text zu verwandeln etwas schwieriger, aber auch nicht mehr neu. Diese Sprache bzw. den erkannten Text jedoch als menschlich verständliche und logische Konversation zu verstehen und entsprechend zu antworten, ist die Herausforderung der künstlichen Intelligenz-Plattformen. Hier unterscheiden sich Amazons Alexa, Apples Siri und der Google Assistent deutlich. Manche Hersteller verzichten sogar komplett auf eigene Smart Speaker. So konzentriert sich Microsoft Cortana komplett auf die Assistenz-Plattform und überlässt die Hardware seinem Ökosystem. Der Crisp Research Analyst Björn Böttcher hatte bereits in einem früheren Analyst View das Ökosystem der Sprachassistenzsysteme untersucht.

Nicht nur der Vollständigkeit halber sei darauf hingewiesen, dass die genannten Beispiele sich nur auf die Marktführer in unseren Breiten beziehen. Hier hat Amazon den größten Marktanteil, den sie sich aber in den nächsten zwei Jahren zunehmend mit den Wettbewerbern teilen müssen. Besonders im asiatischen Kulturkreis tun sich aber alle genannten Sprachassistenz-Plattformen schwer. In China beispielsweise bringt die Alibaba Group, die 1,5-mal so viel Umsatz und 7-mal so viel Gewinn wie Amazon macht, ihre AliGenie-Plattform auf den Markt. Letztere wurde auch gleich mit einem “Virtual Reality Service” vorgestellt, der einen sehr echt erscheinenden Menschen sprechen lässt.

Im Allgemeinen bestehen Sprachassistenz-Plattformen aus einigen Komponenten (siehe Abbildung). Während die Speech-Recognition und die Speech-Synthesis relativ technische Komponenten sind, bringt die künstliche Intelligenz der Plattform erst den Konversationscharakter ins Spiel. Genau hier ist im Vergleich zu den ersten Generationen sehr viel Innovation passiert, wie man mit dem Blick auf einen unserer ersten Analyst Views zu dem Thema aus dem Jahr 2016 sieht. Erst die KI bringt natürliche Sprachkonversation. Dies ist aber auch der komplexeste Teil mit angelerntem Wissen, dass zwischen Nutzern geteilt wird. Deshalb sind die kompletten Sprachassistenz-Plattformen heute ausschließlich als Cloud-Dienst verfügbar.

Ein IoT Device im professionellen Umfeld mit einem Public Cloud basierten Sprachassistenten zu steuern ist aber kaum realistisch. Die Hindernisse dazu sind nicht nur temporär, sondern eher fundamental, da die bekannten Sprachassistenz-Plattformen Public-Cloud-Dienste sind:

  • Deutschland ist die Funkloch-Republik. Für angemessene Datengeschwindigkeit zwischen dem smarten IoT Device und der Sprachassistent-Software in der Cloud braucht man LTE-4G. Eine 3G-Versorgung reicht da nicht. Die Mobile-4G-Versorgung in der “Industrienation” Deutschland ist aber schlechter als in Albanien und deshalb ist es vollkommen unrealistisch beispielsweise alle CNC-Maschinen eines Herstellers einheitlich mobil online zu bringen. Das funktioniert für ein paar Byte Sensor-Daten und Predictive-Maintenance Szenarios, nicht aber für Audio-Ströme.
  • Privatsphäre ist immer noch ein Bedenken. Google und Facebook bewegen sich dauernd auf den Grenzen der Legalität mit ihrem Consumer & Advertisement Business. Amazons Retail sammelt auch mehr als die meisten Nutzer wissen möchten.
  • Latenz schließt viele Anwendungen aus. Schnelle Kommandos wie “Maschine Stop” oder “Links Blinken” sind mit der heutigen Cloud vollkommen unrealistisch. Das 5G-Netz verspricht zwar technisch viel niedrigere Latenzen. Bis 2020 wird aber nach Einschätzung von Crisp Research die 5G-Abdeckung in keinem Bundesland über 10% der Fläche, im Durchschnitt der Bundesländer eher 5%, betragen.
  • Automotive Connectivity ist auch von Fahrzeug-zu-Fahrzeug. Eine wichtige Voraussetzung um irgendwann autonomes Fahren gemeinsam mit manuell gesteuerten Fahrzeugen in Deutschland möglich zu machen, ist die Kommunikation zwischen Fahrzeugen. Wenn schon vom Stauende an herannahende Fahrzeuge kommuniziert wird, kann sich ein Mensch in einem manuell gesteuerten Fahrzeug erheblich sicherer unter autonomen Fahrzeugen bewegen. Auch hier verspricht 5G Vehicle2Vehicle-Communication, über die auch Sprachassistenz-Plattformen besser verfügbar würden.
  • Industrie-Anlagen sind oft bewusst offline. Wie Crisp Research erst kürzlich in diesem Analyst View (IoT Security derzeit noch Mangelware) beschrieben hat, ist der Stand der IoT Security in Industrieanlagen eher alarmierend. Auch nachdem Atomkraftwerke, Wasserversorgungen und jüngst der renommierte Hersteller von Spritzgussanlagen, KraussMaffei, gehackt und erpresst wurden, ist immer noch zu wenig Bewusstsein und Verständnis von IoT Security in den Unternehmen. Die heutige Reaktion um die Fertigung sicherzustellen und sogar physische Beschädigungen der Anlagen zu vermeiden, ist es einfach ganze Werkshallen “bewusst offline” zu halten.

Muss es aber immer eine komplette Sprachassistenz-Plattform sein oder würde etwas weniger Intelligenz auch schon eine gute Sprachsteuerung liefern? Wenn dies ja offensichtlich ein Haupthindernis beim industriellen Einsatz ist, lohnt es sich der Frage auf den Grund zu gehen. Entgegen der Darstellung der großen Cloud-Hyperscaler ist eine Sprachassistenz-Plattform nicht zwingend ein großer monolithischer Cloud-Dienst sondern ist aus einer Hand voll Komponenten zusammengesetzt. Diese untersuchen wir im Detail im nächsten Analyst View zu dem Thema und geben konkrete Hinweise, was davon heute schon “on the Edge” und damit offline möglich ist.

Bis dahin, berichten Sie uns gerne von ihren sprechenden IoT Devices.

 

Mehr zu den Themen Amazon Apple Automotive Connectivity Cloud-Dienste Google IoT IoT Security Konversation mit Dingen Smart Home Sprachassistenten Sprachassistenz-Plattformen

Share on:


Über den Autor:

Principal Analyst & IoT Practice Lead

Stefan RiedDr. Stefan Ried – IoT Practice Lead, Principal Analyst – is responsible for the research and consulting activities covering IoT and modern platform architectures. Stefan Ried worked previously at Unify, a global communications and collaboration vendor as CTO. Graduated in Physics with an PhD at the Max Planck Institute, Germany, Stefan brings 20 years of experience in senior positions in software development, product management and marketing from international vendors to Crisp Research. His experience includes two software startups and major players including SAP and Software AG. Over 7 years at Forrester Research, Stefan lead the cloud platform research globally as a Vice President.