Machine Learning aus der Cloud – Was halten die Versprechen?

Ob Predictive Analytics, die Informationsgewinnung aus neuen BigData-Quellen oder das Durchsuchen alter Bestandsdaten, überall werden Machine Learing-Algorithmen eingesetzt. Dass Verfahren aus dem Bereich des Machine Learning immer mehr an Bedeutung gewinnen, zeigt u.a. die aktuelle Ankündigung von Nvidia.

Ein eigens für Deep Learning konzipierter Grafikprozessor betreibt demnächst den Nvidia DGX-1 Supercomputer. Doch wer nicht so tief in die Tasche greifen möchte bei den Investitionen oder den Bedarf momentan noch nicht einschätzen kann, der greift gerne zur Cloud. Amazon Web Services, Google Cloud Plattform, IBM BlueMix und Microsoft Azure sind momentan die Platzhirsche mit ihren Cloud-Plattformen und bieten mittlerweile auch „Machine Learning-as-a-Service“ an.

Die passende Vorhersage

Warum brauchen wir Machine Learning-Algorithmen überhaupt? Nun sicherlich möchte jeder von uns gerne das Leben möglichst einfach gestalten. Ein großer Schritt in diese Richtung ist die Verwendung von Machine Learning-Algorithmen. Diese versuchen Muster in vorhandenen Datenbeständen zu erkennen. Dabei ist es besonders wichtig die richtigen Muster aufspüren zu wollen, denn man kann in nahezu allen Datenquellen Muster finden und auch Relationen herstellen zu anderen Ereignissen auf der Welt, jedoch ist die Plausibilität und die Korrektheit stets zu hinterfragen. Wurden sinnvolle Muster erkannt, so kann mit Hilfe von mathematischen Modellen eine Vorhersage auf Grundlage dieser Muster für neue Daten erstellt werden. Dies hilft in vielen Bereichen des Lebens und des Geschäfts. Im Leben, da wir uns nicht mehr allzu viel Mühe geben müssen bei der Suche nach neuer Musik, neuen Büchern oder Videos. Im geschäftlichen Umfeld helfen uns die Muster den Absatz zu steigern, den Gewinn zu erhöhen oder einen besseren Service für unsere Kunden zu bieten. Die meisten Machine Learning-Algorithmen lassen sich für die folgenden klassischen Anwendungsbereiche nutzen:

  • Betrugserkennung bei Transaktionen
  • Spamerkennung
  • Personalisierung von Inhalten
  • Dokumentenklassifizierung
  • Prognose der Kundenabwanderung
  • Automatisierte Lösungsempfehlung für den Kundendienst
  • Sentiment-Analysen (z.B. positive / negative Meinungen oder Äußerungen)
  • Routing Entscheidungen von Nachrichten
  • Analyse von Upselling-Möglichkeiten
  • E-Mail-Klassifizierung
  • Diagnosesysteme
  • Empfehlungssysteme
  • usw.

Um die Anwendungsfälle entsprechend abbilden zu können, steht eine große Toolbox von Machine Learning-Verfahren zur Verfügung. Die gängigsten Verfahren für die oben genannten Einsatzbereiche sind:

  • Hauptkomponentenanalyse (PCA)
  • Support Vector Machinen (SVM)
  • Multi-Klassen und Multi-Label Algorithmen
  • Clustering-Verfahren
  • Regressionen
  • Statistische Funktionen
  • Textanalyse

Es stellt sich nun die spannende Frage, welche der verschiedenen Verfahren die relevanten Cloud-Player auf ihren Plattformen in welchem Modell anbieten.

Vier Anbieter – vier Strategien?

Gibt es eine einfache Nutzung von Machine Learning-Verfahren in der Cloud? Dies ist die Frage, welche uns entweder zu einem mächtigen Werkzeug verhilft oder in die Tiefen der Anbieter drängt und unsere Abhängigkeit stärkt. Amzon Machine Learning, Microsoft Azure Machine Learning, IBM Bluemix und Google Prediction API sind die vier Angebote in der Cloud, welche nutzungsbasierten Zugang zu Machine Learning-Diensten über die Public Cloud bieten. Auffallend ist, dass alle Anbieter einen relativ einfachen und kostengünstigen Einstieg ermöglichen. Amazon bietet eine gute User Experience, wenn es um die Nutzung von Machine Learning-Diensten geht. Der Nutzer braucht wenig Wissen aus dem Bereich des Machine Learning und kann dennoch über die Weboberfläche Modelle erstellen, welche dann in die eigenen Produkte und Lösungen integriert werden können. Bei IBM und Google sind die Predictive-Dienste ein wenig Code-lastiger und auch die Auswahl von Features und Labels erfolgt hier über die API.

AusrichtungML

Bei Microsoft funktioniert der Zugang nach einem anderen Ansatz. Hier bekommt der Nutzer ein graphisches Programmiermodell an die Hand, welches einen Zugang zu Prozessen von Machine Learning ermöglicht. Über Pipelines werden dann die einzelnen Schritte definiert und ggf. auch durch eigenen Code erweitert. Der fertige Workflow kann dann als Service gestartet werden und wartet dann, wie bei allen anderen Anbietern auch, auf frische Daten, damit das trainierte Modell seine Vorhersage treffen kann.

Ist Machine Learning als Dienst Cloud-ready?

In der Tat! Entwickler und Data Scientists können Ihre Machine Learning-Verfahren für unterschiedliche Anwendungsszenarien direkt in der Cloud nutzen und ausführen. Je nach eigenem Bedarf bieten die Anbieter Zugriff auf die unterschiedlichen Algorithmen, die natürlich am liebsten aus den eigenen Storage-Angeboten befüllt werden. Microsoft bietet eine gute User Experience für Machine Learning-Prozesse als graphisches Programmiermodell und ermöglicht den Eingriff an jeder Stelle der Pipeline. Damit hat Microsoft das umfangreichste und flexibelste Angebot aus dem Bereich Machine Learning. Amazon Machine Learning versucht, Machine Learning-Prozesse zu vermeiden und dem Entwickler eine Art Blackbox für Machine Learning-Anwendungsszenarien anzubieten. Damit haben auch weniger erfahrene Entwickler die Möglichkeit je nach Anwendungsbereich einen entsprechenden Dienst auszugestalten und dann das Modell trainieren zu lassen und in die eigene Anwendung zu integrieren. IBM und Google ermöglichen einen Zugang zum Machine Learning über APIs und setzen mehr Verständnis von der Materie voraus. Angemerkt sei noch, dass dieser Analyst View sich allein auf die Machine Learning-Angebote beschränkt und beispielsweise nicht näher auf die kognitiven Dienste der Anbieter eingeht. Dies folgt in einem weiteren Beitrag, der sich auch mit den definitorischen Abgrenzungen von Machine Learning, Deep Learning und Cognitive Computing auseinandersetzt.

Empfehlung für den Einstieg - Start small and scale

Zusammenfassend lässt sich konstatieren, dass es Digitalisierungsentscheider, Data Scientists und Cloud-Profis noch nie so leicht hatten ihre dynamisch steigenden Datenmengen mit Verfahren des Machine Learning bzw. der künstlichen Intelligenz zu verarbeiten, zu analysieren und neue wertschöpfende Prozesse und Geschäftsmodelle zu etablieren. Die Einstiegshürde wird durch die Machine Learning-Angebote der großen Public Cloud-Provider sehr niedrig gelegt. Die Angebote haben vor allem den Charme des „Start small“ und echter Skalierbarkeit. Während die Berechnung des ROI für eine eigene Machine Learning-Infrastruktur immer mit Risiken behaftet ist, lässt sich in der Cloud gemütlich nach oben oder unten skalieren, je nachdem wie erfolgreich die Analysen und Projekte im eigenen Unternehmen verlaufen. Trotzdem sollte man sich vor dem Einstieg noch intensiver mit den jeweiligen Plattformen und Diensten auseinandersetzen, da deren Angebote, Kostenstruktur und User Experience doch recht unterschiedlich ausfallen.