Tag: BigQuery


Google verbindet BigQuery mit Microsoft Excel

Googles BigQuery ist ein Cloud Service und Teil der Google Cloud Plattform, mit dem SQL-Anfragen gegen große Datenmengen (Big Data) gestartet werden können, um auf deren Basis Analysen durchzuführen. Google geht nun einen kleines Stück aus der Cloud zurück und bietet Unternehmen, die nicht auf sehr schnelle Analysen angewiesen sind, ganz gewöhnliche Batch-Abfragen und die Verbindung über Microsoft Excel.

Google verbindet BigQuery mit Microsoft Excel

BigQuery für Big Data

Google BigQuery hilft bei der Analyse großer Datenmengen und erfreut sich bereits großer Beliebtheit. Mit zwei neuen Funktionen hat Google den Service nun erweitert und damit attraktiver für noch nicht so Cloud-affine Nutzer gemacht. Ab sofort lassen sich Zeit unkritische Batchprozesse verarbeiten. Also solche, die gerne mehr Zeit benötigen dürfen und keine hohe Priorität besitzen. Mit einem Connector for Microsoft Excel lässt sich der BigQuery Service zudem nun mit Microsofts Tabellenkalkulation verknüpfen.

Google passt BigQuery den Anforderungen an

Google konzentriert sich mit den neuen Funktionen insbesondere auf normale Use Cases wie Standard Abfragen oder dem Erstellen von nächtlichen Auswertungen, die Unternehmen zwar weiterhin benötigen aber nicht zeitkritisch abgearbeitet werden müssen. Das merkt man auch am Preis. Die bisherigen Abfragen mit einer hohen Performance kosten 3,4 Cent pro GB. Die neuen langsameren Abfragen kosten hingegen nur 2 Cent pro GB.

Neben den normalen Use Cases adressiert Google mit dem Excel Connector vor allem die traditionellen Nutzer und wird diese damit näher an die Cloud und vor allem an BigQuery heranbringen. Viele Analysten, Buchhalter, Finanzberater usw. arbeiten noch klassisch mit ihren Excel Tabellen. Diese wissen nicht, was ein Hadoop Cluster ist und wollen bzw. müssen dies auch nicht wissen. Der Excel Connector kann ein richtiger Schritt sein, diese Zielgruppe zu gewinnen, ihre Daten zwar weiter per Excel zu pflegen die Auswertungen aber von BigQuery durchführen zu lassen. Aus Erfahrung ist es leichter, den Anwendern ihre bekannten Applikationen weiter nutzen zu lassen und diese stattdessen mit weiteren Services im Hintergrund aufzuwerten.



Jaspersoft wird Teil des Google Cloud Platform-Partnerprogramm – Big Data Analyse mit Google BigQuery

Business Intelligence-(BI)-Plattform Anbieter Jaspersoft wird Teil des Google Cloud Platform-Partnerprogramm. Über dieses Programm stellt das Unternehmen als Technologiepartner seinen Open Source-Konnektor für Google BigQuery-Kunden bereit, mit dem Business Intelligence-Berichte und Analysen auf der Google Cloud Platform durchgeführt werden können. Mit diesem Konnektor lassen sich die BI-Tools von Jaspersoft in die Google Cloud Platform integrieren. Auf diese Weise wird der Zugriff auf Reporting- und BI-Analyse-Anwendungen über ein integriertes Tool ermöglicht.

Jaspersoft wird Teil des Google Cloud Platform-Partnerprogramm

Das Google Cloud Platform-Partnerprogramm

Dem Google Cloud Platform-Partnerprogramm sind bereits Technologiepartner wie Internetdienst- und SaaS-Anbieter, Plattformunternehmen, Anbieter von Management- und Entwicklungstools, Anbieter von Analyse-, BI- und ETL-Lösungen sowie Speicherspezialisten beigetreten. Diese Partner tragen Zusatztechnologien bei, die bereits in die Plattform integriert wurden, um den Kunden leistungsfähige neue Lösungen auf der Basis der Google Cloud Platform anbieten zu können.

Die Google Cloud Plattform im Detail

Die einzelnen Services der Cloud Platform von Google ermöglichen die Implementierung der folgender Lösungen:

  • Cloud Apps wie mobile Anwendungen, Social Media-Anwendungen, Geschäftsprozess-Anwendungen und Websites mit der Google App Engine und Google Cloud SQL.
  • Cloud Storage Lösungen wie High-End-Backup und -Recovery, aktive Archivierung, globales File Sharing/Zusammenarbeit und primäres SAN/NAS mit Google Cloud Storage.
  • Lösungen für die Verarbeitung umfangreicher Datenmengen wie Batch- und Datenverarbeitung sowie High Performance Computing mit der Google Compute Engine.
  • Big Data-Lösungen wie interaktive Tools, Trenderkennung und BI-Dashboards mit Google BigQuery und der Google Prediction-API.

Jaspersoft setzt auf Google BigQuery

Jaspersoft will die Möglichkeit nutzen, seine Business Intelligence-Produkte mit der Leistungsfähigkeit von Googles Cloud Platform zu vereinen. Zudem stellt sie eine breite Palette von Funktionen für die Anwendungsentwicklung, Cloud Storage sowie für die Verarbeitung umfangreicher Datenmengen und die Big Data-Verarbeitung bereit und bietet unseren Kunden Big Data-Reporting- und -Analysefunktionen für beliebige Datentypen.

Dazu fokussiert sich Jaspersoft mit seinem Konnektor auf Google BigQuery, um damit weitere Funktionen bereitzustellen:

  • Sicherheit. Jaspersoft nutzt die OAuth-Token-Authentifizierung von Google für die Bereitstellung einer sicheren Verbindung.
  • Schnelligkeit. Mit dem Konnektor soll die Skalierbarkeit von BigQuery voll ausgenutzt werden können um auf diese Weise Millionen oder sogar Milliarden von Zeilen zu verarbeiten.
  • Flexibilität. Der Konnektor unterstützt die unbeschränkte Verwendung der gesamten BigQuery-SQL-Abfragesyntax.
  • Nahtlose Integration. Mit dem Konnektor lassen sich die Leistungsfähigkeit von BigQuery und die Stabilität der Dashboards, interaktiven Berichte und Ad-hoc-Analysen von Jaspersoft kombinieren.
  • Offenheit. Der Konnektor steht als Open Source-Komponente unter www.jasperforge.com kostenlos zur Verfügung. Der Quellcode steht unter http://code.google.com/p/jaspersoft-bigquery-datasource unter der AGPL-Lizenz zur freien Verwendung für Entwickler bereit.


BigQuery: Big Data Analyse mit Google

Google BigQuery, ein Cloud basierter Service für die Analyse sehr großer Datenmengen, kann nach einer geschlossenen Testphase mittlerweile von allen genutzt werden.

BigQuery ist ein Online Analytical Processing (OLAP) System, um Datensätze mit Milliarden von Zeilen und Terabytes an Daten zu verarbeiten und zielt auf Unternehmen und Entwickler in Unternehmen ab, die mit riesigen Datenmengen (Big Data) balancieren müssen.

BigQuery kann auf unterschiedliche Arten genutzt werden. Entweder mit einer Web-Oberfläche, einer REST API oder via Kommandozeile. Die Daten können zur Verarbeitung per CSV Format auf die Google Server hochgeladen werden.

Die Preise orientieren sich an der Menge der gespeicherten Daten und der Anzahl der Anfragen. Für den Speicherplatz berechnet Google 0,12 Dollar pro GB pro Monat bis zu einer maximalen Speichermenge von 2TB. Für die Anfragen werden 0,035 Dollar pro verarbeitetes GB berechnet. Die Limits liegen hier bei 1000 Anfragen pro Tag sowie 20TB zu verarbeitende Daten pro Tag. Für die ersten 100GB an verarbeitenden Daten pro Monat entstehen keine Kosten. Weitere Informationen stehen hier.

BigQuery ist nicht für die OLTP (Online Transaction Processing) Verarbeitung geeignet. Genauso wenig können Änderungen an den auf BigQuery gespeicherten Daten vorgenommen werden. Unternehmen, die eher eine klassische relationale Datenbank für OLTP benötigen, empfiehlt Google seine Cloud basierte Datenbank Google Cloud SQL, welche die volle SQL-Syntax unterstützt.

Mit seiner Portfolio Erweiterung um BigQuery präsentiert Google einen weiteren Service in dem mittlerweile stark umkämpften Markt von Cloud basierten Produkten für Unternehmen, in dem sich bereits namhafte Unternehmen wie Amazon, Oracle, IBM, Microsoft und viele weitere tummeln.



Nach der Cloud, wird Amazon auch der Big Data Gigant?

IaaS Cloud Infrastrukturen haben auf Grund ihrer Skalierbarkeit die idealen Voraussetzungen für die Verarbeitungen großer Datenmengen, wodurch Big Data ein idealer Anwendungsfall für Cloud Computing ist. Aber welcher Anbieter wird das Rennen um die Verarbeitung machen?

Big Data ist ein idealer Anwendungsfall für das Cloud Computing

Amazon Web Services

Ein Kandidat ist Amazon. Zum einen hat das Unternehmen auf Grund seines Kerngeschäfts, dem Web-Shop, eine große Expertise bei der Verarbeitung und Analyse großer Datenmengen aufgebaut und diese, betrachtet an der Evolution und dem Funktionsumfang der Webseite, stetig weiterentwickelt. Hinzu kommen aber auch die Amazon Web Services und der darunter liegenden massiv skalierbaren Infrastruktur, die ideal für die Verarbeitung von Big Data ist und die Unternehmen nutzen können, um dort Anwendungen für die Analyse ihrer Daten zu betreiben. Dazu stehen mit Amazon EC2, Amazon S3 und Amazon Elastic MapReduce gut miteinander zu kombinierende Services zur Verfügung. Neben dem Service AWS Import/ Export, mit dem große Datenmengen auf dem Postweg an Amazon geschickt werden können, die von Amazon dann direkt in die Cloud kopiert werden, hat sich Amazon mit der vor kurzem angekündigten Kooperation mit dem Private Cloud Infrastruktur-Software Anbieter Eucalyptus zudem eine gute Ausgangsposition geschaffen, um Unternehmen die Möglichkeit zu geben, über eine Hybrid Cloud Daten aus der Private in die Amazon Cloud übertragen zu lassen.

Google

Google hat ebenfalls viel Erfahrung bei der Verarbeitung großer Datenmengen, was u.a. auf die Indexierung des Internets und die damit verbundene Suche zurückzuführen ist - ebenfalls beides Kerngeschäfte von Google. Hinzu kommt, das Google kürzlich mit Google BigQuery einen neuen Service für Entwickler vorgestellt hat, auf dem Anwendungen entwickelt werden können, um Big Data zu verarbeiten. Dieser befindet sich aktuell aber noch in der geschlossenen Betaphase.

Anders als die Amazon Web Services scheint Google allerdings nicht so konsequent auf das Business getrimmt zu sein. Zudem wirkt Google an vielen Stellen immer noch wie ein großer Spielplatz für die eigenen Entwickler, was natürlich immer wieder gute Innovationen hervorbringt, Google sich aber bereits eingestehen musste, dass einige Services doch einfach mehr Kapital verbrennen als Nutzen ergeben. So wurde die Google App Engine anfangs stark gepushed, hat im Laufe der Zeit aber etwas an Innovation verloren.

Microsoft

Microsofts Kerngeschäft hat im Vergleich zu Amazon oder Google in erster Linie nichts mit der Verarbeitung großer Datenmengen zu tun. Dennoch steht mit Windows Azure ebenfalls eine skalierbare Infrastruktur bereit, auf der Unternehmen Big Data analysieren können.

Im Vergleich zu Google oder Amazon ist Microsoft aber bereits schon dort lange angekommen, wo die beiden erst genannten erst zielstrebig hinwollen, das Business. Microsoft sollte die Herausforderungen und Wünsche, insbesondere bei den renommierten Unternehmen, kennen und gezielt darauf eingehen können.

Erste infrastrukturelle Schritte hat Microsoft bereits mit der Unterstützung von Hadoop auf Azure unternommen und eine Agenda zeigt die weiteren Vorhaben für das Jahr 2012. So wird das Unternehmen mit Hilfe von Hortonworks und einer ODBC Schnittstelle Apache Hadoop an Microsofts Excel anbinden und so Big Data ins Büro bringen. Damit können Business Intelligence (BI) Tools einen direkten Zugang zu einem Hadoop Cluster erhalten und via Excel Pivot-Analysen durchgeführt werden.

Die Anderen

Es existieren eine Vielzahl an Unternehmen, die mit Big Data tagtäglich in ihrem Kerngeschäft konfrontiert werden. Dazu gehören bspw. ebay, Facebook, XING, LinkedIn oder auch Twitter. Allerdings bietet keines dieser genannten Unternehmen einen Public Cloud Service an, mit dem Big Data von Dritten verarbeitet werden könnte. Die Kosten für den Ausbau einer stärker skalierbaren Infrastruktur wären wohl auch zu hoch.

Allerdings sollten auch renommierte Unternehmen wie SAP, IBM oder Oracle im Bereich Big Data nicht aus den Augen gelassen werden. Die Expertise aus dem Kerngeschäft ist zweifelsohne vorhanden.


Bildquelle: https://www.emcforums2011.com, http://www.techweekeurope.es