tom's networking guide
 
Anzeige

Test IAIT Talend Enterprise Data Integration Big Data Edition

Datenverarbeitung im ganz großen Stil

Der Test

Im Test verwendeten wir eine Umgebung mit Hadoop 1.0.3, die innerhalb einer vSphere-Installation auf Basis der IBM X-Serverarchitektur lief. Nach dem Einspielen der Talend Enterprise Data Integration auf unserer Workstation, die mit Windows 7 Ultimate in der x64-Version arbeitete, importierten wir zunächst einige Daten aus einer CSV-Datei, wandelten sie um und exportierten sie als Excel-Sheet, um uns mit der Arbeitsweise der Lösung vertraut zu machen. Danach stellten wir eine Verbindung zu unserem Hadoop-System her, importieren dieselben CSV-Daten nochmals und schrieben sie in Hadoop. Anschließend ließen wir uns die Daten wieder ausgeben, um zu überprüfen, ob alles richtig funktioniert hatte.

Im nächsten Schritt verwendeten wir Testdaten aus dem Unternehmensbereich mit 100.000 beziehungsweise zehn Millionen Datensätzen und führten Analysen dieser Daten mit Hilfe von "Pig" durch. Zum Schluss griffen wir über "Hive" auf die Daten in Hadoop zu und arbeiteten mit der Datenbank "HBase". Auf die einzelnen eben eingeführten Begriffe gehen wir später noch genauer ein. Talend Enterprise Data Integration läuft übrigens auf Systemen mit der aktuellsten Java-1.6-Version. Abgesehen davon empfiehlt der Hersteller den Einsatz von Windows 7 in der 64-Bit-Version als Betriebssystem sowie auf Hardware-Seite einen Standard-Rechner mit vier GByte Arbeitsspeicher.

Installation

Um Talend Enterprise Data Integration zu installieren, müssen Sie lediglich sicherstellen, dass auf dem System eine unterstützte Java-Version vorhanden ist und die Zip-Datei mit den Talend-Files in einen Ordner ihrer Wahl (zum Beispiel c:\Talend) entpacken. Wenn Sie anschließend die Programmdatei aufrufen, so verlangt das System, sofern es sich nicht um eine der Open-Source-Varianten handelt, erst einmal nach einer gültigen Lizenz. Sobald Sie diese angegeben haben, zeigt die Software einige allgemeine Lizenzbestimmungen, die Sie bestätigen müssen. Danach erhalten Sie die Möglichkeit, ein Repository (mit Workspace) anzulegen und ein erstes Projekt zu erstellen. Nach dem Öffnen dieses Projekts landen Sie im eigentlichen Entwicklungswerkzeug, das Sie mit einem Welcome Screen begrüßt, in dem die ersten Schritte erläutert werden.

Ein Auswertungsjob mit Pig, der auf dem Hadoop-Server abläuft. (©Smartmedia PresSservice)

Leserkommentar

Keine Kommentare

Kommentar hinzufügen

* - Pflichtfeld

*





*
*
Rubriken
Anzeige
Anzeige
Anzeige
Anzeige
Mehr zum Thema
Test Datacore SANsymphony V R8
Mit SANsymphony-V bietet Datacore eine leistungsfähige Software-Plattform zum Bereitstellen, Teilen, Migrieren, Replizieren, Erweitern, Konfigurieren und Upgraden von Speicher ohne Verzögerungen und Downtime. IAIT hat sich angesehen, was die aktuelle Vers [mehr]
Test Entuity Eye of the Storm 2011 Enterprise
Je umfangreicher die Netzwerke, desto schneller verlieren Administratoren ohne geeignete Tools den Überblick. Entuity Eye oft he Storm 2011 bietet verschiedene Methoden an, mit denen die bestehende Infrastruktur zumindest teil-automatisch erfasst werden k [mehr]
Test Kroll Ontrack PowerControls 6.0
Exchange- und Sharepoint-Server sind längst in vielen Unternehmen unverzichtbarer Bestandteil der Unternehmens-Infrastruktur. Die unabdingbaren Backup-Szenarien werden dabei aber oft vernachlässigt. Hauptsache es gibt ein Backup, wie erfolgreich sich Date [mehr]
Workshop Medienspeicherung und Verteilung
Eigene Videos, Digitalfotos und MP3-Song immer und überall hören und sehen, ohne langes Suchen durch zentrale Medienspeicherung und Medienabruf vom PC, TV-Gerät und Handy aus. [mehr]
Test CA ARCserv Backup r12
Die jüngste Version der Backup-Software für Unternehmen weist im Management- und Sicherheitsbereich viele neue Funktionen auf. Was das Produkt in der Praxis leistet, hat sich IAIT angesehen. [mehr]
High-Speed-PLC-Modems der 200-mbps-Klasse
Powerline-Modems der jüngsten Generation versprechen Triple-Play-taugliche Heimvernetzung ohne neue Kabel ? die Hausstromleitung genügt. Wir haben getestet, wie viele der versprochenen 200 MBit/s in der Realität durch Stromnetz flitzen und ob Video- und [mehr]
Anzeige