18 september, 2016

Data Opslag

data-managementData staat centraal bij BigData oplossingen. Dat begint al bij de wijze waarop met het HDFS de data zo dicht mogelijk bij de CPU’s worden gebracht, waarbij er redundante opslag wordt gebruikt om fout tolerante systemen te realiseren. YARN is de centrale component in het beheren van al deze resources.

 

Om data gemakkelijker hanteerbaar tMongoDB-Logo-NoRege maken kan daarnaast gebruik gemaakt worden van databases, hetzij RDBMS, maar nog veel vaker wordt gebruik gemaakt van NoSQL databases om te kunnen omgaan met ongestructureerd vormen van Data. We leveren MongoDB voor document georiënteerde toepassingen, naast de reeds aanwezige databases in een standaard Hadoop cluster, zoals HBase en Hive.

cassandra_logoMet Cassandra komen wij tegemoet aan de eisen van gebruikers die prijs stellen op een kolom georiënteerde opslag. Cassandra is vooral voor toepassingen, waarin in korte tijd grote hoeveelheden data moeten worden opgeslagen.

modern_data_applications

Op basis van Hortonworks HDP+HDF kunt u ook de levenscyclus van uw data beheren. Nieuwe data kan geautomatiseerd worden geoogst en toegevoegd aan bestaande verzamelingen. Tijdens het oogsten van data kan deze direct worden geïnterpreteerd met HDF waarna de data wordt gepersisteerd in HDP. Met vereenvoudigde scripting komt u in control van de dataflow door uw gehele organisatie.