SAS Institute

En söt liten elefant, med stora krafter - Hadoop

Blogginlägg   •   Sep 23, 2014 12:47 CEST

Många företag, särskilt i USA är arbetet redan igång med Hadoop och analysföretag som Gartner och Allied Market Research förutspår en massiv tillväxt under de kommande åren. Av allt att döma så är det frågan om en ny teknologisk epok som kommer ändra vårt sätt att arbeta med data och analyser. Då analyskopplingen är uppenbar har R&D-avdelningen på SAS länge varit i färd med att integrera HADOOP och SAS.

Extra muskler för hantering av Big Data på attraktiva villkor

Men vad är det som är så intressant med Hadoop? Elefanten är trots sin söta utseende, ett riktigt muskelberg som kan användas för att lagra och hantera data både smidigt och kostnadseffektivt. Detta gäller även enorma datamängder från Facebook, eBay, Yahoo, etc.

Hasoop är inte en databas i traditionell mening, utan se det istället som ett ”open source framework” som kan hantera data i nästan alla storlekar och format. Det kan användas till enbart datalagring, i kombination med verksamhetens data warehouse eller för att utforska nya möjligheter med Analytics. Några av fördelarna med Hadoop är:

  • Lägre omkostnader för lagring av Big Data. Open source-software är i princip gratis och Hadoop använder standardhårdvara.
  • Hastighet. På grund av den distribuerade modellen (där många datorer delar på arbetsuppgiften), kan mycket stora datamängder behandlas mycket snabbt.
  • Skalbarhet. Det krävs inte mycket administration för att lägga till fler maskiner, kostnaden att göra det är känd och tydlig.
  • Flexibilitet. Du behöver inte bearbeta data innan den lagras, inte heller ostrukturerade data såsom text, bilder och videoklipp. Du kan lagra så mycket data du vill och senare bestämma hur den ska användas.
  • Pålitlighet. Hadoop är ett mycket robust system då hårdvarufel bara vidarebefordrar det pågående ”jobbet” till en annan server och där processen fortsätter.

Det låter nästan för bra för att vara sant, några nackdelar måste väl ändå finnas?  Generellt är Hadoop ett något omoget ekosystem med några lösa trådar. Det använder flera programmeringsspråk, och det finns få grafiska användargränssnitt, så det kan kräva (nya) kompetenser. Genom kommersiella partners som Horton Works ellerCloudera går dock mycket att undvika och det sker också en snabb utveckling på området

Hadoop ger "analytiskt bränsle" till SAS
Verksamheter som idag använder SAS får också lättare tillgång till den nya tekniken. Fördelen med att kombinera de två världarna är att man får ännu bättre möjligheter att hämta värdefulla insikter ur Big Data - inom en rimlig ”hardwarebudget”.

Det finns redan åtskilliga SAS-lösningar som integrerar med Hadoop och utnyttjar processorkraften i klustret. Det gäller för data management, business analytics och avancerad analys, och fler är på väg. SAS-användare kan därmed utnyttja Hadoop via SAS, som de redan känner och ta del av de nya grafiska SAS-gränssnittet mot HADOOP i användandet.


- Yvonne Bjurstam, Senior Marketing Specialst