Introducción

¿Qué es Spark?

spark



“Apache Spark™ is a fast and general engine for large-scale data processing.”

¿Por qué Spark? ¿Qué ventajas tiene? Mi resumen

Hadoop nació (~2005) para procesar grandes cantidades de datos en paralelo. Poco a poco han surgido nuevas problemáticas que no se podían resolver con el paradigma MapReduce y han ido surgiendo nuevos programas para solventar estas problemáticas, creando así nuevos sistemas especializados: