La efectividad de Spark en el análisis de big data

Allanar el camino hacia el análisis avanzado en tiempo real con Hadoop es la tarea que está realizado ahora mismo Spark de Apache; el gran descubrimiento en la arena big data.

También te puede interesar:

Marga Verdú
17 MAR 2015

Durante los dos últimos años, un periodo en el que Hadoop se ha convertido en el paradigma dominante del procesamiento big data, se han ido aclarando muchos aspectos. En primer lugar, Hadoop Distributed File System se estima que es hoy en día la plataforma de almacenamiento más adecuada para big data. En segundo lugar, Yarn se ha convertido en el sistema de asignación de recursos por excelencia en entornos big data. Y, en tercer lugar y tal vez la más importante, no existe ningún proceso de red que tenga capacidad de resolución para cada problema, todo y que MapReduce, siendo una tecnología destacada, tampoco tiene capacidad para afrontar todas las situaciones.

Los negocios que confían en Hadoop necesitan una variedad de infraestructuras de analítica y procesamiento con la finalidad de encontrar respuestas a sus críticos planteamientos. Los negocios necesitan respuestas relacionadas con la preparación de los datos, procesos de análisis descriptivos, búsquedas, análisis predictivos, y capacidades más avanzadas como metodologías para el aprendizaje de máquinas y procesamiento gráfico. Además, las organizaciones necesitan un conjunto de herramientas que estén presentes y activas desde cualquier ubicación, permitiéndoles controlar conjuntos de habilidades y otros recursos presentes en la compañía. Hasta hoy no existía ninguna red que fuese capaz de controlar todos estos criterios, hasta que ha llegado Spark.

A pesar de que Spark es un sistema de protección de datos relativamente joven, es capaz de hacer realidad la analítica avanzada de datos a través de una red de algoritmos de análisis que incluye una herramienta para acelerar los queries, una librería de aprendizaje M2M, un motor de procesamiento gráfico, y una herramienta de analítica de streaming. Unas librerías preconstruidas más fáciles y rápidas de usar preparan los datos para que los científicos los organicen en tareas que van más allá de la preparación de los mismos y que incluyen el control de calidad de la información, y la correcta interpretación de los resultados de los análisis.

Una demanda largamente esperada de Hadoop se concentraba en la dificultad que entrañaba su uso, y otra todavía más grave era la carencia fundamentada en localizar profesionales que pudiesen manejar la herramienta. Aunque Hadoop ha ido facilitando su uso y mejorando el rendimiento con cada nueva versión, la fama de sistema difícil de manejar todavía persiste. No obstante, no hace falta ser programador que sepa Java para manejarlo con éxito. Spark ha sido desarrollado para que pueda utilizarlo todo profesional que conozca el funcionamiento de las bases de datos y tenga conocimientos de scripting en Python o Scala.

Imprimir Subir

TE PUEDE INTERESAR...

EMPRESAS

La propiedad de Microsoft sobre OpenAI podría obtener el visto bueno condicional de la UE

Zoom ofrece actualizaciones basadas en IA para su espacio de colaboración Workplace

TENDENCIAS

¿La IA mató al 'blockchain'? El interés mundial por esta tecnología cae un 63% en tres años

EMPRESAS

Un cuarto de siglo fructífero: Appian consolida su posición preferente gracias al enfoque en procesos

EMPRESAS

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

TECNOLOGÍA

Intel construye el sistema neuromórfico más grande del mundo

TECNOLOGÍA

¿Tienen los servicios de IA generativa en la nube futuro empresarial?

TENDENCIAS

Alberto Pascual (Asociación @aslan): “La tecnología ha calado en todos los órdenes de la vida”

TENDENCIAS

La 35ª edición del Congreso&EXPO ASLAN enciende la ilusión de las TIC españolas

TENDENCIAS

Entra en vigor La Ley Europa Interoperable para la conectividad de los servicios públicos

Alberto Palomo, Chief Strategy Officer de la Gaia-X AISBL.

El 'Data & GenAI Forum' pone los retos del despliegue de proyectos de IA bajo la lupa

Alberto Pascual, presidente de la Asociación Aslan

ENTREVISTAS

"A diferencia de otros, en el sector TIC se respira una atmósfera de 'coopetición' muy saludable"

EMPRESAS

Cómo la estrategia de IA de Intel podría desafiar el dominio de Nvidia

EMPRESAS

Bruselas pide información a Broadcom por los cambios de licenciamiento en VMware

EMPRESAS

El Gobierno lanza una convocatoria de ayudas para la creación de Espacios de Datos Sectoriales

EMPRESAS

La estadounidense General Catalyst financia la expansión de Factorial con 74,5 millones de euros

Contenido Patrocinado

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

18 ABR 2024

En la edición de este año, que se celebrará el próximo 7 de mayo en Berlín, la tecnológica reunirá a diversas industrias y ecosistemas para debatir en torno al proceso de adopción de infraestructuras de datos capaces de acelerar la IA.

Forma parte de nuestra comunidad

¿Te interesan nuestras conferencias?

Especial Tendencias 2024

No te pierdas...

La efectividad de Spark en el análisis de big data

TE PUEDE INTERESAR...

Huawei IDI Forum: tres años a la vanguardia de la evolución de la infraestructura de datos

La quiniela tecnológica de las grandes firmas de análisis para 2024

En los albores de una nueva era: así continúa escribiendo la industria tecnológica su historia

La 'resaca' de contrataciones en TI devuelve el poder negociador a las empresas

2024: ¿Vendrá el esperado repunte para las 'startups' españolas?

Visión tecnológica 2024: perspectivas de los CIO ante la revolución digital

Retos y tendencias para el canal en 2024

“El peligro no es la evolución de la IA, sino la mala interpretación que los humanos hacen de ella”

España, tecnologías emergentes y la consolidación de la transformación digital

Hacia un 2024 aún más digital e 'inteligente' pero, ojalá, también humano

32 años de Linux y su comunidad

MareNostrum 5 conquista los 314.000 billones de cálculos por segundo

El gasto global en nube soberana llegará a 258.000 millones de dólares en 2027

Los 'CIO 100 Awards Spain 2023' distinguen los proyectos de innovación tecnológica del año

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa

Por qué la mitad de los desarrolladores adoptarán software mejorado con inteligencia artificial

ChatGPT: 365 días después, el mundo parece otro

'Superapps': ¿La próxima gran novedad de las TI empresariales?

Las mujeres se hacen su camino en el ecosistema 'startupero' español

Grandes modelos lingüísticos: los cimientos de la IA generativa

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

Líderes de futuro: ingeniería de telecomunicación

Guía esencial de Microsoft 365