Spark 概述-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Spark 概述

阅读量：6146 次

发布时间：2019-06-21

本文共 790 字，大约阅读时间需要 2 分钟。

Spark 是什么？

● 官方文档解释：Apache Spark is a fast and general engine for large-scale data processing.

通俗的理解：Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性，允许用户将Spark 部署在大量廉价硬件之上，形成集群。

● 扩展了MapReduce计算模型；相比与MapReduce编程模型，Spark提供了更加灵活的DAG（Directed Acyclic Graph）编程模型，不仅包含传统的map、reduce接口，还增加了filter、flatMap、union等操作接口，使得编写Spark程序更加灵活方便。

● 高效支持多种计算模式；Spark 不仅可以做离线运算，还可以做流式运算以及迭代式运算。

Spark与Hadoop的关系

Spark与Hadoop的关系---青出于蓝

Spark与Hadoop的关系---相辅相成

Spark的竞争对手---Flink

● Flink是先有流处理后有批处理

● Pipeline vs Stage

● 详细内容参看

Spark的竞争对手---Storm/JStorm

● Storm仅限于流计算(topology)

● JStorm参照Flink改进了Storm

Spark的竞争对手---Hadoop3.x

详细内容参看

以上就是博主为大家介绍的这一板块的主要内容，这都是博主自己的学习过程，希望能给大家带来一定的指导作用，有用的还望大家点个支持，如果对你没用也望包涵，有错误烦请指出。如有期待可关注博主以第一时间获取更新哦，谢谢！

转载于:https://www.cnblogs.com/zimo-jing/p/9620226.html

你可能感兴趣的文章

3springboot：springboot配置文件（外部配置加载顺序、自动配置原理,@Conditional）

9、Dubbo-配置（4）

前端第七天

图解SSH原理及两种登录方法

[转载] 七龙珠第一部——第058话魔境圣地

【总结整理】JQuery基础学习---样式篇

查询个人站点的文章、分类和标签查询

基础知识：数字、字符串、列表的类型及内置方法

JSP的隐式对象

JS图片跟着鼠标跑效果

[SCOI2005][BZOJ 1084]最大子矩阵

学习笔记之Data Visualization

Leetcode 3. Longest Substring Without Repeating Characters

数学之美系列二十 -- 自然语言处理的教父马库斯

Android实现自定义位置无标题Dialog

Chrome浏览器播放HTML5音频没声音的解决方案

Android源码学习之观察者模式应用

416. Partition Equal Subset Sum

Django之FBV与CBV

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-06 03:14:58 当前IP: 18.191.171.121 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我