Spark企业级实战项目:道路交通实时流量监控项目

理论一箩筐,不如真刀真抢干一场!本项目使用了Spark技术生态栈中的三个技术框架:Spark Core、Spark Streaming和Spark MLlib,进行道路交通实时流量监控预测系统的开发
使用本地图片

链接详情:http://www.dajiangtai.com/course/37.do

1. 课程介绍

本项目主要采用目前大数据领域最成熟的实时计算框架Spark,它是目前主流企业在实时计算方向采用的主流框架。本项目使用了Spark技术生态栈中的三个技术框架:Spark Core、Spark Streaming和Spark MLlib,进行道路交通实时流量监控预测系统的开发。业务实现包括数据产生模块、数据实时收集处理模块、特征数据提取模块、模型预测模块、数据存储模块

2. 课程视频及源码获取联系方式

收集整理了人工智能和大数据方面的项目实战类的视频教程,需要视频请加微信(BigDataAI007) 如本站没有您想要的视频,请微信联系,可以帮您拿到课程。

使用本地图片

2.1 项目总体介绍和背景

项目总体介绍和背景

1、项目背景

2、总体业务要求

3、难点分析

技术框架

a.大数据工具的选择,包括HDFS、HIVE、SPARK、KAFKA、HBASE、PHOENIX、ZEPPELIN等工具。

b.数据实时处理阶段技术拓展Storm

系统要求以及开发的重点和难点
a. 完成一个推荐系统,为每个用户产生合适的电影产品的推荐结果。并且满足在性能,可靠性上的要求。
b. 实时数据的产生以及打到kafka消息队列中。
c. 对数据特征的发掘、清洗和加工。
d. 产生推荐系统的模型,并在多个模型中选择最佳的模型。
e. 解决整个系统中的性能问题。

2.2 数据流处理

1、数据实时处理阶段技术拓展Storm

2、Spark Streaming实用项目解决方案

3、Spark Streaming项目中性能调优

2.3 数据快速存取

1、项目存储工具Redis

2、Redis部署、基本操作及项目中使用

2.3 模型建立及整体解决方案

1、项目机器学习算法库Mllib

2、Mllib基本数据格式

3、项目中实际模型选择

1、产品功能的简单介绍

2、架构设计

3、技术选型

4、部署方案

5、模块设计划分