剑指大数据:Flink实时数据仓库项目实战(电商版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 学前导读

1.3.1 学习的基本要求

本书针对的主要读者是具有一定编程基础、对大数据行业感兴趣的互联网从业人员和想要进一步了解数据仓库的理论知识及搭建实现的大数据行业从业人员,无论读者是想初步了解大数据行业,还是想全面研究数据仓库的搭建,相信读者可以从本书中找到自己想要的内容。

在跟随本书学习实时数据仓库之前,如果读者希望能实现对数据仓库的搭建,那么需要提前了解一些基础知识,方便读者更快地了解本书所讲的内容,这样在学习后续的内容时不会遇到太多困难。

首先,学习大数据技术,读者一定要掌握一个操作大数据技术的利器,这个利器就是一门编程语言,如Java、Scala、Python等。本书以Java为基础进行编写,所以学习本书需要读者具备一定的Java基础知识和Java编程经验。

其次,读者还需要掌握一些数据库知识,如 MySQL、Oracle 等,并熟练使用 SQL,本书将出现一些SQL操作。

最后,读者还需要掌握一门操作系统技术,即在服务器领域占主导地位的 Linux,只要能够熟练使用Linux的常用系统命令、文件操作命令和一些基本的Linux Shell编程即可。大数据系统需要处理业务系统服务器产生的海量日志数据信息,这些数据通常存储在服务器端,各大互联网公司常用的操作系统是在实际工作中安全性和稳定性很高的Linux或者UNIX。大数据生态圈的各框架组件也普遍运行在Linux上。

除上述必备的基础技能外,阅读本书还需要读者对 Flink、Redis、ClickHouse 等有一定的了解。如果读者不具备上述基础知识,可以关注“尚硅谷教育”公众号获取学习资料,读者可根据自身需要选择相应课程进行学习。本书所讲解的项目还提供了视频课程资料,包括尚硅谷大数据的各种学习视频,读者可在“尚硅谷教育”公众号免费获取。

1.3.2 你将学到什么

本书将带领读者完成一个完整的实时数据仓库项目。本书尽量遵从真实的项目开发流程,大致划分为三个部分:数据仓库理论与需求分析及关键框架安装部署、项目需求实现和项目性能调优。

在数据仓库理论与需求分析及关键框架讲解部分,本书对实时数据仓库的架构知识进行了重点讲解,并着重分析了实时数据仓库应该满足的重要功能需求,读者可以全面地了解一个数据仓库项目的具体需求,以及根据需求如何完成框架选型的过程。并根据框架选型完成了关键框架的安装部署,形成项目雏形。

在项目需求实现部分,则根据具体需求和前期的数据仓库理论知识,一步步编写代码完成最终项目。在本部分将有大量的代码和关键技术点讲解,通过学习这部分内容,读者可以快速增长实时开发经验,了解多种实时开发场景,达到对 Flink 的灵活运用。读者在学习本部分内容时,如果能跟随讲解过程自己完成代码的讲解将会达到事半功倍的效果,可以对Flink有更深刻的了解。

本书的最后部分是项目性能调优。项目在搭建完成后,性能优化和代码维护是需要长期进行的工作。本书的性能调优部分以实际开发环境为基准,对项目的大部分细节点的调优技术点进行了非常详细的讲解。

通过对本书的学习,读者能够对实时数据仓库项目建立起清晰、明确的概念,系统、全面地掌握各项数据仓库项目技术,轻松应对各种数据仓库的难题。