千锋教育-做有情怀、有良心、有品质的职业教育机构
大数据浪潮席卷全球,应用领域宽广,产业规模空前,
就业口径宽广,价值堪比黄金石油,“钱途”无量
大千锋与京东物流合作共建课程体系,企业热门技术全方位涵盖,
融入真实项目案例和工程实践创新。
京东物流合作共建课程
掌握大厂一线刚需
拓展京东物流实战项目案例
大数据技术专家亲授
大数据+数据智能助力学员高起点职业路径,定位P5-P7级数据开发工程师培养,
学员跳过初中级大数据工程师,直接胜任大数据研发部门Leader相关岗位
千锋好程序员大数据+数据智能,与京东物流大厂合作共建大数据技术领域的实战型前瞻深度课程,
对大厂热门技术及项目进行系统、深度的研发和建设,形成独特的教研壁垒
掌握万能的JavaSE开发、大数据必知必会的MySQL、Linux和Shell脚本以及基于Springboot的数据服务研发。
Java研发工程师、系统运维工程师、数据库工程师。
Java基础、集合、线程、IO流、面向对象、MySQL DDL|DML |DQL、索引、JDBC、Linux文件系统命令、软件安装、Shell脚本编程。
基于Restful风格的数据服务项目、数据可视化项目。
离线数据工程师、数据仓库工程师、ETL工程师、数据采集工程师、数据支持工程师、
BI商业分析师、数据可视化工程师、Hadoop工程师、Spark工程师。
数据服务开发、离线数据仓库开发、BI商业分析
Java、MySQL、Maven、Git、OpenResty、Linux、Shell、HDFS、YARN、
Zookeeper、MapReduce、Scala、Python、SparkCore、Hive、SparkSQL、
Presto、Sqoop、DataX、Flume、CDH、数仓架构、维度建模、SuperSet、
Azkaban、Airflow等。
数据服务、大数据可视化、企业级Hadoop基建项目部署、分布式网络爬虫、基于Spark
的大数据分析项目、ETL项目之Hive和SparkSQL、BI商业分析等。
掌握流数据接入、基于Flink实时数据开发、流批一体数据仓库开发、数据湖开发、实时ETL、实时监控系统和京东实时数据开发。
实时工程师、Flink工程师、实时数据仓库工程师、实时ETL工程师、Spark工程师
Kafka、Structured Streaming、Hudi、Canal、Flink、ClickHouse、HBase、Phoenix、Elasticsearch、Redis。
实时监控系统、基于Flink的实时数据开发、实时数据湖、大数据搜索系统。
掌握企业项目开发流程、用户画像开发、企业级推荐系统开发、数据治理、基于生产环境项目部署和京东项目性能调优。
数据服务工程师、离线数据仓库开发工程师、BI商业分析师、实时数据仓库工程师、实时监控系统工程师、ETL工程师、数据可视化工程师、数据治理工程师、高级数据开发工程师、推荐工程、数据平台工程师、数据架构师
数据采集与监控平台、准实时数据仓库、用户画像、推荐系统、基于Flink的实时数据仓库、元数据管理与数据治理。
京东物流大数据项目案例,多领域、全类目、企业级
大型实战项目贯穿课程始终,一切为了学员实战能力
数据源头多且是分散,除业务库,APP 埋点,web网站 log,
LOT 设备等会产生各种各样的海量数据,这些数据进入数据
仓库之,需要进行统一,数据集成在一起。离线数仓的ETL,
涵盖数据的抽取转换与加载。
在数据仓库中构建模型,从数据源中抽取数据,然后对这些
数据进行转化,最终加载到目标数据库或者数据仓库中去,
实现离线数仓ETL过程。
企业信息化发展,对 ETL 过程、存储都提出更高的要求。互联网在线特性对实时性提出了要求: 如用户反欺诈、用户审核等随着用户的暴涨。实时数据开发,主要是对由用户行为、 业务行为等产生的巨大量数据进行实时处理,并应用到生产中。
实时数仓的存储考虑支持数据重放,方便支持任务重跑。选择一个具有重放功能的、能够保存历史数据并支持多消费者的消息队列,根据需求设置历史数据保存的时长,通过实时数据开发,建成实时数仓、实时指标等,支撑企业链路的实时化。
大数据采集与指标监控项目是基于第一阶段和第二阶段课程,贯穿离线数据上报、数据储存、数据服务监控、数据分析等全套流程。整个项目包括Flume自定义拦截器代码、自定义Azkaban监控代码和SQL相关指标代码开发。
解决离线数据上报流程,数据采集操作,flume和azkaban的二次开发,数据服务监控,离线数据开发流程。
HDFS+Flume+Sqoop+数仓思想+Spark SQL/Hive+Azkaban+Python+Shell+Superset大数据离线数仓解决方案。
1.采集和同步架构组件采用: Sqoop+Flume
2.数仓架构组件采用:HDFS+SparkSQL/Hive
3.任务调度架构采用:Azkaban+Python/Shell
4.涉及到数仓思想: 分层+建模+维度+粒度+拉链+增量/全量+数据质量等
5.本项目中的BI工具: Superset
准实时数仓是一个集流式数据集成,数据分析、DAU预测和数据应用的数仓型项目。整个项目架构为Nginx+OpenResty+Kafka+Spark+Presto等技术构成。
解决事件行为分析、解决企业留存分析、解决漏斗分析、解决DAU预测及数据服务提供。
用户画像是基于数仓之上的项目,主要解决画像标签服务,比如人群圈定服务和相似用户搜索服务等。同时标签的处理使用Word2Vec、TF-IDF、HanLP分词等技术。
解决企业人群圈定、解决相似用户搜索。
专家垂直赋能,深耕核心技术
京东物流数据开发工程师
miniBDP系统架构设计及主要开发者
数据开发经验丰富
对BDP系统开发有多年经验
参与多个miniBDP项目
负责部署实施及相关开发工作
京东健康大数据开发工程师
某电信公司帐详单流式计算系统架构者与主要开发者
数据ETL经验丰富
千亿级数据处理经验
流式开发和批处理开发经验丰富。
千锋好程序员师资筛选自千锋百人教研团队及
互联网一线大厂核心技术人才,5维严选录取率仅1%
提前锁定大厂岗位,开辟绿色求职通道
学员备受青睐,一次学习长久职业支持
优秀学员简历直推大厂大数据岗位面试
免去和千军万马同抢职位。
与京东物流合作共建,
培养实战型大数据架构师。
每年超20场双选会
20000余家IT相关企业建立人才输送合作关系。
年均1000+企业定期上门招聘
在毕业班进行人才选拔。
剖析大厂面试题重点,
提升学员大厂求职能力,规划职业发展路线。
大厂HR深度指导,
学员职业化素养综合提升训练。