位置:搜学搜课 > 新闻 > 秦皇岛有比较好的大数据教育机构吗
实战讲师
课程主题 | 课程内容 | 课程目标 |
阶段(Java基础) | ||
Java语言的特性 | 静态导入、自动封箱拆箱、可变参数、增强for、枚举、类加载器、反射、内省、泛型、注解、动态代理回 | 掌握Java语言的特性 |
Java多线程 | 多线程加强、线程池、Thread Local | 掌握Java线程池技术,掌握线程的Join、notify、notifyAll等机制 |
XML |
Dom解析、Sax解析、Pull解析 Schema |
基于Xml的解析与维护 |
Web | Html,Css,Js | 掌握简单的Html,Css,Js的编写 |
实训项目一:易买网项目 | ||
第二阶段(Web阶段,易买网项目贯穿) | ||
JAVAWEB前端技术 |
项目介绍、项目开发流程 Html、CSS、JS |
了解真实项目开发流程 掌握前端开发基本技术 |
JAVAWEB基础技术 |
Tomcat、HTTP协议、Servlet、Jsp、EL、JSTL、自定义标签 MVC、JAVAWEB三层架构 软件分层、耦合、解耦 AJAX |
掌握JAVAWEB基础知识 深入理解软件分层思想 AJAX实现异步刷新 |
JAVAWEB技术 |
Filter、Listener 文件上传、下载 在线支付 |
过滤器、监听器及常见应用场景 文件上传、下载 在线支付功能实现 aa |
JAVAWEB框架加强 |
面向切面编程 通过注解控制事务 java基础加强、框架加强 |
JAVA特性 熟悉常见设计模式 通过模拟实现框架功能,为后续学习SSH打基础 |
实训项目二:国际物流项目 | ||
第三阶段(Struts,Hibernate,Spring,SSH项目贯穿) | ||
Struts2 |
分析Servlet缺点,进行重构 Struts.xml配置文件 ValueStack Ognl表达式 属性驱动、模型驱动、拦截器、文件上传、token机制等 |
掌握Struts2在项目开发时用到的各种知识点,能够应用 该框架熟练的开发 |
Hibernate | ORM的概念、CRUD的完成、Hibernate常用的配置、API详细的分析、对象的三种状态、关联关系、检索、优化、缓存机制 | 熟练掌握利用Hibernate框架完成项目的开发,深入理解ORMapping的概念,深入理解缓存机制 |
Spring | IOC、DI、动态代理模式、AOP、基于Spring的数据库编程、Spring的声明式事务处理,Struts2与Hibernate与Spring的整合 | 深入理解SpringIOC、DI在软件架构中的作用,深入理解SpringAOP的实现机制和应用场景,Struts2的特性(对象工厂、静态注入、插件机制、ThreadLocal针对ActionContext的封装、Struts2的核心流程、结果集架构)、深入理 解SSH整合的原理 |
JQuery | JQuery常见选择器的应用 | 利用JQuery控制Web界面 |
JS | JS面向对象的特征 | 对象、原型、闭包、JQuery内部结构解析等 |
Maven |
Maven的概念、使用、原理、 Module的概念、仓库 |
能用Maven搭建项目环境 熟练使用Maven的依赖和继承机制 |
SSH项目:国际物流 | 项目背景、系统USE CASE图、系统功能结构图、系统框架图、国际物流核心业务货运管理、购销合同业务、购销合同下货物、出口报运单、装箱单、委托书、发票、财务统计、海量数据导出、出口报运、装箱业务、Shiro安全框架、工作流Activiti5 |
掌握画USECASE图、系统结构图、系统框架图。 面试能顺畅讲述国际物流核心业务,包括:购销合同、出口报运、装箱、委托、发票、财务。 了解大型数据库设计思路,及数据库在设计上如何优化。 熟练实现合同、货物、附件两级主从结构。 熟练POI制式表单应用。 熟练应用Shiro安全框架。 熟练应用工作流Activiti5实现货运管理流程控制。 |
实训项目三:易买电商项目 | ||
第四阶段(SpringMVC,Mybaties,SSM项目贯穿) | ||
SpringMVC | 模拟SpringMVC的核心部件写一个例子、核心分发器、处理器映射、适配器、控制器、注解开发实例、标签机制、拦截器机制、AJAX与JSON调用 | 熟练掌握SpringMVC的各个组件,理解SpringMVC的架构原理,利用SpringMVC开发项目 |
MyBaties | CRUD操作、SqlSessionFactory对象、SqlSession对象、集合参数、动态SQL语句、代码优化、Mapper的接口、关联关系、缓存机制、拦截器、MyEclipse插件的使用 | 熟练掌握SpringMVC的各个组件,理解SpringMVC的架构原理,利用SpringMVC开发项目 |
SSM项目(易买电商) | 项目需求讲解、环境的搭建、后台系统实现、前台系统搭建、内容管理实现、Redis缓存解决前台访问性能问题、单点登录、异步订单系统处理、Lucene与Solor实现文件的检索、ActivityMQ实现消息的异步通信、MySQL的数据库的读写分离、分布式环境的部署和实施 | 了解电商项目的需求分析,掌握用pom.xml文件构建项目,实现电商项目的前台的内容管理、菜单管理、购物等。掌握Redis缓存如何提供性能、利用Solor做全文检索、利用ActivityMQ的异步机制把缓存中的改动同步到 各个环节、掌握MySQL的主从复制和读写分离。利用lvs,keepalived,nginx,tomcat搭建高并发的web环境 |
实训项目四:电信项目 | ||
第五阶段(分布式、高并发、集群、电信项目贯穿) | ||
网络编程 | Socket、Io、Nio、Mina、RPC技术、多线程、线程池 | 把电信项目的部分环节利用mina、RPC技术实现 |
数据仓库 |
数据仓库基础知识 ETL MySQL的导入工具、分表,分区、读写分离、存储过程级多维分析 |
掌握数据仓库的知识内容,这是云计算分析的基础 |
分布式缓存 | 学习MemoryCache与Redis两种缓存 | 掌握两种缓存的原理、以及操作 |
Zookeeper | Zookeeper的选举、数据的同步、Zookeeper的部署、Follow与Leader | 了解Zookeeper的选举算法、同步机制、掌握Zookeeper的集群的搭建 |
集群 | Keepalived的Loadblancing机制、Nginex反向代理服务器、Tomcat集群、Lvs | 利用Lvs、Keepalived、Nginx、Tomcat搭建高并发、分布式的Web服务器 |
SOA | Rest风格的服务架构、基于Rest风格的WebService的使用、dubbo服务框架的使用 | 利用服务性框架使得系统的耦合性更弱,扩展性更强 |
云计算 | 云计算的概念、Iaas、 Paas、Saas的理解、虚拟化的概念 | 理解云计算 |
电信项目 | 把上面所学的知识点全部结合起来做电信行业的日志分析系统 | 通过项目掌握MySQL的集群、读写分离、优化、掌握Mina框架的通信机制、掌握Zookeeper的高可用机制、利用MySql掌握数据仓库的概念、利用分布式缓存提高系统的性能 |
实训项目五:电信项目 | ||
第六阶段(Hadoop,Spark,电信项目贯穿) | ||
Hadoop的分布式文件系统HDFS | HDFS的概念、HDFS的API的应用、NameNode与SecondaryNameNode与DataNode的原理与通信机制、数据块Block的概念、NameNode的文档目录树、NameNode与DataNode的关联 | Hadoop伪分布式的搭建、利用HDFS的API对分布式文件系统进行操作、掌握NameNode与SecondaryNameNode的通信原理、掌握NameNode与DataNode的通信原理 |
Hadoop的计算框架MapReduce | 利用MapReducer的计算框架实现电信日志的分析、深入理解Shuffle机制、FileOutPutFormat、FileInPutFormat | 熟练Map、Reducer、Sort、Partition的编程、深入理解Shuffle机制、深入理解OutPutFormat与InputFormat、基于Hadoop的对象序列化机制 |
Hadoop的资源管理与资源调度 Yarn框架 |
深入理解MapReducer的通信机制:利用Yarn的资源管理和资源调度机制。理解进程ResourceManager,NodeManager,ApplicationMaster等进程的作用 | 深入理解Yarn的资源管理与资源调度机制。掌握整个MapReducer的计算流程和资源调度流程 |
HBase | 搭建NOSQL数据库HBase的集群、利用Zookeeper做HBase的HA机制 | 掌握HBase的集群的的搭建 |
HIVE | 数据仓库基础知识、Hive定义、Hive体系结构简介、Hive集群、客户端简介、 HiveQL定义、HiveQL与SQL的比较、数据类型、外部表和分区表、表的操作与CLI客户端演示、数据导入与CLI客户端演示、查询数据与CLI 客户端演示、数据的连接与CLI客户端演示、用户自定义函数(UDF)的开发与演示 | 利用HIVE做日志分析的查询 |
Spark | Spark介绍:Spark应用场景、Scala编程语言、Scala编程、Spark集群部署等 | 利用Spark流式编程做日志的分析 |
电信项目 | 把第四阶段的电信项目用Hadoop与Spark实现 | 熟练应用Hadoop的MapReducer,Hive与Spark |
实战讲师
课程主题 | 课程内容 | 课程目标 |
阶段(Java基础) | ||
Java语言的特性 | 静态导入、自动封箱拆箱、可变参数、增强for、枚举、类加载器、反射、内省、泛型、注解、动态代理回 | 掌握Java语言的特性 |
Java多线程 | 多线程加强、线程池、Thread Local | 掌握Java线程池技术,掌握线程的Join、notify、notifyAll等机制 |
XML |
Dom解析、Sax解析、Pull解析 Schema |
基于Xml的解析与维护 |
Web | Html,Css,Js | 掌握简单的Html,Css,Js的编写 |
实训项目一:易买网项目 | ||
第二阶段(Web阶段,易买网项目贯穿) | ||
JAVAWEB前端技术 |
项目介绍、项目开发流程 Html、CSS、JS |
了解真实项目开发流程 掌握前端开发基本技术 |
JAVAWEB基础技术 |
Tomcat、HTTP协议、Servlet、Jsp、EL、JSTL、自定义标签 MVC、JAVAWEB三层架构 软件分层、耦合、解耦 AJAX |
掌握JAVAWEB基础知识 深入理解软件分层思想 AJAX实现异步刷新 |
JAVAWEB技术 |
Filter、Listener 文件上传、下载 在线支付 |
过滤器、监听器及常见应用场景 文件上传、下载 在线支付功能实现 aa |
JAVAWEB框架加强 |
面向切面编程 通过注解控制事务 java基础加强、框架加强 |
JAVA特性 熟悉常见设计模式 通过模拟实现框架功能,为后续学习SSH打基础 |
实训项目二:国际物流项目 | ||
第三阶段(Struts,Hibernate,Spring,SSH项目贯穿) | ||
Struts2 |
分析Servlet缺点,进行重构 Struts.xml配置文件 ValueStack Ognl表达式 属性驱动、模型驱动、拦截器、文件上传、token机制等 |
掌握Struts2在项目开发时用到的各种知识点,能够应用 该框架熟练的开发 |
Hibernate | ORM的概念、CRUD的完成、Hibernate常用的配置、API详细的分析、对象的三种状态、关联关系、检索、优化、缓存机制 | 熟练掌握利用Hibernate框架完成项目的开发,深入理解ORMapping的概念,深入理解缓存机制 |
Spring | IOC、DI、动态代理模式、AOP、基于Spring的数据库编程、Spring的声明式事务处理,Struts2与Hibernate与Spring的整合 | 深入理解SpringIOC、DI在软件架构中的作用,深入理解SpringAOP的实现机制和应用场景,Struts2的特性(对象工厂、静态注入、插件机制、ThreadLocal针对ActionContext的封装、Struts2的核心流程、结果集架构)、深入理 解SSH整合的原理 |
JQuery | JQuery常见选择器的应用 | 利用JQuery控制Web界面 |
JS | JS面向对象的特征 | 对象、原型、闭包、JQuery内部结构解析等 |
Maven |
Maven的概念、使用、原理、 Module的概念、仓库 |
能用Maven搭建项目环境 熟练使用Maven的依赖和继承机制 |
SSH项目:国际物流 | 项目背景、系统USE CASE图、系统功能结构图、系统框架图、国际物流核心业务货运管理、购销合同业务、购销合同下货物、出口报运单、装箱单、委托书、发票、财务统计、海量数据导出、出口报运、装箱业务、Shiro安全框架、工作流Activiti5 |
掌握画USECASE图、系统结构图、系统框架图。 面试能顺畅讲述国际物流核心业务,包括:购销合同、出口报运、装箱、委托、发票、财务。 了解大型数据库设计思路,及数据库在设计上如何优化。 熟练实现合同、货物、附件两级主从结构。 熟练POI制式表单应用。 熟练应用Shiro安全框架。 熟练应用工作流Activiti5实现货运管理流程控制。 |
实训项目三:易买电商项目 | ||
第四阶段(SpringMVC,Mybaties,SSM项目贯穿) | ||
SpringMVC | 模拟SpringMVC的核心部件写一个例子、核心分发器、处理器映射、适配器、控制器、注解开发实例、标签机制、拦截器机制、AJAX与JSON调用 | 熟练掌握SpringMVC的各个组件,理解SpringMVC的架构原理,利用SpringMVC开发项目 |
MyBaties | CRUD操作、SqlSessionFactory对象、SqlSession对象、集合参数、动态SQL语句、代码优化、Mapper的接口、关联关系、缓存机制、拦截器、MyEclipse插件的使用 | 熟练掌握SpringMVC的各个组件,理解SpringMVC的架构原理,利用SpringMVC开发项目 |
SSM项目(易买电商) | 项目需求讲解、环境的搭建、后台系统实现、前台系统搭建、内容管理实现、Redis缓存解决前台访问性能问题、单点登录、异步订单系统处理、Lucene与Solor实现文件的检索、ActivityMQ实现消息的异步通信、MySQL的数据库的读写分离、分布式环境的部署和实施 | 了解电商项目的需求分析,掌握用pom.xml文件构建项目,实现电商项目的前台的内容管理、菜单管理、购物等。掌握Redis缓存如何提供性能、利用Solor做全文检索、利用ActivityMQ的异步机制把缓存中的改动同步到 各个环节、掌握MySQL的主从复制和读写分离。利用lvs,keepalived,nginx,tomcat搭建高并发的web环境 |
实训项目四:电信项目 | ||
第五阶段(分布式、高并发、集群、电信项目贯穿) | ||
网络编程 | Socket、Io、Nio、Mina、RPC技术、多线程、线程池 | 把电信项目的部分环节利用mina、RPC技术实现 |
数据仓库 |
数据仓库基础知识 ETL MySQL的导入工具、分表,分区、读写分离、存储过程级多维分析 |
掌握数据仓库的知识内容,这是云计算分析的基础 |
分布式缓存 | 学习MemoryCache与Redis两种缓存 | 掌握两种缓存的原理、以及操作 |
Zookeeper | Zookeeper的选举、数据的同步、Zookeeper的部署、Follow与Leader | 了解Zookeeper的选举算法、同步机制、掌握Zookeeper的集群的搭建 |
集群 | Keepalived的Loadblancing机制、Nginex反向代理服务器、Tomcat集群、Lvs | 利用Lvs、Keepalived、Nginx、Tomcat搭建高并发、分布式的Web服务器 |
SOA | Rest风格的服务架构、基于Rest风格的WebService的使用、dubbo服务框架的使用 | 利用服务性框架使得系统的耦合性更弱,扩展性更强 |
云计算 | 云计算的概念、Iaas、 Paas、Saas的理解、虚拟化的概念 | 理解云计算 |
电信项目 | 把上面所学的知识点全部结合起来做电信行业的日志分析系统 | 通过项目掌握MySQL的集群、读写分离、优化、掌握Mina框架的通信机制、掌握Zookeeper的高可用机制、利用MySql掌握数据仓库的概念、利用分布式缓存提高系统的性能 |
实训项目五:电信项目 | ||
第六阶段(Hadoop,Spark,电信项目贯穿) | ||
Hadoop的分布式文件系统HDFS | HDFS的概念、HDFS的API的应用、NameNode与SecondaryNameNode与DataNode的原理与通信机制、数据块Block的概念、NameNode的文档目录树、NameNode与DataNode的关联 | Hadoop伪分布式的搭建、利用HDFS的API对分布式文件系统进行操作、掌握NameNode与SecondaryNameNode的通信原理、掌握NameNode与DataNode的通信原理 |
Hadoop的计算框架MapReduce | 利用MapReducer的计算框架实现电信日志的分析、深入理解Shuffle机制、FileOutPutFormat、FileInPutFormat | 熟练Map、Reducer、Sort、Partition的编程、深入理解Shuffle机制、深入理解OutPutFormat与InputFormat、基于Hadoop的对象序列化机制 |
Hadoop的资源管理与资源调度 Yarn框架 |
深入理解MapReducer的通信机制:利用Yarn的资源管理和资源调度机制。理解进程ResourceManager,NodeManager,ApplicationMaster等进程的作用 | 深入理解Yarn的资源管理与资源调度机制。掌握整个MapReducer的计算流程和资源调度流程 |
HBase | 搭建NOSQL数据库HBase的集群、利用Zookeeper做HBase的HA机制 | 掌握HBase的集群的的搭建 |
HIVE | 数据仓库基础知识、Hive定义、Hive体系结构简介、Hive集群、客户端简介、 HiveQL定义、HiveQL与SQL的比较、数据类型、外部表和分区表、表的操作与CLI客户端演示、数据导入与CLI客户端演示、查询数据与CLI 客户端演示、数据的连接与CLI客户端演示、用户自定义函数(UDF)的开发与演示 | 利用HIVE做日志分析的查询 |
Spark | Spark介绍:Spark应用场景、Scala编程语言、Scala编程、Spark集群部署等 | 利用Spark流式编程做日志的分析 |
电信项目 | 把第四阶段的电信项目用Hadoop与Spark实现 | 熟练应用Hadoop的MapReducer,Hive与Spark |
秦皇岛有比较好的大数据教育机构吗?小编在这里为大家推荐秦皇岛达内教育,美国上市公司,专注互联网IT职业教育18年,已开设26大课程方向,覆盖IT/设计/运营方向全互联网岗位.全国70个城市建立了300多家培训中心,线上线下同步教学,入学签订就业保障协议,一地学习全国就业!接下来小编为您分享,大数据开发有哪些角色?他们在干什么?
重要的事情说三遍,现在企业对数据的依赖度是越来越高,会有越来越多的部门需要从数仓中提数。而提数并不是高度聚合后的指标,很多时候会从明细层提数。所以,大家看到Kimball建模中也提到了,不要以为我们把上层的数据提供给用户就可以了。
举几个场景:
[1]
早上7点,高层在IM中发了一条消息,顺便diss了下,数据部门老大点开一看,卧槽!跑出来的经营数据差了几个数量级。马上打电话给小明。
数据部门:小明,你看看大屏的数据,错得太离谱了,赶紧解决。
于是,小明开始检查数据链路,发现是在ods有一个分区的数据压根没有同步过来,导致了数据不对,于是迅速开始数据重跑。
[2]
下午6点,数据分析师来数据部门找到小明,开始疯狂diss,
分析师:Look at the fucking data!能不能靠点谱?跑得慢我就不说了,跑了半天数据指标60%都是空的。
小明又开始检查分析师的SQL代码,发现这是一个TB级的表关联,分析师关联的表有一部分没跑出来,结果导致关联出来的数据有大量是空值。
数仓开发是与业务部门联系非常紧密的部门,这部分的工作是繁琐、甚至是枯燥的,而且技术要求相对平台开发要低很多。所以,大量的外包人员集中在此。
ETL
该说ETL了。其实,ETL这个概念并不是定位特别。有人曾经告诉我,现在其实应该叫ELT会更合适些。他之所以这么说,是因为他从一个脚本出发的,先从source加载数据,然后在计算引擎中做处理。但其实,从架构层次考虑,没有太大差别。
ETL开发与业务系统开发、平台开发、数仓开发都有对接。它们是介于平台开发、数仓开发之间。一般,业务系统非常多。信息化时代发展到今天,大一点的公司,十几个系统也是不奇怪的。不同时期投入生产的业务系统,底层的库DBMS、建模结构、命名结构、数据组织、分布都是不一样的。
ETL开发要面对了这些遗留的、新开发的所有数据源,要增加数据源能够稳定、可靠的进入到大数据平台。数据质量往往由源头决定,一旦出现问题,上层的数仓基本处于瘫痪。所以,ETL开发在这过程中也扮演了一个非常关键的角色。现在绝大多数公司都会有T+1任务定期调度执行。所以,调度也是ETL开发的重点。ETL是需要对调度很熟悉的,需要会写SHELL、Python脚本,通过这些胶水,把抽数过程和存储集群、计算集群连接起来。
来给大家举几个场景:
[1]
凌晨1点半,ETL开发小明电话突然响起!是运维警告系统自动打来的S1警告!
“编号为xxxx_210_001脚本执行失败,请尽快上线修复”。
小明突然一激灵,这TM脚本可是核心系统的抽数脚本,这要是数据出不来,我明天不得被喷死!小虎打开电话,赶紧连接到生产环境检查日志。从调度、到执行ETL的作业排查了一遍,发现是源系统表发生了变更,导致数据导入失败!
[2]
下午3点,大数据运维团队正在升级集群。运维人员看到新扩容的节点都已经上线了,本次扩容了300台集群。所以晚上要和各个小组开发紧盯生产环境,确保跑数没有问题。
凌晨2点,小明扣着手机,看着几百个抽数脚本如洪水般提交到集群。打开监控界面,突然发现,这TM...新上的300台集群基本处于空闲,任务都没有调度进去。赶紧排查!发现,这300台节点没有配置到指定的抽数队列...
尴尬无比。
大家看到了,ETL开发大量工作在抽数、调度上,他们需要面对业务系统库的频繁变更、以及增加大数据底层数据稳定、可靠。并且也需要对数,能够及时发现大数据中的数据和业务系统中数据的不一致。还要解决数据漂移问题。
平台运维
终于到平台运维。如今的运维是有大数据运维分支的。大数据运维处于大数据技术的low level,其实很多有平台开发的公司,大部分难点攻坚的工作都是平台开发在做的。当要上新组件、patch、调参其实大多数平台开发是已经做好了,平台运维只需要按照平台开发的说明部署即可。他们的工作大数据是维护、监控上。例如:安装集群、按照平台开发的说明打patch、配置组件监控。但平台运维需要对接所有的开发。
温馨提示:为了不影响您的时间,来校区前或者遇到不明白的问题请先电话咨询,方便我校安排相关课程的专业老师为您解答,选取适合您的课程。以上是秦皇岛达内教育的的小编为您分享的关于大数据开发有哪些角色?他们在干什么的内容,希望可以为同学们提供帮助,更多大数据试资讯请持续关注秦皇岛达内教育。
尊重原创文章,转载请注明出处与链接:http://www.soxsok.com/wnews528540.html 违者必究! 以上就是关于“秦皇岛有比较好的大数据教育机构吗”的全部内容了,想了解更多相关知识请持续关注本站。