未加星标

大数据生态圈和机器学习专栏开篇

字体大小 | |
[大数据资讯 所属分类 大数据资讯 | 发布者 店小二05 | 时间 2018 | 作者 红领巾 ] 0人收藏点击收藏

本专栏面向大数据、机器学习爱好者,无论是在校的、刚进入社会的、还是老司机,希望通过阅读本专栏都能有收获。

专栏主要分大数据生态圈和机器学习两条主线

一、大数据生态圈
大数据生态圈和机器学习专栏开篇
1. 大数据技术组件
数据采集组件:DataX,sqoop,logstash,flume等
数据计算组件:Spark Core,Spark Sql,Spark Streaming,Mapreduce,Hive Sql,Phoenix Sql,Storm
数据调度组件:Azkaban,oozie等
数据存储及中间件组件:Hbase,Hive,Redis,kafka等
集群搭建组件:CDH,Ambari等
数据挖掘相关组件:Spark Mlib,Spark Ml,Mahout等
集群相关日志及任务监控:Elastic Search,logstash,kabana,也就是ELK监控等
2. 大数据常用架构
日志埋点采集架构
数据实时计算架构
离线数据同步及离线计算任务的架构及调度
二、机器学习相关
大数据生态圈和机器学习专栏开篇

大数据生态圈和机器学习专栏开篇
tags: Spark,组件,数据,Sql,专栏,生态圈,架构,logstash,Hive,机器,离线,学习,日志,集群,调度
分页:12
转载请注明
本文标题:大数据生态圈和机器学习专栏开篇
本站链接:http://www.codesec.net/view/575202.html
分享请点击:


1.凡CodeSecTeam转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
登录后可拥有收藏文章、关注作者等权限...
技术大类 技术大类 | 大数据资讯 | 评论(0) | 阅读(123)