摘要:
本周关注:马云谈云计算、大数据、人工智能未来三十年,E-MapReduce存储计算分离,真实的大数据故事,spark session及spark mmlib、presto+oss 阿里云E-Mapreduce动态
1.5.0版本(正在研发)
- 增加集群整体运行情况的仪表盘
- 访问OSS不需要写id、key,增强安全性
- 集群其中后,可以重启、修改配置及安装软件
1.6.0版本
- 交互式查询(支持hive、spark)
资讯
- 未来三十年,云计算、大数据、人工智能,都会成为基本的公共服务,各行各业都会经受巨大的变化。”阿里巴巴董事局主席马云18日出席2016中国保险业发展年会时表示,“物流业、制造业、服务业、金融业、教育,所有的行业,在这场技术革命之下改变是不可避免的。”
- 众观历史,分久必合、合久必分,在计算机历史中也很类似,如今,Hadoop也许到了计算与存储分离的阶段。
- 大数据目前是当下最火热的词了,你要是不知道大数据这个概念,都不好意思在众人面前开口了。然而实际上很多人都对大数据的应用模糊不清。现在就让我们从下面十三个鲜明的大数据应用案例来了解下最真实的大数据故事。
- 开源的四个阶段分别是:拥抱开源、回馈开源、融合开源和回报开源。
- 最近几年,机器学习、预测分析和数据科学主题得到了广泛的关注。Spark的机器学习库(Spark MLlib),包括各种机器学习算法:协同过滤算法、聚类算法、分类算法和其他算法。
- spark2.0引入了sparkSession,这个跟SparkContext有啥区别呢?
- Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,目前E-MapReduce支持数据源放在OSS上