开源大数据周刊-第19期-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

开源大数据周刊-第19期

阅读量：6412 次

发布时间：2019-06-23

本文共 717 字，大约阅读时间需要 2 分钟。

摘要：

本周关注：马云谈云计算、大数据、人工智能未来三十年，E-MapReduce存储计算分离，真实的大数据故事，spark session及spark mmlib、presto+oss

阿里云E-Mapreduce动态

1.5.0版本（正在研发）

增加集群整体运行情况的仪表盘

访问OSS不需要写id、key，增强安全性

集群其中后，可以重启、修改配置及安装软件

1.6.0版本

交互式查询（支持hive、spark）

资讯

未来三十年，云计算、大数据、人工智能，都会成为基本的公共服务，各行各业都会经受巨大的变化。”阿里巴巴董事局主席马云18日出席2016中国保险业发展年会时表示，“物流业、制造业、服务业、金融业、教育，所有的行业，在这场技术革命之下改变是不可避免的。”

众观历史，分久必合、合久必分，在计算机历史中也很类似，如今，Hadoop也许到了计算与存储分离的阶段。

大数据目前是当下最火热的词了，你要是不知道大数据这个概念，都不好意思在众人面前开口了。然而实际上很多人都对大数据的应用模糊不清。现在就让我们从下面十三个鲜明的大数据应用案例来了解下最真实的大数据故事。

开源的四个阶段分别是：拥抱开源、回馈开源、融合开源和回报开源。

最近几年，机器学习、预测分析和数据科学主题得到了广泛的关注。Spark的机器学习库（Spark MLlib），包括各种机器学习算法：协同过滤算法、聚类算法、分类算法和其他算法。

spark2.0引入了sparkSession，这个跟SparkContext有啥区别呢？

Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询，目前E-MapReduce支持数据源放在OSS上

转载地址：http://rzura.baihongyu.com/

你可能感兴趣的文章

kylin学习笔记

iOS开发中的错误整理，百思项目'我的'模块,tableFooterViewHeight的问题.提醒自己对KVO和Block的运用欠缺...

重写 Ext.toolbar.Paging 扩展功能

linux进程地址空间--vma的基本操作【转】

李洪强iOS开发之提交AppStory时候遇到的坑

maven 跳过测试打包及上传命令

Git安装与配置

windows下使用curl命令 && 常用curl命令

JavDroider的作品展示

Eziriz .NET Reactor(.net混淆器) v5.0.0.0 完美安装破解版(附破解文件)

Python3 写Windows Service服务程序

strncpy, strncpy_s

sqlserver 大杂烩

python俱乐部

最新行政区划编码数据

oracle11 客户端安装及PLSQL和TOAD中文乱码

NGUI下拉菜单学习UIPopupList

WorldWind源码剖析系列：缓冲类Cache

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-15 13:11:55 当前IP: 18.222.67.8 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我