大会介绍

在开源社区不懈创新的支持下,Cloudera正在加速助力全球企业的数字化转型。

Cloudera Data Platform(CDP)结合了大数据开源社区的最佳技术,可在混合和多云环境中提供强大的自助服务分析,以及IT和数据领导者所需的复杂,细粒度的安全和治理策略,实现企业数据云。

此次Meetup特地邀请了几位开源项目的PMC来讲述一些前沿项目的发展情况和产品路线图。


会议议程

12:00 - 13:30

自助午餐

13:30 - 14:15

主题:如何应对云上大数据平台资源管理及作业调度的挑战

演讲人:Weiwei Yang ,  Apache YuniKorn PMC ,  Cloudera Staff Software Engineer

Cloudera 的 CDP 是基于 Kubernetes 构建的能够灵活部署在公有云,私有云以及混合云环境下的大数据产品。这些场景带来了许多资源管理以及作业调度方面的挑战,例如多租户资源的共享以及公平性,批处理作业,交互式任务以及流计算等混合计算共存等方面。
为了解决这些问题,Cloudera 主导研发了新一代资源管理及作业调度的开源项目:Apache YuniKorn (Incubating)。YuniKorn 能够替代 Kubernetes 原生调度器,更好迎合大数据场景下对资源共享,资源配额管理以及作业调度的需求,夯实了 CDP 的基础架构层。

14:15 - 15:00

主题:Apache Impala 4.0的最新进展与未来规划
演讲人:黄权隆,Apache Impala PMC, Cloudera Impala研发团队核心成员
Apache Impala即将迎来4.0版本的发布,本次分享将介绍4.0中的新功能和重大改进,如所有operator的多线程支持、查询的透明重试、更多的SQL语法等。另外,鉴于很多客户还在使用CDH版本的Impala,本次分享也会提及Impala 3.3/3.4中新增的一些重大功能和改进。最后会介绍Apache Impala的未来演进方向。

15:00 - 15:15

茶歇

15:15 - 16:00

主题:Apache Submarine 一站式机器学习平台的最新进展
演讲人:汤占坤,Apache Hadoop & Submarine PMC,Cloudera Staff Software Engineer
Apache Submarine的目标是能够让数据科学家创建端到端的机器学习工作流的一站式平台。这意味着在这里他们不需要频繁切换工具就能创建数据流水线,进行模型训练的实验,甚至将模型部署上线。这些步骤应该在一个平台完成。在这次分享中,我们从Apache Submarine的概念开始逐步理解如何使用它。然后介绍它的现在和未来。我们也会重点讨论即将在0.5.0版本发布的新功能。

16:00 - 16:45

主题:在CDP中的Flink
演讲人:刘岩,Cloudera 解决方案工程师
今年 1 月,Cloudera 上宣布 Cloudera Data Platform 正式集成了 Flink 作为其流计算产品。Apache Flink PMC Chair Stephan 也回应:“此举意义重大。”这意味着所有 Cloudera发行版覆盖的全球企业用户都将能够使用 Flink 进行流数据处理。
集成 Flink 的 Cloudera Data Platform 有何表现,Cloudera 的技术专家将分享其端到端的流处理平台详细功能及技术细节。


时间:12-15 12:00 - 17:00
地点:明天广场

报名购票

主办方