在线课程

大会介绍

过去的20年,数据规模经历了指数级的爆发式增长,随之而来的是数据存储和数据计算的一系列挑战,各类大数据技术也是百花齐放。这其中最具代表性的大数据生态系统及框架如:Hadoop、Spark、Elastic Stack等。另一方面,面对海量的非结构化数据如何从特定的载体(如图像、文本等)或特定的场景中提取兴趣点并应用呢?

 

本期沙龙,我们有幸邀请数位、京东、Morningstar的三位嘉宾,分别为大家分享:基于POI的用户场景识别等内容、大数据生态的演进与展望、ML/NLP提取兴趣点。

 

 

 

活动具体信息如下:

 

主办方:DataFun社区

视频提供方:IT大咖说

时间:2018年5月19日,13:00~18:00

地点:深圳南山软件产业基地4A901

 

 

 

议程安排:

 

​时间

议程安排

13:00-14:00

签到

14:00-14:10

主持人开场

14:10-15:00

 

基于室内POI的用户线下场景识别

——黄兴鲁 数位传媒科技 CTO

15:20-16:10

 

从Hadoop谈起,大数据生态的演进与展望

——袁天宇 京东 算法工程师

16:30-17:20

使用机器学习/NLP来提取(感兴趣的)数据点

——张 锐 Morningstar机器学习研究小组 Lead Dev

 

17:20-18:00

自由交流时间

 

 

 

嘉宾介绍:

 

 

黄兴鲁 数位 CTO

 

目前主要从事无设备室内定位技术研究、基于位置场景智能技术研究;曾任职中国航天,国家某科技工程弹/发快速评估算法研究、天地试验分析算法研究。

 

分享主题:基于室内POI的用户线下场景识别

 

内容摘要线下场景普适的poi数据结构;海量poi数据自更新方法;场景识别技术介绍;在场景智能服务中的应用。

 

 

 

 

袁天宇 京东 算法工程师

 

硕士毕业于华南理工大学,2017年加入京东,目前主要参与CM大数据平台和DMP用户画像平台的研发工作。

 

分享主题:从Hadoop谈起,大数据生态的演进与展望

 

分享摘要本次分享将从目前应用最广泛的大数据生态Hadoop谈起,从存储技术和计算引擎两个方面,简单介绍过去的十年间大数据生态的演进和我们对未来发展的一些展望。

 

张锐 Morningstar机器学习研究小组 Lead Dev

 

早年从事医疗图像行业,后在Morningstar主持设计实现了基金数据采集系统目前版本的大部分。对图像、高性能计算、机器学习落地,以及机器学习在自然语言上应用均有涉猎。

 

分享主题:使用机器学习/NLP来提取(感兴趣的)数据点

 

分享摘要:随着各项条件的进步,我们能采集的数据量大大增加, 但其中大部分都是图像和文本(非结构化数据). 如何对图像进行分析已经较多的讨论了应用了, 对于文本的分析,相对来说讨论则少很多.归根结底在于文字传承的信息量(歧义问题)超过图像. 此次我们总结和归纳一些常见的任务,介绍一些经典和深度学习处理文本问题的方法.

 

 

 

 

主办方介绍:

 

DataFun社区是一关注大数据、人工智能技术主题的社区,主要形式以组织线下的技术沙龙活动为主、线上运营为辅。希望将行业内资深从业者拉到大家面前,和大家进行一对一的面对面交流,促进同行间的沟通交流,推动大数据、人工智能技术在不同场景下的交流融合、共同进步。DataFun的愿景是:为广大数据从业者和爱好者打造一个公益免费的分享、交流、学习、成长的平台。

    目前我们的活动已经覆盖了北京、深圳、上海等城市,希望大家多多支持,后期持续为大家推出更多干货的线下沙龙活动。

 

活动咨询:tianmuqu(微信)

 

 

视频提供方:

 

 

 

 

时间:05-19 14:00 - 18:00
地点:广东深圳南山软件产业基地4A901

报名购票

主办方