北理工大数据创新学习中心“Python学习汇报暨人工智能与计算交流会”

发布时间: 2017-05-22 阅读数: 1848

北京理工大学“大数据创新学习中心”迎合了广大师生、科研工作者研究与学习需要,与高校、科研机构和科技信息企业展开了合作,最大限度地共享校内外大数据研究与分析资源,开辟了“学中用、用中学”的创新学习新模式。“大数据创新学习中心”指导教师团队来自学界(如东南大学,北京大学,清华大学,中国人民大学,中科院等)和业界(如雪晴数据网,上海海翼知公司,清华大数据联合研究院,深圳狗尾草科技公司等),学员有350余人(教师、硕士及博士研究生、少量本科生及业界与社会上爱好者),目前已经开展了Python基础理论学习、Python实战学习和知识图谱理论学习活动,学员们学习热情高涨。

Python 是一门更注重可读性和效率的语言,尤其是相较于 Java,PHP 以及 C++ 这样的语言,它的这两个优势让其在开发者中大受欢迎。因此,中心将在5月27日到28日,举办“Python学习汇报暨人工智能与计算交流会”,具体信息如下,欢迎大家参与。

主题:Python学习汇报暨人工智能与计算

时间:2017年5月27日至28日

地点:北京理工大学(中关村校区) 研究生院101报告厅

雪晴数据网会免费直播本次会议,不能到场的小伙伴的可以在线观看

直播网址  http://live.xueqing.tv/room/bit

核心内容

  1. 学员们以案例驱动的方式讲解“Python基础理论知识及在大数据分析、商业数据挖掘、机器学习和人工智能中的应用”
  2. 邀请学界、业界知名学者做“人工智能与计算”系列主题报告;
  3. 业界精英研发经验分享。

会议免费!!!食宿自理~

以下是从北京理工大学东门到研究生院的路线图


27日会议议程

时间

主题

09:00 - 09:05

领导欢迎致辞

09:05 - 09:10

北京理工大学创新学习活动发起人 逄金辉 副教授

中心活动情况介绍

09:10 – 10:30

陈堰平

实战中的数据分析

10:30 – 11:00

茶歇

11:00 – 12:30

学员汇报:在处理淘宝数据实战中熟悉python机器学习工作流程

12:30 – 13:30

午休

13:30 – 15:00

学员汇报:基于python的人脸识别简单实现

15:00 – 15:20

茶歇

15:20 – 16:00

赵鑫 中国人民大学

面向社交媒体的商业大数据挖掘

16:00 – 17:30

学员汇报:链家网房价数据分析的Python实现

17:30 – 18:10

讨论与经验分享(主题:码农在路上)

27号汇报专家介绍

陈堰平

专家简介

陈堰平,雪晴数据网创始人。主要从事统计咨询、数据分析、开发基于R语言的商业解决方案。2017年1月获得“微软最有价值专家”称号。毕业于中国人民大学统计学院,曾获CQF国际数量金融认证,先后担任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为微软、联想、丰田、惠普、招商银行、花旗银行、东方航空、中国电信、中国移动、中国联通等单位做有关数据科学方面的培训和咨询。曾开发贝叶斯动态线性规划模型的R包ssDLM,译作有《R语言编程艺术》、《实用数据分析》和《R语言临床数据分析》,主讲在线课程《R语言数据分析入门》、《R语言大规模数据分析实战》,并在多个平台上发布。

报告题目:实战中的数据分析
报告内容:

内容涵盖零售业营销决策、网站用户行为分析、用户偏好分析、房地产价格建模、银行精准营销中的大数据分析。

赵鑫

专家简介

赵鑫,中国人民大学信息学院教师,师从北京大学李晓明教授,专注于研究社交用户的兴趣建模。近五年内在国内外著名学术期刊与会议上以第一作者或者第二作者身份发表论文40余篇,其中包括信息检索领域顶级学术期刊ACM TOIS和学术会议SIGIR、数据挖掘领域顶级学术期刊IEEE TKDE和学术会议SIGKDD、自然语言处理顶级会议ACL和EMNLP。所发表的学术论文取得了一定的关注度,据Google Scholar统计,已发表论文共计被引用近1400次,其中以第一作者发表的《Comparing Twitter and Traditional Media Using Topic Models》单文被引用640次。担任多个重要的国际会议或者期刊评审、CCL 2016和AIRS 2016出版主席、NLPCC 2017和SMP 2017的领域主席等。

报告题目:面向社交媒体的商业大数据挖掘
报告内容:

最近几年,随着互联网技术的快速发展,社交媒体服务在用户的真实生活中发挥着越来越重要的作用,得到了广泛使用。同一用户可能同时拥有多个社交媒体网站的账号,分别对应着不同的网络社区身份。以这些社区身份为基础,用户可以同时参与到多个社交媒体平台,享受其中提供的应用服务。因此,在打造电子商务服务时,能否同时围绕用户的“真实身份”与“在线社交身份”,是一个很重要的思维创新。同时利用电子商务平台上的数据以及社交媒体平台上的用户数据,将能够解决一些之前电子商务平台网站很难解决的技术挑战,如冷启动推荐问题等。本次报告将围绕用户画像构建、用户意图检测和用户需求推荐等方面来进行相关内容介绍。

王安

专家简介

王安,布本智能联合创始人及首席分析官,北京大学光华管理学院MBA,北京大学商务智能中心专家组成员专注数据化决策,互联网金融风险管理与精准营销。在数据决策领域拥有十多年的实践经验,曾服务多家大中型银行、保险公司及互联网金融公司。同时也积极参与数据决策教育领域,为北京大学、人民大学、北京航空航天大学、北京理工大学等院校机构提供相关课程和教育辅导。

黄凯波

专家简介

黄凯波,在清华数据创新基地担任技术与服务总监,拥有十余年丰富产品、数据分析、IT项目和互联网经验。负责D-Lab 的技术、产品和项目咨询。连续创业者,曾任奇虎360移动产品经理,文思创新(现文思海辉)高级部门经理。

27日学员汇报内容及成员信息

在处理淘宝数据实战中熟悉python机器学习工作流程

小组成员:石运来 李志文 田婧 董小楠等
汇报内容:

pandas和matplotlib的基本使用,爬虫技术的简介,数据浏览与清洗的实例显示,scikit learn机器学习方法的初步使用

基于python的人脸识别简单实现

小组成员:罗江龙 邱浩轩 姚承唐 张馨予等
汇报内容:
  1. 人脸识别的背景研究简介
  2. 目前研究算法介绍
  3. 基于港中文大学的deepid算法实现
  4. 项目实现过程体会。

链家网房价数据分析的Python实现

小组成员:陈英 王业东 傅杰 熊坤 谢玉龙等
汇报内容:
  1. 爬虫技术简介(链家网北京二手房房价数据爬虫实例)
  2. 数据分析(熟悉Python的一些模块,并使用其他的数据处理工具进行数据分析)
  3. 找出影响房价的影响因子。

28日会议议程

时间

主题

09:00 - 10:30

清华大学 陈文光教授

基于图计算的高性能大数据分析系统Gemini

10:30 - 10:50

茶歇

10:50 – 12:20

学员汇报:基于Python的信用卡评分方法

12:20 – 13:20

午休

12:20 – 14:10

北理工 马宏宾教授

智能一切:时代-机器-产业

14:10 – 14:50

猎聘网首席数据官 单艺

人工智能、大数据和人才的未来

14:50 – 15:10

茶歇

15:10 – 16:30

学员汇报:推荐系统python实践

16:30 – 17:10

融360天机风控技术总监 殷磊

迁移学习在金融大数据风控中的应用

17:10 – 18:30

讨论与经验分享(主题:人工智能中的大数据)

28日专家讲座信息&个人介绍

陈文光

专家简介

清华大学计算机系教授,主要研究领域为并行与分布式系统的编程系统。现为中国机算机学会杰出会员和杰出讲者,副秘书长;ACM中国理事会副主席,ACM中国操作系统分会ChinaSys主席。

报告题目:基于图计算的高性能大数据分析系统Gemini
报告内容:

现有大数据分析系统,如MapReduce和Spark,主要以编程的简易性、可扩展性和容错能力为设计原则,牺牲了平台的处理性能。我们将讨论容错与性能的关系,指出性能与容错并非是相互排斥的设计理念,并介绍高性能分布式图计算系统的实例Gemini。Gemini在图的划分方法、数据结构、局部性优化、细粒度负载平衡和通信与计算重叠方面提出了一系列优化技术。在典型的图处理应用中,该系统需要的内存是约为GraphX的十分之一,性能是Spark GraphX的100倍以上。

马宏宾

专家简介

北京理工大学教授、博士生导师。所做研究以适应—学习——认知为中心,探索无人车、机器人及无人机的应用,研究兴趣包括自适应估计与控制,组合导航与智能导航,人机智能交互,机器视觉及机器学习,多智能体及无线传感器网络应用,嵌入 式系统及软件开发,工业大数据。

报告题目:智能一切:时代-机器-产业
报告内容:

您是否感受到智能时代? 您是否使用着智能机器? 您是否受益于智能产业? 您是否关注着人工智能? 您是否浸入于商业智能? 您是否听说过工业智能? 您是否对未来有所焦虑? 您是否对未来有所期待? 他将与您分享他的思考, 他将向您介绍他的行动!

单艺

专家简介

单艺,毕业于清华大学和美国University of Arizona,获得了管理信息系统专业的学士和硕士学位。 目前担任猎聘网首席数据官,负责机器学习技术和产品研发、商业数据分析以及大数据基础设施建设。他具有17年的数据挖掘和系统研发经验,曾经入选“影响中国大数据产业进程100人”。之前,他担任Omni-Dimension Inc(毕肯互动)和WPP Group/奥美ITOP 24/7 Networks的CTO职务,负责数据驱动的互联网广告优化技术和精准广告网络的研发;还曾经担任空中网悟空搜索副总裁和美国Yahoo!网页搜索资深工程师,从事大规模搜索技术和文本挖掘技术的研发。

报告题目:人工智能、大数据和人才的未来
报告内容:

大数据时代已然到来,人工智能应用热潮再次兴起。这些新思想和新技术对人才的求职和企业的招聘过程带来了哪些颠覆性的创新?将带来哪些重大的变革和影响?更进一步,大数据和人工智能技术会对个人的职业发展和整个社会的就业问题可能会产生哪些深远的影响?从2014年起,猎聘大数据研究院在3400万用户、五十万企业和近千万企业职位的基础上综合运用大数据、机器学习、NLP和统计分析的方法对求职招聘相关的主要问题进行了研究,开发出了智能职位推荐、人才推荐和职业社交推荐,并且在中国人才与经济发展关系方面做了较为深入的量化分析。我将分享我们的一些重要成果和经验,并对人工智能对就业的可能影响做初步探讨。

殷磊

专家简介

现任360天机风控tech leader。曾任去哪儿技术总监,百度资深架构师。北京理工大学计算机科学技术博士。专注大数据与人工智能方面的研究。

报告题目:迁移学习在金融大数据风控中的应用
报告内容:

风控是金融领域研究的核心之一,也是大数据应用的经典场景。金融产品丰富多样,受众群体分布广泛,不可能为其设计一个大而全且通用的风控模型。因此,为不同的金融产品设计针对性的风控模型是非常必要的,这正是迁移学习的用武之地。迁移学习不仅可以解决单一产品数据过少,特征单一的问题,还可以捕获产品间相关性,有效的识别个性化风险与系统化风险。

28日学员汇报内容及成员信息

基于Python的信用卡评分方法

小组成员:杨秋霞 董二娃 唐章红 赵晟江 马宏道等
汇报内容:

信用评分的原理与现实意义;信用评分数据缺失值与异常值的常见处理方法;机器学习中随机森林等回归算法原理、参数调优及应用;基于实际数据集的信用评分预测及Python实现。

推荐系统python实践

小组成员:杨念 乔晓磊 王子轩 宋佳 李蓉蓉 廖青云 吕志浩 赵晓磊等
汇报内容:
  1. 推荐系统简介:介绍推荐系统的来源,定义与应用;
  2. 分析介绍推荐系统主要推荐算法及 python相关模块;
  3. 项目成员工作内容展示:针对同一个数据集,项目成员利用已知算法基于python的评分预测,并展示不同算法的对比分析结果。

本次会议免费,食宿自理。如有兴趣,请点击下方报名按钮填写报名信息,我们之后会由于座位有限,请您及时到达会场。

如有疑问,或需要索要会议邀请函的,请联系会务组Email: pangjinhui1@126.com

分享到:
热门文章

REmap发布,用R绘制百度迁徙图

2015年07月23日更新 21684次阅读

学习R语言,一篇文章让你从懵圈到入

2016年05月09日更新 15365次阅读

在R中填充缺失数据—mice包

2015年12月31日更新 11787次阅读

清华大学教授:大数据时代 统计学依

2015年08月07日更新 11476次阅读

精通 R plot—第一部分:颜色

2016年01月20日更新 10689次阅读

学习Tableau的六大好处(一个

2015年12月24日更新 8575次阅读
热门课程

R语言初级课程

2015年02月20日发布 3293名学员

R语言高效数据清理工具包dplyr

2015年08月30日发布 1724名学员

R语言数据分析入门

2016年05月10日发布 1618名学员

如何用R做数据预处理

2016年06月03日发布 1178名学员

全栈数据工程师养成攻略

2016年11月08日发布 1068名学员

R语言大规模数据分析实战

2015年12月17日发布 959名学员
登录 注册