第八届中国R语言会议(北京会场)暨2015北大光华数据与价值论坛于2015年6月6日至7日在北京大学成功举办。第一日主会场位于邱德拔体育馆,第二日分会场位于光华管理学院一号楼。
一、会议概况
今年是中国R语言会议举办的第八年。会议由北京大学光华管理学院和统计之都联合主办,由北京大学商务智能中心、北大光华—奥迪管理研究中心、北京大学统计科学中心协办,并得到了百度、一汽—大众奥迪、乐递等战略合作伙伴的鼎力协助和懒投资、百分点、航旅纵横、量邦科技、微量网、一杯汤EasySoup、考拉征信等友情合作伙伴的大力支持。在两天的会议时间里,数据科学各行各业的同仁们欢聚一堂,共襄盛举,畅所欲言。
在北大光华、统计之都各位同仁的不懈努力下,本次会议比往届有了更大的突破。会议共设有10个分论坛,68场主题报告,覆盖大数据技术、互联网金融、量化投资、人网物联、生物信息等诸多当下热门话题。本届会议报名非常火爆,人数突破了4200人,报名单位超过1500个,不仅创下历届之最,也使本次会议成为亚洲地区规模最大的数据科学盛会之一。
本次大会最年轻的报名者为17岁,最年长为76岁。报名者的中位数为26岁,与上届一样。30岁以上报名者与30岁以下报名者的比例约为3:1,年龄分布的直方图如下:
本次大会报名者的男女比例约为3:2, 女性报名者较上届增加了17%。
报名者最多来自北京,比例为84.1%。其次分别是天津、上海、杭州、合肥、武汉、长沙、深圳与郑州。其中,来自海外的报名人数为25位。
本次大会的报名者来自1700多家单位,参会单位的前九位都来自高等院校,其中北京大学和中国人民大学分占一二位。北京外的院校中,南开大学的报名人数最多。非院校机构单位中,百度的报名人数最多,占总报名人数的10%。
报名系统还调查了报名人知晓本次大会的途径。33.4%的人表示通过微信朋友圈了解到本次大会,而经由朋友介绍的比例也超过了四成。通过微信公众号得知本次大会的人员比例约为14%,微博约为8&。通过主站、会议页和邮件了解本次会议的人数比例相对较低。
从报名者感兴趣的主题来看,分布相对较为均衡。其中,最受欢迎的是百度和大数据专场,其次是互联网金融与统计理论专场,感兴趣的报名者比例都超过了10%。
二、会议内容
本次会议分为第一天的主会场和第二天的十个分会场。主会场演讲嘉宾包括学界杰出代表、业界大咖等。分会场包括百度大数据专场(百度冠名)、量化投资专场(量邦集团&微量网冠名)、推荐系统&计算广告专场、人网物联专场(LEDI冠名)、天文气象地理可视化专场、软件工具专场、自然语言处理专场、生物信息与制药专场、互联网金融&统计理论专场、商务数据分析专场,涵盖了数据科学的各个领域,讨论了数据科学在诸多领域的最新进展。
-
1、会议致辞
会议在会议主席朱雪宁的致辞中拉开序幕。主席对R语言会议的发展做了简要介绍,回顾过去又不忘展望未来,并对辛勤工作的志愿者以及主办方表达了感谢。
接下来,光华管理学院的蔡洪滨院长也对本次会议做了致辞。作为商学院的前辈,蔡洪滨教授对数据科学的重要意义做了独特的阐述,引人入胜,让大家津津乐道。
随后,北大光华商务统计系系主任王汉生教授发表了致辞。王汉生教授不仅学术成果斐然,更有浓浓的数据科学情怀,是本次会议的主要推动者和筹办者,为推广R语言以及数据科学知识做出了不可磨灭的贡献。
简短的开幕式结束后,接下来开始主会场嘉宾的演讲。分为上下午两场,主要简介如下:
-
2、郁彬:The multi-facets of a data science project to answer: how are organs formed?
郁彬教授是加州大学伯克利分校统计系系主任。由于基因数据的复杂性和高维性,对其进行有效的数据分析以发现其中的价值显得格外困难,往往需要数据科学家和生物学家的通力协作。郁彬老师展示了一个当下正在进行的项目,为大家揭示了基因数据背后的规律。
-
3、张潼:互联网的大数据实践
张潼博士现在是百度大数据实验室的负责人,并且是美国新泽西大学统计系教授。作为国内最大的互联网公司之一,百度在大数据实践上积累了很多经验,在报告中张潼老师介绍了百度处理大数据的一些案例,技术积累以及和挑战。
-
4、白硕:自然语言与知识引擎
白硕先生是上海证券通信有限责任公司董事长,在基于内存的分布式事务处理系统设计、自然语言处理与信息检索、信息安全等领域有很深的研究。在演讲中,白硕对未来社会中知识服务的前景做了展望,并提到通过深层自然语言处理技术实现的知识引擎,将是知识服务和智能终端共同的核心组件,值得业界高度关注。
-
5、袁晓如:让数据触手可及——可视化分析
袁晓如教授任职于北京大学机器感知与智能教育部重点实验室,是信息科学技术学院信息科学中心副主任。袁教授认为,拥有大量的数据并不等于获得相应数据的价值,复杂数据对发展相应的分析工具提出了新的挑战和要求。可视分析通过将人的因素积极引入分析过程,提供了处理复杂大数据的新的途径。
-
6、冯永昌:用R 语言进行高级量化投资——一个期货和期权组合的策略案例
冯永昌是微量网创始人兼CEO,量邦集团董事长,北京大学对冲基金实验执行主任。在报告中,冯永昌先生提出用股指期货的日内程序化交易策略和做空波动率的期权组合形成风险对冲策略,即Risk-Neutral策略,模拟业绩显示复合策略大幅提升夏普比率,平滑曲线走势。这是用股指期权管控量化交易风险的一个实验性案例。报告也给出如何用R实现该案例的研究和交易。
-
7、苏萌:基于分布式架构的大数据商业建模
苏萌博士现任百分点董事长兼CEO。他在报告中阐述了大数据产业链的全球生态格局和大数据的技术与应用,同时展示了大数据的商业建模应用实例。
-
8、叶信岳:Open Source Comparative Spatio-temporal Dynamics
叶信岳教授来自肯特州立大学。他主要研究时间、空间数据的发展以及大型社会数据的应用。在报告中,叶教授对空间不平等数据的分布及建模做了详细阐述,对空间数据的实际应用提出了自己的看法。
-
9、王汉生:网络结构数据与互联网征信
王汉生教授现任北京大学光华管理学院商务统计系系主任,北京大学商务智能研究中心主任。在报告中,王教授提出基于社交网络的网络结构数据可为实现快速准确征信提供支持,并通过实际案例生动详细的做出了分析和探讨。
-
10、分会场:
本次会议共设有十个分会场,共有60场报告,规模亦属历届之最。演讲者既有来自学界的研究员、学生,也有来自企业界数据分析实战经验丰富的各行各业人士。主题包括大数据、互联网金融、量化投资、生物信息等多个前沿热门领域。十个分会场具体如下:
-
百度大数据专场
-
人网物联
-
量化投资
-
天文、气象、地理&可视化
-
推荐系统&计算广告
-
生物信息&制药
-
商务数据分析
-
自然语言处理
-
软件工具Julia&Python&R
-
互联网金融&统计理论
三、资源下载
可下载的幻灯片链接:http://pan.baidu.com/s/1jG1Tpki
四、感想
一年一聚首,一年一别离。今年已是中国R语言会议举办的第八个年头。回顾2008年在北京召开第一次R语言会议时,大多数演讲者甚至没有登台演讲的经验。他们靠着一腔热血,举办了一场在当时被认为是“自娱自乐”的活动。时至今日,R语言会议规模之大、嘉宾质量之高令人叹为观止。这不仅是统计之都核心成员与学界、业界热心人士共同努力的成果,也对统计之都自身提出了更高的要求。回首过去,我们成绩斐然;展望未来,肩上的责任更大,面临的挑战也更大。
从去年夏天在北大光华新楼108召开第一次筹备会起,本次R语言会议的准备经历了近一年的风风雨雨。由衷感谢王汉生教授、龚晓燕老师对会议的鼎力支持,以及来自北京大学、中国人民大学、统计之都的各位志愿者。正是他们的兢兢业业、任劳任怨,让数据科学行业的列位同仁有机会共襄盛举,欢聚一堂,共同促进知识的传播和行业的发展。
可敬可爱的工作人员有:
会议主席:朱雪宁
副主席:蔡占锐
秘书长:冯璟烁
秘书团:张心雨,吴佳萍,高腾,陈源韬,解环宇,闫晗
志愿者:刘辰昂,王菲菲,郇钰,任万凤,李铮,张澍一,王小宁,陈梓衡,王可,钟琰,王海淘,王高斌,孙旻宜,唐宽昊,田庆隆,陈哲,白路平,颜淑莹,李向杰,王蕾,吴燕燕,王健桥,丁维悦,周子清,杨子涵,蔡艺杉,周震宇,梅园,赵凡,肖瑶,敬冯时,朱梓睿,项海波,孙佩瑾,冯哲逍,吕翔,邱怡轩,魏太云,冯凌秉,苏建冲,高涛,项海波,孙珮瑾,肖楠等。
R语言会议官方网站:http://china-r.org
五、会议花絮
会议第一天午餐时间,嘉宾与志愿者在光华新楼酒店用餐时偶遇在北大学习的“四爷”吴奇隆。一时微信朋友圈中盛传”四爷“参加R会,主办方特此澄清,只是偶遇合影。
发表/查看评论