大数据时代为社会带来了一场新的变革,庞大的数据资源使得各个领域开始了量化进程,对数据的有效分析、提取价值的需求更加急迫。论坛以数据分析为立足点,着眼于大数据时代下如何发现数据中的有效信息,从而实现数据的价值。我们相信,数据背景下的理论与应用问题会愈发受到学界和业界的关注,同时也将倡导企业和科研单位的有机融合以及数据的有效分析挖掘会为社会创造更多的价值!
R是一门用于数据分析和图形展示的语言、平台和环境,其官方机构每年都会举办useR!会议,各个国家及地区也定期有R用户的交流活动。在国内,自2008年以来,中国已经在北京和上海等地成功举办了七届R语言会议,促进了R语言乃至数据科学在中国的推广和发展。
为了完美的实现从数据到价值的转化,促进各领域R语言的使用者之间的交流,西安欧亚学院、统计之都、北京大学商务智能研究中心将于2015年4月18日在古城西安举办2015数据与价值欧亚论坛暨R会议西安分论坛。这将是R会议首次在西北地区举办。
会议的相关情况如下:
一、会议时间
2015年4月18日,上午9:00-12:00,下午14:00-18:00
二、会议地点
西安欧亚学院大学生活动中心多功能厅
三、会议情况
2013年以来,北京、上海等分会场会议规模都在400人以上,有来自近百家单位的人员参会,涵盖北京大学、清华大学、中国人民大学、中科院等各高校、研究所,以及百度、淘宝、优酷等公司,会议现场气氛热烈,会后各界反映良好。
近年来,随着西北地区数据科学领域的发展,R语言在电商、互联网、金融、医疗、生物医学等领域有着广泛的应用前景。来自各行各业的R用户亟需一个平台交流技术,碰撞思想。本次西安会议正是适应这种需求而举办。
本届会议希望在往届会议取得的成果的基础上进一步扩大数据科学及R语言的影响力,让更多的数据人参与其中,促进社区内部的交流和进步,欢迎大家踊跃报名参加!
四、会议内容
本次论坛将邀请不同领域的学术高人针对R语言及数据科学相关主题进行演讲,包括但不限于以下内容:
-
主题演讲1:
李舰:《数据科学中的R语言》作者,《R语言核心技术手册》译者,Rweibo、Rwordseg、tmcn等R包的作者。中国R语言会议上海会场主席,浙江大学软件学院客座教师。具有多年的基于R语言的行业中应用数据的经验,为多家世界五百强公司提供过专业的咨询服务。专注的领域包括新药和食品研发中的建模、网络舆情分析、R语言的企业级应用等。
演讲主题:R与机器学习
摘要:R语言是传统的统计计算环境,但由于其良好的扩展性以及灵活的语言机制,已经集成了大量丰富的分析工具,不再仅限于统计模型。机器学习正是最近最流行的分析方法之一,很多主流的算法都在R中得到了体现。本次报告将会比较统计方法与机器学习在思维方式上的差异,并通过例子介绍一些常用的机器学习算法及其应用场景。此外,还会介绍衡量机器学习预测效果的方式。
-
主题演讲2:
郭琳:陕西中海华晟信息技术有限公司,副总经理。西安交通大学管理学院MBA。曾就职于腾讯,后参与创办陕西中海华晟信息技术有限公司,长期致力于运营商大数据挖掘分析和基于运营商大数据分析的综合业务解决方案的研究。
演讲主题:移动运营商大数据挖掘与运用
摘要:本次演讲从移动运营商大数据的特点、体系架构等出发,阐述技术处理架构、常用的数据挖掘算法模型与案例、运营商大数据运营的未来与趋势等。
-
主题演讲3:
周扬:J.D.POWER 数据分析师。统计之都核心成员,致力于推进数据行业在国内的发展。生物信息硕士,毕业于四川大学、军事医学科学院,拥有互联网、汽车、制药、农业等领域工作背景,熟悉R, HTML5/CSS3, Python, Javasript 工程开发。 recharts(提供Echarts在R下接口)和html5Vis(利用d3js实现的可重用图形库)作者。拥有一项国家发明专利和四项软件著作权。曾在国际著名期Bioinformatics(生物信息学)上发表论文两篇,在Nuclear Acid Research(核酸研究)上发表论文一篇。
演讲主题:htmlwidget:一种让javascript可视化图形融入R的新型武器。
摘要:R的图形展示功能已经获得学术界和工业界的广泛认可,在对图形的诸多划分中,用户交互性成为一个非常重要的标准,而在可交互图形的实现机制上,基于浏览器作为图形展示平台,利用javascript作为图形绘制和交互基础的机制成为主流方向。htmlwidget作为RStudio的最新发布的R包,致力于将优秀的基于javascript可视化包,结合R语言语法和R用户的习惯,形成R层面的代码封装,提供了ECharts、leaflet、D3JS、flowchart、dygraphs等优秀数据展示包的R接口。
-
主题演讲4:
杨环:现就职于Mango Solutions (China),担任咨询顾问。
演讲主题:BLCOP包——融主观于客观的资产配置利器
摘要:金融行业资产配置中的Black-Litterman模型自上个世纪90年代诞生于高盛以来,被广泛使用并不断发展,产生了使用场景更广泛的Copula Opinion Pooling等框架。它们将投资者对资产收益的主观意见融于市场均衡收益,通过贝叶斯方法得到修正后的资产组合权重配置。作为维护者,报告人将介绍实现这两种方法的R包-BLCOP,并演示BLCOP如何汇入资产最优化配置的工作流中。
-
主题演讲5:
徐文昕:任职于西南大学数学与统计学院,讲师,经济计量方向。
演讲主题:某网站潜在客户浏览行为探究
摘要:通过对某网站访问数据的分析,试图理解潜在客户的需求,并对网站的业务构成提出一些建议。
-
主题演讲6:
冯凌秉:澳大利亚国立大学统计学博士,任职于江西财经大学金融管理国际研究院,硕士研究生导师。
演讲主题:cutoffR——时空型数据缺失值插补新方法
摘要:CUTOFF是一种用于时空型数据缺失值插补的新方法,它有效的整合了已有关于时空型数据缺失值插补方法,并提供了诸多扩展,用于适应不同的数据生成过程。CUTOFF具有插补精度高,运算速度快的优点。cutoffR是该方法在R中的实现。本演讲将简述CUTOFF算法,并详细介绍cutoffR包的使用方法。
-
主题演讲7:
邹韬:北京大学光华管理学院商务统计与经济计量系、统计科学中心博士。曾在加拿大蒙特利尔麦吉尔大学交换学习,以访问学者身份在美国爱荷华州立大学访问。研究方向为金融计量学和金融统计学,已向国际顶级期刊投稿论文3篇,现在进行的工作论文3篇。
演讲主题:协方差回归分析
摘要:本文提出p维响应变量的协方差回归分析方法。该方法可以用于探索协方差和协变量的关系,在金融管理、空间统计、社交网络领域都有广泛的应用。笔者首先提出协方差回归模型的三种估计方法(极大似然估计、最小二乘估计和广义最小二乘估计),再利用本文提出的模型对中国沪深两市A股市场2007-2011年的收益率数据进行分析,结果发现公司基本面变量对不同股票的同动性会产生影响。除此之外,笔者还通过该方法构造Markowitz投资组合,使用Alpha、Sharpe比等标准评估投资组合的收益情况。最后,笔者通过统计理论和仿真模拟说明了三种估计方法良好的性质,并给出了相应的正定化算法。
-
主题演讲8:
赵琬迪:北京大学光华管理学院博士。主要研究方向为金融市场微观结构,金融计量学,金融时间序列分析;现阶段的研究重点为完善已有金融市场流动性的度量方法的统计性质,对已有的流动性度量方法进行改进,提高估计效果等。
演讲主题:流动性LOT度量的统计性质
摘要:交易成本是衡量金融资产流动性的一个重要指标。Lesmond、Ogden和Trzcinka (Review of Financial Studies, Vol.12, p1113-1141, 1999)基于Tobit模型给出了一种后来被广泛引用的交易成本的计量方法,即所谓的LOT度量。本文是对LOT估计的统计性质进行的理论研究。具体结果包括:1)通过数值模拟论证原始的LOT度量,即LOT Mixed度量运用了错误的数据划分方式,而Goyenko、Holden和Trzcinka(Journal of Financial Economics, 92(2), p153-181, 2009)提出的LOT Y-split度量才是正确的对交易成本的估计;2)从理论上给出了LOT Y-split估计的一致性及渐近正态性;3)通过数值模拟对基于单因子和基于多因子的Tobit模型得到的LO Y-split估计的精度进行了对比,研究了随着误差项的标准差等因素的变化估计精度的变化规律;4)通过实证分析考察并比较了不同模型下给出的LOT度量的置信区间。
-
主题演讲9:
王菲菲:北京大学光华管理学院商务统计与经济计量系博士。感兴趣的研究领域有:文本挖掘,贝叶斯分析等。目前的研究课题集中在文本挖掘领域,尤其是基于主题模型的相关扩展及应用。正在进行的研究有:基于主题模型从影评中探索影响电影票房收入的新因素,基于贝叶斯层次主题模型进行文档分类,面向新闻跟帖的短文本建模等。
演讲主题:影评中的潜在主题——影响电影票房的新因素
摘要:在电影行业中探究对电影票房的影响因素是很重要的。在影响电影票房的众多因素中,电影评论作为电影口碑的重要来源,能够影响人们对于电影的选择,从而显著的影响票房收入。以往对电影评论的研究多从两个维度来进行:评论总数和情感倾向,但它们只是笼统的对影评进行描述,并没有深入到影评的内容中去。其实影评的内容所包含的信息远比这几个变量要丰富。因此,本文从文本挖掘的角度出发,选用主题模型来挖掘这些评论的隐含主题信息。我们发现从影评中得到的主题都有很好的解释性。此外,我们为大众影评和专业影评各定义了一个熵变量,用于衡量每部电影的两种不同形式的影评在各个主题上分布的离散程度。结果表明,这两个熵变量能显著影响每天的票房收入,并且影响方式不同:更为多样化的大众影评能显著提高票房收入,而角度相对集中的专业影评则能对票房提升起到积极作用。当扩大电影票房预测的时间间隔或者变化熵变量的计算方式时,结论依然成立。
五、会议费用
会议免费,食宿自理。
六、报名方式
请点击http://r-xian8.eventdove.com/进行报名,下载打印入场券,持券进场。
七、联系方式
联系电话:029-88298798 029-88286972 029-88297572
八、会场服务
-
餐饮
会场工作人员和志愿者将会引导大家签到和入场。午餐地点有以下信息可供与会人员参考:
位于新教学楼D栋一层的i coffee金融店和图书馆一楼的i coffee图书馆店提供各种套餐,但是座位比较有限。
欧亚学院西门商业街有各地美食,可使用现金。
金桥餐厅的二楼零点餐厅有各种炒菜,可使用现金。
-
路线
西安火车站:
- 706路(欧亚学院西门站)。
- 5路(到紫薇城市花园站),换乘706路(到欧亚学院西门站)。
- 30路(到世家新城站),换乘162路(到欧亚学院东门站)。
西安火车北站:
- 地铁2号线(韦曲南方向),在会展中心站下车(A2口出),转乘162路(到欧亚学院东门站)。
机场:
- 机场大巴(美伦酒店),步行至粉巷,706路(到欧亚学院西门站)。
- 机场大巴(小寨),换乘地铁2号线(韦曲南方向),在会展中心站下车(A2口出),转乘162路(到欧亚学院东门站)。
- 机场大巴(唐城宾馆),706路(到欧亚学院西门站)。
扫描下方二维码,即可获得更多关于R会议(西安会场)的更多资讯。
主办方:
- 西安欧亚学院
- 统计之都
- 北京大学商务智能研究中心
(本文编辑:张心雨)
发表/查看评论