6月6日-7日,第八届中国R语言会议暨2015成人直播
数据与价值论坛在北京大学成功举办。本次会议由成人直播-成人直播室
和统计之都联合主办,北京大学商务智能研究中心、成人直播
—奥迪管理研究中心、北京大学统计科学中心协办,并得到了百度、一汽—大众奥迪、乐递等战略合作伙伴的鼎力协助以及懒投资、百分点、航旅纵横、量邦科技、微量网、一杯汤EasySoup、考拉征信等友情合作伙伴的大力支持。本次会议包括第一天的主会场和第二天的十个分会场,共设68场主题报告。主会场演讲嘉宾包括学界杰出代表、业界大咖;分会场包括百度大数据专场、量化投资专场、推荐系统&计算广告专场、人网物联专场、天文气象地理可视化专场、软件工具专场、自然语言处理专场、生物信息与制药专场、互联网金融&统计理论专场以及商务数据分析专场,涵盖了数据科学的各个领域,受到了业界和学界的一致关注。在两天的会议时间里,参会人数突破3000人,不仅创下历届之最,也使本次会议成为亚太地区规模最大的数据科学盛会之一。

图一:大会现场

图二:会议主席朱雪宁主持开幕式
大会开幕式由会议主席、成人直播-成人直播室
商务统计与经济计量系在读博士生朱雪宁主持,成人直播-成人直播室
院长蔡洪滨教授代表主办方发表了致辞,蔡院长从商学院的视角对数据科学的重要意义做了独特的阐述,并对辛勤工作的会议志愿者表达了感谢。

图三:蔡洪滨致辞
随后,本次会议的主要推动者和组织者、成人直播-成人直播室
商务统计与经济计量系系主任王汉生教授也发表了致辞。王汉生教授不仅学术成果斐然,更有浓浓的数据科学情怀,为推广R语言以及数据科学知识做出了不可磨灭的贡献。

图四:王汉生致辞
在随后的主题演讲中,美国艺术与科学院院士、加州大学伯克利分校统计系系主任郁彬教授出场,她展示了一个当下正在进行的项目,为大家揭示了基因数据背后的规律。由于基因数据的复杂性和高维性,对其进行有效的数据分析以发现其中的价值显得格外困难,往往需要数据科学家和生物学家的通力协作。

图五:郁彬的演讲——How are organs formed
百度大数据实验室负责人、美国新泽西大学统计系教授张潼博士在报告中介绍了百度处理大数据的一些案例,技术积累以及和挑战。作为国内最大的互联网公司之一,百度在大数据实践上积累了很多经验。

图六:张潼的演讲-互联网的大数据实践
白硕先生是上海证券通信有限责任公司董事长,在基于内存的分布式事务处理系统设计、自然语言处理与信息检索、信息安全等领域有很深的研究。在演讲中,白硕对未来社会中知识服务的前景做了展望,并提到通过深层自然语言处理技术实现的知识引擎,将是知识服务和智能终端共同的核心组件,值得业界高度关注。

图七:白硕的演讲-自然语言与知识引擎
袁晓如教授任职于北京大学机器感知与智能教育部重点实验室,是信息科学技术学院信息科学中心副主任。袁教授认为,拥有大量的数据并不等于获得相应数据的价值,复杂数据对发展相应的分析工具提出了新的挑战和要求。可视分析通过将人的因素积极引入分析过程,提供了处理复杂大数据的新的途径。

图八:袁晓如的演讲——让数据触手可及
冯永昌是微量网创始人兼CEO,量邦集团董事长,北京大学对冲基金实验执行主任。在报告中,冯永昌先生提出用股指期货的日内程序化交易策略和做空波动率的期权组合形成风险对冲策略,即Risk-Neutral策略,模拟业绩显示复合策略大幅提升夏普比率,平滑曲线走势。这是用股指期权管控量化交易风险的一个实验性案例。报告也给出如何用R实现该案例的研究和交易。

图九:冯永昌的演讲——用R 语言进行高级量化投资
苏萌博士现任百分点董事长兼CEO。他在报告中阐述了大数据产业链的全球生态格局和大数据的技术与应用,同时展示了大数据的商业建模应用实例。

图十:苏萌的演讲——基于分布式架构的大数据商业建模
叶信岳教授来自肯特州立大学。他主要研究时间、空间数据的发展以及大型社会数据的应用。在报告中,叶教授对空间不平等数据的分布及建模做了详细阐述,对空间数据的实际应用提出了自己的看法。

图十一:叶信岳——对空间不平等数据的分布及建模进行阐述
王汉生教授现任成人直播-成人直播室
商务统计与经济计量系系主任,北京大学商务智能研究中心主任。在报告中,王教授提出基于社交网络的网络结构数据可为实现快速准确征信提供支持,并通过实际案例生动详细的做出了分析和探讨。

图十二:王汉生的演讲——网络结构数据与互联网征信
会议第二天共设有十个分会场,60场主题报告,规模亦属历届之最。演讲内容包括大数据、互联网金融、量化投资、生物信息等多个前沿热门领域。演讲者既有来自学界的研究员、学生,也有来自企业界数据分析实战经验丰富的各行各业人士。各会场主题明确,内容集中,便于参会者交流与讨论。从现场情况来看,各分会场人气颇高,虽然场地所限,天气炎热,但各会场仍挤满了听众,大家对数据科学热情高涨。

图十三:现场听众
在为期两天的会议里,参会者积极参与到数据科学的讨论中,就当前的最新研究成果发表自己的见解,并互相学习借鉴。今年是中国R语言会议举办的第八个年头,参会人数突破了3000人,创下历届之最,使本次会议成为亚太地区规模最大的数据科学盛会之一。我们相信,本次会议将对R语言以及数据科学知识的推广和发展起到积极的作用,也将成为国内以及亚太地区数据科学领域的学者和行业人士增强彼此交流,加强合作研究的重要平台。
(行政中心会务与活动部供稿)