首页
关于
论坛
投稿
搜索
数据分析
2022-05-17
1 / 1
推荐文章
工业数据分析实战中的常见误区与对策
田春华
/
2021-09-02
近年来,数据驱动的转型升级在工业中取得了一些成绩,不仅被产业界广泛认可,也给企业带来了实实在在的效益。但工业大数据分析的发展也面临着许多挑战,在应用阶段有很多不如意的地方。本文从三个层面讨论工业数据分析实战中常见的7个误区和应对策略。 […] 脱离业务逻辑的数据分析往往很难有实际的效果。在利用统计学习算法的强大归纳能力之前,数据分析师可以剖析一下实现的业务逻辑,掌握主要矛盾,降低对预……
推荐文章
统计学上的创造力
Terence Speed
/
2019-08-11
本文翻译自 Terence Speed 发表在 IMS 主席专栏上的文章 Creativity in Statistics。本文已获得原作者授权。 […] 你可能听说过那句老话 : 有的人虽然在做数据分析,但却好像是醉汉抱着路灯一样,是来支撑平衡防止摔倒而不是为了照明。对于其他非统计学家和非应用统计学家而言,他们又是如何知道我们到底是在用数据来“照明”,而不是“支撑”自己呢?或者甚至……
统计软件
Python的七种武器
肖凯
/
2016-10-06
君子生非异也,善假于物也。 “物”能够延展英雄的能力。它是吕布的赤兔马,杨过的玄铁重剑,CS中的沙漠之鹰,曹操传中的凤凰羽衣。“物”也可用以治愈英雄,例如张无忌的黑玉断续膏,李逍遥的天香续命露,还有深夜里TVB的一碗面。 对于不同的位面,有着不同的宝物定义。对古时文人来讲,笔墨纸砚,是当时具有生产力输出的四大工具。对程序员来讲,当代的“文房四宝”不外乎是:笔记本,大屏幕,机械键盘,人体工学……
统计应用
数据告诉你:高信誉的卖家应该收高价,还是收低价?
刘跃文
/
2016-05-31
看到这个题目,各位看官不妨想一想,淘宝上的信誉高的卖家会收高价,还是会收低价呢?根据我多年的教学经验,这里有四种可能的答案:(A)收高价、(B)收低价、(C)不好说、(D)不知道。您选哪一种?为什么? 且听我慢慢道来。 […] 从2000年开始,以eBay为代表的电子商务发展势头迅猛,养活了一大票科研人员。eBay以网上拍卖为主要的营业方式,因此,当时科研人员的一个主要的研究题目,就……
推荐文章
[朝花夕拾] 迎接信息时代的统计挑战
施涛
/
2014-05-14
本文略有修改,原文请点击此处 本文作者为俄亥俄州立大学的施涛。他把自己读郁彬老师的综述性文章:Embracing Statistical Challenges in the Information Technology Age的读后感和大家分享。 世事变迁,最近居然忽然有时间坐下来读些东西,重新审视一下这几年统计领域的发展了。粗略回想了一下,惭愧地发现我好像连博士导师的文章也没有系统地读过几篇,只……
R会议
第六届中国R语言会议(上海)纪要
李舰
/
2013-11-09
第六届中国 R 语言会议(上海会场)于 2013 年 11 月 2 日 ~ 3 日在华东师范大学中山北路校区的科学会堂成功召开。会议由华东师范大学金融与统计学院和统计之都(cos.name)主办。在两天的会议时间里,参会者齐聚一堂,就 R 语言在电商、互联网、金融、可视化、机器学习、数据挖掘等行业和领域展开了深入的探讨。 […] 本次会议报名非常火爆,受会场容量所限,开放报名的时间非……
统计应用
航海家1号离开太阳系了吗?
施涛
/
2013-09-03
航海家1号(Voyager 1)作为一艘无人太空探测船于1977年9月5日从佛罗里达洲的卡纳维尔角发射升空,先后位临木星,土星,正在向星际间的太空进发。 航海家1号 而且它还携带了一张航海家金唱片,其中包含了115张图片和世界上的各种自然声音及音乐。 (http://zh.wikipedia.org/wiki/旅行者金唱片) 从2003年起,大家就都在等航海家1号飞离太阳系的那一天,有兴趣的人也可……
统计模型
希格斯玻色子与5σ
施涛
/
2012-07-10
本文转自施涛博客,原文链接请点击此处。 […] 2012年7月4日,欧洲核子研究组织(CERN, the European Organization for Nuclear Research)的物理学家们宣布发现在欧洲大型强子对撞机中一种疑似希格斯玻色子(Higgs Boson)。 […] [抄自wikipedia]:希格斯玻色子是粒子物理學的标准模型所预言的一种基本粒……
机器学习
COS竞赛:英文站点会员类型的识别
谢益辉
/
2009-03-17
大家好,为了促进大家对统计之都的了解,并锻炼各位会员的统计应用能力,即日起我们推出“COS竞赛”系列活动。第一期活动的主要任务是分析统计之都英文网站(https://cos.name/en/)的会员数据,从中找出识别正规会员和机器人(垃圾、广告、自动注册)会员的规律。 […] 原始数据来自phpBB论坛的phpbb_users数据库,其中包含用户id、用户名、是否激活、Email、发……