首页
关于
论坛
投稿
搜索
统计模型
2022-05-17
1 / 5
统计模型
从贝叶斯视角看多层模型
张沥今
/
2019-10-24
多层模型常被用于处理嵌套数据(即,具有层次结构的数据),如,从不同的学校中抽取学生样本(第一层为学生,第二层为学校,学生样本嵌套于学校中),或从不同社区中抽取居民样本等。追踪数据也可被视为多层数据中的一种,其中第一层为不同的测量时间点,第二层为个体。为阐述多层模型的原理,以一个仅包含一个变量的两层模型为例,模型对应公式如下: $$ Level 1: y_{ij} = \theta_j +……
统计模型
倒数的诚信与消失的变量
邱怡轩
/
2019-06-25
今天朋友之间分享了一篇发表在《科学》杂志上的论文,《Civic honesty around the globe》,意即全球各地的公民诚信度。这篇论文的作者在全世界的40个国家做了一个大型的社会实验,即在不同的场所放置事先准备好的钱包,钱包中留有“主人”的联系方式,然后通过观察是否有人联系失主来推断公民的诚信程度。 这篇论文之所以受到关注,是因为大家发现文章里中国的公民诚信值位列倒数第一,于是大家……
机器学习
为什么统计学家也应该学学 TensorFlow
邱怡轩
/
2017-08-22
(先啰嗦一句:本文的标题和内容牵涉到 TensorFlow,只是因为它是可用的工具之一,我相信很多其他的框架都可以做到文中我想要实现的功能。我自己并没有工具上的偏好,所以就当是拿 TensorFlow 举一个例子。) 对于学统计做统计的人来说,这可能是最好的时代,也可能是最坏的时代。好的地方我就不多说了,基本上关键词包括“大数据”、“数据科学”等,搜索引擎可以帮你列举出许多激动人心的字眼。为什么会……
统计模型
假新闻引发的愤怒——非算法视角对自我学习的搜索排序算法和选择偏差的一些解读
陈丽云
/
2017-01-16
本文作者陈丽云,落园园主。 声明:本文与作者工作单位及工作内容无关,完全出于个人兴趣爱好。 最近有条很火的新闻。美国大选刚刚落下帷幕,却余波不断。其中一条新闻就是,Google被指责利用搜索结果(假新闻)左右民意。可是事情到底是怎么回事呢? […] SAN, FRANCISCO/WASHINGTON – Google’s search engine is highlighting……
统计模型
[译]量化投资教程:投资组合优化与R实践(上)
朱俊辉
/
2016-12-30
译者简介: Harry Zhu, R语言爱好者, FinanceR 专栏作者 […] 最近,在研究投资组合优化的问题,主要针对的是股票持仓的组合优化,会在这个分析过程中发现一些有意思的现象,并一步一步优化、检验相应的风控模型。本文将有四个部分分别阐述具体步骤。 […] 请注意,本文并非投资建议。本文数据是基于之前观察到的收益来模拟得来,和历史上的数据并非完全一致。本文提……
推荐文章
为什么我不是R方的粉丝
John Myles White
/
2016-09-01
本文翻译自 John Myles White 的博客 Why I’m Not a Fan of R-Squared。翻译工作已经获得作者授权同意。 […] 人们通常喜欢用 $R^2$ 作为评判模型拟合好坏的标准。与 MSE 和 MAD 不同,$R^2$ 不只是模型误差的函数,它的定义中还隐含了两个模型的比较:一个是当前被分析的模型,一个是所谓的常数模型,即只利用因变量均值进行预测的模……
统计模型
美国统计协会开始正式吐槽(错用)P值啦
邱怡轩
/
2016-03-08
(图片来源:[https://xkcd.com/1478](https://xkcd.com/1478),一幅讽刺滥用P值的漫画) 今天美国统计协会(ASA)正式发布了一条关于P值的声(吐)明(槽),算起来可以说是近期统计学界的一件大事了。为什么这么说呢?首先,P值的应用太广,所以对P值进行一些解释和声明非常有必要。其次,对P值的吐槽历来有之,但今天是第一次被一个大型的专业协会以非常正式的形式进行……
统计模型
模型选择的一些基本思想和方法
高涛
/
2015-08-31
有监督学习是日常使用最多的建模范式,它有许多更具体的名字,比如预测模型、回归模型、分类模型或者分类器。这些名字或来源统计,或来源于机器学习。关于统计学习与机器学习的区别已经有不少讨论,不少人认为机器学习侧重于目标预测,而统计学习侧重于机制理解和建模。个人更加直观的理解是,统计学习侧重于从概率分布来描述数据生成机制,除了预测之外,还关心结果(参数假设、误差分布假设)的检验,而机器学习侧重于从函数拟合……
统计软件
lfda R包的使用方法以及算法的简要说明
唐源
/
2015-08-25
局部Fisher判别分析(Local Fisher Discriminant Analysis)是许多度量学习(Metric Learning)方法中效果最好的其中一种,它是一种线性监督降维方法,它可以自动找到合适的距离转换矩阵(transformation matrix)来抓住数据的不同类(class)的特征,通过加大不同类之间的距离(between-class distance)以及缩小同类里……
机器学习
从统计学角度来看深度学习(1):递归广义线性模型
Shakir Mohamed
/
2015-05-17
原文链接:http://blog.shakirm.com/2015/01/a-statistical-view-of-deep-learning-i-recursive-glms/ 作者:Shakir Mohamed 本文得到了原英文作者Shakir Mohamed的授权同意,由王小宁翻译、冯凌秉和朱雪宁审校。感谢他们的支持和帮助。 深度学习及其应用已经成为实用机器学习的一个关键工具。神经网络和许……
统计模型
COS每周精选:再谈P值
尤晓斌 / 冷静 / 王威廉 / 数学文化
/
2015-02-09
本期投稿:尤晓斌 冷静 王威廉 数学文化 统计之都主站之前有一篇《不得不提的P值》曾引发众多的讨论,去年的《P值之死》也曾在圈内引起不小的骚动,编者罗列了一些新的资料供各位客官慢慢欣赏,孰是孰非,您来决断。 一篇 pvalue applet,作者Jim Berger有一系列关于pvalue的好文章,提醒人们慎用pvalue。跳出来想,对比CS对待数据科学的态度,统计人还是有些保守悲观的。学术需要保……
统计模型
COS每周精选:测度论学习那些事
尤晓斌
/
2014-12-28
本期投稿:尤晓斌 统计学博士应该学什么课程,作者倾向认为学测度论是“无害的”,但不是必要的。概率论与数理统计这个大学科有太多分支,一个统计人穷尽一生也很难涉猎全部。文后用了个简明扼要的比喻,你不可能因为奥尼尔(NBA球星)不会罚球就就不把他当个篮球明星。文末大神们的评论很值得阅读。 测度论有利于抽象思维,这是一个剑走偏锋的论点,认为统计学者的“两大要务”是抽象与推广,即把现有的统计方法抽象为理论,……
««
«
1
2
3
4
5
»
»»