首页
关于
论坛
投稿
搜索
python
2022-05-17
1 / 1
R语言
data.table 与 pandas
谢士晨
/
2021-01-19
数据分析项目通常可以分解为以下过程,数据加载-数据清洗-(特征处理、可视化、模型训练)-成果汇报1。其中,数据清洗与特征处理或者称为数据预处理过程,一般会占据整个项目的大部分时间。熟练掌握相关工具,提高数据处理的效率,是开展数据分析工作的基础。 在开展数据科学相关工作时,最常用的开源工具包括 R 与 python。对于可在内存级处理的数据,在 R 中通常使用 data.table 包进行数据处理,……
统计软件
gcForest算法原理及Python与R实现
徐静
/
2018-10-12
从目前来看深度学习大多建立在多层的神经网络基础上,即一些参数化的多层可微的非线性模块,这样就可以通过后向传播去训练,Zhi-Hua Zhou和Ji Feng在Deep Forest [1,2]论文中基于不可微的模块建立深度模块,这就是gcForest。 传统的深度学习有一定的弊端: […] 但是有一点是我们相信的,在处理更复杂的学习问题时,算法的学习模块应该要变的更深(论文The……
统计软件
数据通灵术之爬虫技巧
杜亚磊
/
2017-08-20
俗话说"巧妇难为无米之炊"。如果你是一个数据忍者,却因为没有数据而烦恼,这卷"数据通灵术"或许是你需要的。首先你要看透术名那华丽的外衣,它的真面目是:爬虫技巧。 此卷通灵术包含了爬虫的基础入门术,动态加载破解术,登陆破解术,以及额外赠送的手机APP爬取篇。 […] 简单来说,爬虫就是从网上自动下载网页,经过解析处理得到你想到要的数据。 这里的步……
统计软件
Python的七种武器
肖凯
/
2016-10-06
君子生非异也,善假于物也。 “物”能够延展英雄的能力。它是吕布的赤兔马,杨过的玄铁重剑,CS中的沙漠之鹰,曹操传中的凤凰羽衣。“物”也可用以治愈英雄,例如张无忌的黑玉断续膏,李逍遥的天香续命露,还有深夜里TVB的一碗面。 对于不同的位面,有着不同的宝物定义。对古时文人来讲,笔墨纸砚,是当时具有生产力输出的四大工具。对程序员来讲,当代的“文房四宝”不外乎是:笔记本,大屏幕,机械键盘,人体工学……
COS访谈
COS访谈第18期:陈天奇
陈天奇 / 何通
/
2015-06-28
【COS编辑部按】受访者:陈天奇 采访者:何通 简介:陈天奇,华盛顿大学计算机系博士生,研究方向为大规模机器学习。他曾获得KDD CUP 2012 Track 1第一名,并开发了SVDFeature,XGBoost,cxxnet等著名机器学习工具,是Distributed (Deep) Machine Learning Common的发起人之一。 何:你的本科在上海交大的ACM班就读,是怎么开始做……