机器学习和数据挖掘 (豆瓣)

分类器性能评价：图形方法(2)

阿道克 2014-04-29 22:28:06

3.提升度和提升曲线分类器分类为正例的比例称为深度（depth）：（TP+FP）/T，T是全部待判样本数量。提升度（lift）等于TPR/depth 以深度为横轴，以提升度为纵轴绘制曲线，得到提升曲线。绘制提升曲线的思路和ROC类似。当阈值为0的时候，所有的样本都会判为正例，此时深度为1，提升为1；随阈值增大，深度减小，提升随之......

展开

分类器性能评价：图形方法(1)

阿道克 2014-04-28 23:58:44

分类器性能评价：图形方法(1) 1.几个基本概念对于二元分类器,我们可以把分类样本的真实值记为1（positive,正例/阳性），-1（或0，negative,负例/阴性）分类结果记作1（success）和-1(或0,failure)。分类器分类正确，为真（true）；分类器分类错误为假（false）那么分类结果会有四种可能： TP，真正例/真阳性，预测为1且......

展开

recommenderlab:构建基于R的推荐系统(2)

阿道克 2014-04-15 21:04:37

recommenderlab:构建基于R的推荐系统(2) 3.评价推荐系统的表现 recommenderlab 包提供了函数 evaluationScheme()建立评价方案，能够使用简单划分、k折交叉验证、自助法进行模型的评价。下面采用简单划分的方法（split），即将数据集简单分为训练集和测试集，在训练集训练模型，然后在测试集上评价。 evaluationScheme（）......

展开

recommenderlab:构建基于R的推荐系统（1） 1.推荐系统和recommenderlab包 recommenderlab包提供了一个可以用评分数据和0-1数据来发展和测试推荐算法的框架。它提供了几种基础算法，并可利用注册机制允许用户使用自己的算法 recommender包的数据类型采用S4类构造，使用抽象的raringMatrix为评分数据提供接口。raringMatrix...... (1回应)

展开

recommenderlab:构建基于R的推荐系统(1)

阿道克 2014-04-13 21:16:04

recommenderlab:构建基于R的推荐系统(1) 1.推荐系统和recommenderlab包 recommenderlab包提供了一个可以用评分数据和0-1数据来发展和测试推荐算法的框架。它提供了几种基础算法，并可利用注册机制允许用户使用自己的算法。recommender包的数据类型采用S4类构造，使用抽象的raringMatrix为评分数据提供接口。raringMatrix......

展开

浅谈ICA（1）

阿道克 2014-03-14 20:16:05

独立成分分析ICA（Independent components analysis），是一个线性变换。这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。独立成分分析可以看做盲信号分离（Blind source separation）的一种特例。ICA方法最早由Comon在1994年提出，并在之后的数年间得到很大的扩展。目前ICA被应用在语音信号分离、生物医学......

展开

线性回归建模–变量选择和正则化（2）：R包glmnet

阿道克 2013-07-18 23:02:36

4.glmnet包案例这个数据集prostate在ESL的主页有下载 library(glmnet) ## Warning: package 'glmnet' was built under R version 3.0.1 ## Loading required package: Matrix ## Loading required package: lattice ## Loaded glmnet 1.9-3 prostate <- read.csv("E:/RB/prostate.csv") head(prostate) ## ...... (11回应)

展开

线性回归建模–变量选择和正则化（1）：R包glmnet

阿道克 2013-07-15 21:41:04

#本文的目的在于介绍回归建模时变量选择和正则化所用的R包，如glmnet,ridge,lars等。算法的细节尽量给文献，这个坑太大，hold不住啊。 1.变量选择问题：从普通线性回归到lasso 使用最小二乘法拟合的普通线性回归是数据建模的基本方法。其建模要点在于误差项一般要求独立同分布（常假定为正态）零均值。t检验用来检验拟合...... (5回应)

展开

混合模型，潜变量和EM算法（mixture model,latent variable and EM algo...

阿道克 2013-04-13 16:27:38

#混合模型主题的系列笔记 #这一篇断续写了很长时间，细节还是很不让人满意 5．混合模型：基于模型的聚类及R包mclust 在介绍混合模型及其参数估计的EM算法之后，下面讨论混合模型的应用。混合模型的主要应用之一是基于模型的聚类。在有限混合模型中，每一个成分对应一个类。这样关于合适的聚类方法以及聚类数目的问题转化...... (2回应)

展开

混合模型，潜变量和EM算法（mixture model,latent variable and EM algo...

阿道克 2013-04-03 23:55:13

4.有限混合模型的参数估计:EM算法 #warning：本文全是公式，慎入 #文中细节2错了，更正在文末注： EM算法对初值敏感，宜选择不同初值尝试。 EM算法不保证得到全局最优解。（4）EM算法：应用于有限混合模型 #这个内容很多书里都有，就不抄书了。更正细节2： (1回应)