上证50的“社交网络”
本文使用glasso方法探索上证50指数成份股之间的相互联系。
glasso(graphical lasso)是lasso方法的一种扩展,采用加罚的极大似然方法估计变量间协方差矩阵的逆矩阵(这个逆矩阵在图模型中被称为Concentration Matrix或者Precision Matrix),加以适当整理之后,可以得到变量间的稀疏化的偏相关系数矩阵,其中的零元素表示了变量间的条件独立关系。我们可以利用其中的非零元素生成图模型。
本文采用的2014年6月3日公布的上证50指数成分股在2012年1月4日至2014年10月31日之间的日对数收益率数据进行计算(去掉了在此期间交易天数过少的5只股票:白云山、康美药业、百视通、东方明珠、方正证券)。
glasso的计算利用R包glasso,罚参数rho取0.3;图模型的建立和绘图利用R包igraph。
首先看一下上证指数和上证50成分股之间的关系:
其中1-45号是按股票代码排列的上证50成份股(去掉了上面所列的5个),46号是上证指数。50成份股和上证指数之间都存在一定的相关关系,这个结果并不意外。
下面去掉上证指数,探索一下50成份股之间的结构。使用igraph包的walktrap.community()函数进行的子群的搜索,得到下面的结果:
在这里,我们可以发现板块效应的存在:最左边是曾红极一时的大消费:复兴医药(15),贵州茅台(19),伊利股份(24);最右边的一群是银行板块;银行板块的左边是一堆券商和保险,两桶油(中国石化(6),中国石油(44))蹲在这一群的角落里;最外边孤零零的一个是山东黄金(20)。
因为所用的样本的局限,现在这两张图还是一个试验品,看看就好,不需要过度解读。
参考:
Friedman, J. H., Hastie T, Tibshirani R. “Sparse inverse covariance estimation with the graphical lasso.” Biostat (2008) 9 (3): 432-441.
glasso(graphical lasso)是lasso方法的一种扩展,采用加罚的极大似然方法估计变量间协方差矩阵的逆矩阵(这个逆矩阵在图模型中被称为Concentration Matrix或者Precision Matrix),加以适当整理之后,可以得到变量间的稀疏化的偏相关系数矩阵,其中的零元素表示了变量间的条件独立关系。我们可以利用其中的非零元素生成图模型。
本文采用的2014年6月3日公布的上证50指数成分股在2012年1月4日至2014年10月31日之间的日对数收益率数据进行计算(去掉了在此期间交易天数过少的5只股票:白云山、康美药业、百视通、东方明珠、方正证券)。
glasso的计算利用R包glasso,罚参数rho取0.3;图模型的建立和绘图利用R包igraph。
首先看一下上证指数和上证50成分股之间的关系:
其中1-45号是按股票代码排列的上证50成份股(去掉了上面所列的5个),46号是上证指数。50成份股和上证指数之间都存在一定的相关关系,这个结果并不意外。
下面去掉上证指数,探索一下50成份股之间的结构。使用igraph包的walktrap.community()函数进行的子群的搜索,得到下面的结果:
在这里,我们可以发现板块效应的存在:最左边是曾红极一时的大消费:复兴医药(15),贵州茅台(19),伊利股份(24);最右边的一群是银行板块;银行板块的左边是一堆券商和保险,两桶油(中国石化(6),中国石油(44))蹲在这一群的角落里;最外边孤零零的一个是山东黄金(20)。
因为所用的样本的局限,现在这两张图还是一个试验品,看看就好,不需要过度解读。
参考:
Friedman, J. H., Hastie T, Tibshirani R. “Sparse inverse covariance estimation with the graphical lasso.” Biostat (2008) 9 (3): 432-441.
终于有新文章了!等了半年了!谢谢!
老师的大作,不知在哪里任教,果然是高人啊
谢谢船长,很有意思,求分享R代码。。。
是的 很喜欢 求代码
拜读
谢谢!
希望有代码或进一步的指导。
请问这个图模型是用什么代码画的?
@-布花间-cwq- igraph可以画
您好。冒昧问一下可以分享一下代码吗
> 我来回应