rcdk, 是在R下面集成了CDK工具包,以此來通過CDK生成的化學(xué)性質(zhì)數(shù)據(jù)進(jìn)行更深層次的統(tǒng)計(jì)分析,下面來看看在rcdk中如何進(jìn)行多個(gè)化合物結(jié)構(gòu)的聚類。
首先需要在R下面安裝rcdk程序包,然后就可以進(jìn)入命令行,進(jìn)行如下操作:
>library("rcdk") //加載包
>mols <- load.molecules("mymols.sdf") //讀取sdf文件
> fps <- lapply(mols, get.fingerprint, type="extended") //生產(chǎn)fingerprint值
> fp.sim <- fp.sim.matrix(fps, method="tanimoto") //建立矩陣
> fp.dist <- 1-fp.sim
> clustering <- hclust(as.dist(fp.dist))
> plot(clustering)
執(zhí)行到這里,我們就得到了結(jié)果,如下圖:

這里我選擇的是50個(gè)化合物結(jié)構(gòu)進(jìn)行處理。是不是很方便~:)
posted on 2011-04-11 21:41
周銳 閱讀(941)
評(píng)論(0) 編輯 收藏 所屬分類:
Chemistry 、
CDK 、
R