原文地址:http://blog.charliezhu.com/2008/06/16/%e5%9c%a8%e7%ba%bf%e5%8c%96%e5%ad%a6%e7%bb%93%e6%9e%84%e5%bc%8f%e5%9b%be%e7%89%87%e7%94%9f%e6%88%90%e6%9c%8d%e5%8a%a1/
感謝Charlie提供那么多好文章
利用一些網站提供的資源,可以在線生成結構式圖片。
DayLight
其中比較突出的是DayLight提供的服務,在另外一篇 結構式圖片生成服務, DayLight SMI2GIF 中做過詳細介紹。DayLight的服務傳入的結構式參數是SMILES,而且有很豐富的參數以調節輸出效果。
NIST
NIST是美國國家標準與技術局(National Institute of Standards and Technology),NIST WebBook 是老牌的免費化合物信息數據庫,提供豐富的化合物物理、化學性質數據。其化合物的編碼方式,其實是CAS號碼。把CAS號碼轉換成數字,就可以很容易得到結構式圖片的地址了。
http://webbook.nist.gov/cgi/cbook.cgi?Struct=C490119
NIST WebBook的數據量并不是很大,只有幾萬條記錄。不知道是不是因為太老的原因(05年就沒再更新過),其中還有錯誤數據。至少到這篇發布的時候,上面的例子仍就是一個錯誤結構。我寫Email報告了這個問題,不知道啥時候能修正。
NLM
NLM是(National Library of Medicine) 它提供的ChemIDPlus數據庫 也是用CAS號碼進行編碼的。數據量要比NIST大很多,結構式輸出的質量也更好。
http://chem.sis.nlm.nih.gov/chemidplus/RenderImage?maxscale=30&width=200&height=200&superlistid=000490119
Pubchem
對于化合物的標記,SMILES是公開的標準,直觀還原結構式信息,值得應用;CAS不公開不免費,但也成為了既成的行業標準。現在能與CAS相提并論的,我想就是NCBI的PubChem 數據庫了。NCBI是美國國立生物技術信息中心(The National Center for Biotechnology Information。在在線數據庫的范疇內來說,PubChem的Compound ID(cid)基本上是必被引用的。所以也勉強將它用cid作結構參數的圖片生成接口納入進來。這個接口背后也有很多參數用以調節輸出。
http://pubchem.ncbi.nlm.nih.gov/image/imagefly.cgi?cid=10273&width=400&height=400
有一篇很好的文章,Thirty-Two Free Chemstry Databases(32個免費化學數據庫) ,仔細讀過的話也許還會有更多的發現。
2008年12月15日更新
Hack PubChem的結構式編輯頁面,找到PubChem通過SMILES輸出結構式圖片的服務
http://pubchem.ncbi.nlm.nih.gov/edit/editsrv.fcgi?drawevent=paste&sessionid=122931177&smiles=c1(c(cncc1)C(O)=O)C(O)=O&speed=1&nopng=0&vid=&vhadd=0
ChemDB
ChemDB / Smi2Depict: Generate 2D Images from Molecule Files
http://c1ccccc1-2.ics.uci.edu:8081/arrow-webapp/ArrowWebService?action=smi2png&smiles=c1(c(cncc1)C(O)=O)C(O)=O&width=400&height=200&arrowdesc=&extraImageSetting=amap
eMolecules
http://depict.emolecules.com/cgi-bin/mymol/depict.cgi?smiles=c1(c(cncc1)C(O)=O)C(O)=O&width=100&height=100&colorscheme=cow&format=png&submit=image
NCI/CADD, Chemical Identifier Resolver
美國癌癥研究中心
http://cactus.nci.nih.gov/chemical/structure/c1(c(cncc1)C(O)=O)C(O)=O/image