dbGaP(The Database of Genotypes and Phenotypes)是国立卫生研究院(NIH)赞助的用于归档、精选和发布由调查基因型和表型间相互作用的研究所产生的信息的数据仓库,以下是dbGaP数据库的使用教程:
1、账号获取
dbGaP账号需要NCI/NIH认证资格,一般是实验室的PI、且申请过NIH或是NCI的资助,才可能有dbGaP账号,所以需要先咨询一下实验室的PI是否有账号,有的话基本成功一半了。
2、创建Project
在dbGaP界面中选择“Create New Project”或类似选项来创建一个新的项目。
3、填写项目内容
选择数据集:首先要选择你要申请的dataset,这里可以搜索dataset的编号,也可以按照类型筛选,勾选dataset前面的多选框即可(可多选),选择好之后拉到最下面,点击”Add Selected and Continue”。
填写研究项目信息:包括项目名称、项目具体介绍以及非专业的介绍等,此外还需要选择SO(Signing Official,代表你的所在研究单位负责数据申请确认的负责人)信息、Collaborators(合作者)、IT Director(IT负责人)等信息,这些信息PI一般都有,可以让实验室的PI填写。
确认并提交:填写完基本信息之后,在Confirm Datasets那一栏里确认一下信息,一步步确认点下来,提交就可以了,然后就是等待审核,一般几个星期之后可以在My Request里面查看审核状态。
4、下载数据和Key
点击Downloads,可看到审核通过的可以下载的datasets列表,点击右侧Actions栏里面的Download可以下载数据(需要安装aspera),此处下载的数据是加密的,文件后缀是".ncbi_enc",点击"get dbGaP repository key"下载解密要用的key,文件以“.ngc”
5、文件解密
解密使用的软件是SRA-Toolkit,建议在linux端运行,首先导入key文件:vdb-config --import xxxx.ngc
(xxxx.ngc为key文件),此时会自动创建"/home/ncbi/dbGaP-xxxx"文件夹及一些子目录,之后的解密命令要进入该文件夹操作,进入ncbi路径:cd /home/ncbi/dbGaP-xxxx
,运行解密命令:vdb-decrypt xx.ncbi_enc
(xx.ncbi_enc为下载的需要解密的文件),注意,运行vdb-decrypt时一定要切换到ncbi路径里,否则会报错。
1、如果忘记密码怎么办?
可以通过注册邮箱找回密码。
2、如何修改个人信息?
登录账户后,在个人中心或设置页面进行修改。
3、如何申请权限?
在主页面找到感兴趣的数据集,点击“Request Access”,按提示填写申请表单并提交。
遵循以上步骤,您将能够顺利使用dbGaP数据库进行基因型和表型数据的查询与下载,如在使用过程中遇到任何问题,建议及时联系数据库管理员或查阅官方文档。