콘텐츠로 이동

생물정보 데이터베이스

psi 서버의 /data/databases/에 주요 생물정보학 데이터베이스가 자동 동기화됩니다. 모든 동기화는 rclone을 통해 수행됩니다.

사용 가능 데이터베이스

데이터베이스 동기화 주기 소스 용도
blast-nr 주간 NCBI FTP 비중복 단백질
blast-nt 주간 NCBI FTP 비중복 뉴클레오티드
blast-swissprot 주간 NCBI FTP SwissProt 단백질
uniref90 월간 EBI (UniProt 미러) 90% 클러스터링
uniref100 월간 EBI (UniProt 미러) 전체 UniRef
pdb 주간 PDBj (일본 미러) 단백질 구조 (PDB 형식)
pdb-mmcif 주간 PDBj (일본 미러) 단백질 구조 (mmCIF 형식)
rnacentral 월간 EBI RNA 서열
pfam 월간 EBI 단백질 패밀리
rfam 월간 EBI RNA 패밀리

사용 방법

# 데이터베이스 경로
ls /data/databases/

# BLAST 검색 예시
blastp -query query.fasta \
  -db /data/databases/blast-nr/nr \
  -out results.txt -evalue 1e-5

데이터베이스 관리

# 상태 확인 (타이머, 실행 결과, 디스크 사용량)
db-sync-status

# 데이터베이스 크기만 확인
db-list

# 전체 수동 동기화
sudo db-sync-all

# 개별 수동 동기화
sudo systemctl start db-sync-blast-nr.service
journalctl -u db-sync-blast-nr.service -f

# 실행 중인 동기화 중지
sudo db-sync-stop              # 전체
sudo db-sync-stop blast-nr     # 개별

# 특정 시점의 스냅샷 생성 (CoW, XFS reflink)
db-freeze blast-nr 2026Q1

# 스냅샷 삭제
db-thaw blast-nr 2026Q1

스냅샷은 XFS reflink를 사용하여 추가 디스크 공간을 거의 차지하지 않으면서 특정 시점의 데이터베이스를 보존합니다.