라이브러리

AI 활용신약DB 상세

tox21 2023-12-13
조회수 369

미국 환경보호청에서 제공하는 데이터셋이고,  미국 환경 보호국(EPA) ,   국립 환경 보건 과학 연구소(NIEHS)에 본부를 둔 국립  독성학 프로그램(NTP) , 국립 중개 과학 발전 센터(NCATS) 및  식품의약국(FDA) )가 구성한 컨소시엄인 Tox21에서 구축한 데이터셋입니다.


화합물을 나타내는 12,060개의 훈련 샘플과 647개의 테스트 샘플로 구성됩니다. 분자량, 용해도 또는 표면적과 같은 화학적 설명자를 나타내는 801개의 "밀도 특성"과 화학적 하위 구조(ECFP10, DFS6, DFS8, Matrix Market Format에 저장됨)를 나타내는 272,776개의 "희소 특성"이 있습니다.


각 샘플에는 12가지 독성 실험의 결과(활성/비활성)를 나타내는 12개의 이진 라벨이 있습니다. 레이블 행렬에는 많은 결측값(NA)이 포함되어 있습니다. 원본 데이터 소스와 Tox21 챌린지 사이트는 https://tripod.nih.gov/tox21/challenge/입니다. 


상세 설명 아래 링크 참조 : 

https://tripod.nih.gov/tox21/challenge/

https://tox21.gov/overview/about-tox21/

  • tox21 chemical substructures active/inactive