맨위로가기

화학 데이터베이스

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

화학 데이터베이스는 안정적인 분자 정보를 저장하며, 화학 물질 데이터베이스와 화학 반응 데이터베이스로 분류된다. 방대한 양의 화합물을 저장하며, 생물 활성, 문헌, 결정 구조, NMR 스펙트럼, 반응, 열역학적 특성 등 다양한 종류가 있다. 화학 구조는 원자와 결합을 나타내는 선으로 표현되지만, 계산 화학에서는 적합하지 않아 연결 테이블, 선형 표기법 등의 디지털 표현 방식을 사용한다. 검색 시에는 부분 구조, 유사성, 3차원 구조 검색이 가능하며, 등록 시스템을 통해 화합물의 고유성을 관리한다. 웹 기반 데이터베이스와 다양한 관련 도구들이 활용되며, 화학 구조 편집기, 변환 알고리즘, 카트리지 기술 등이 사용된다.

더 읽어볼만한 페이지

  • 화학정보학 - 민감도와 특이도
    민감도와 특이도는 의학적 진단에서 검사의 정확성을 평가하는 지표로, 민감도는 실제 양성인 대상 중 양성으로 나타나는 비율, 특이도는 실제 음성인 대상 중 음성으로 나타나는 비율을 의미하며, 선별 검사에서 두 지표를 모두 높여 질병을 정확하게 진단하는 것을 목표로 한다.
  • 화학정보학 - 가상 스크리닝
    가상 스크리닝은 컴퓨터를 이용하여 신약 후보 물질을 발굴하는 방법으로, 리간드 기반, 구조 기반, 하이브리드 방법으로 나뉘며 계산량, 정확도, 필요한 계산 인프라 등에서 차이를 보인다.
  • 화학 데이터베이스 - ChEMBL
    ChEMBL은 약물 표적에 대한 화합물 생체 활성 데이터베이스로서, 신약 개발 과정의 선도 물질 식별을 위한 화합물 스크리닝 라이브러리 구축에 활용되며, 웹 인터페이스나 파일 전송 프로토콜을 통해 접근 가능하다.
  • 화학 데이터베이스 - CAS 등록번호
    CAS 등록번호는 화학 물질을 식별하기 위해 화학 초록 서비스에서 개발한 고유 식별 번호이며, 하이픈으로 구분된 세 부분과 검증 숫자로 구성된다.
  • 계산화학 - 에너지 준위
    에너지 준위는 양자 역학적 계에서 입자가 가질 수 있는 특정 에너지 값으로, 원자 내 전자의 양자화된 에너지 상태를 나타내며 분자에서는 전자, 진동, 회전 에너지 준위가 존재하고, 에너지 준위 간 전이는 광자의 흡수 또는 방출을 수반한다.
  • 계산화학 - 섭동 이론
    섭동 이론은 정확히 풀리는 문제에 작은 변화가 있을 때 급수로 표현하여 근사해를 구하는 방법으로, 초기 해에 보정항을 더하는 방식으로 고전역학, 양자역학 등 다양한 분야에서 활용되며 섭동 형태와 적용 차수에 따라 구분된다.
화학 데이터베이스

2. 화학 데이터베이스의 종류

화학 데이터베이스는 그 데이터 구성에 따라 '''화학 물질 데이터베이스'''(화합물 데이터베이스)와 '''화학 반응 데이터베이스'''로 나눌 수 있다. 화학 반응 데이터베이스는 "반응물의 화학 물질"과 "생성물의 화학 물질"을 반응 조건 등으로 관련지은 데이터 구성이므로, 화학 물질 데이터베이스의 기술을 기반으로 구축되는 것이 일반적이다.

거대한 화학 데이터베이스는 수백만 개의 화합물을 테라바이트스토리지에 저장하고 있다. 2005년 시점에서 CAS는 2,500만 항목의 화합물을 저장하고 있었다.

2. 1. 생물 활성 데이터베이스

생물 활성 데이터베이스는 문헌, 특허 및 스크리닝 프로그램에서 얻은 생물 검정의 생물 활성 결과와 구조 또는 기타 화학 정보를 연관시킨다.

이름개발자최초 출시
ScrubChemJason Bret Harris2016[1][2]
PubChem-BioAssayNIH2004[3][4]
ChEMBLEMBL-EBI2009[5]


2. 2. 문헌 데이터베이스

화학 문헌 데이터베이스는 구조 또는 기타 화학 정보를 학술 논문이나 특허와 같은 관련 참고 자료와 연결한다. 이러한 유형의 데이터베이스에는 STN, Scifinder, Reaxys가 포함된다. 문헌에 대한 링크는 화학적 특성 규명에 중점을 둔 많은 데이터베이스에도 포함되어 있다.

2. 3. 결정 구조 데이터베이스

결정학 데이터베이스는 X선 결정 구조 데이터를 저장한다. 일반적인 예로는 단백질 데이터 뱅크와 캠브리지 구조 데이터베이스가 있다.

2. 4. NMR 스펙트럼 데이터베이스

NMR 스펙트럼 데이터베이스는 화학 구조와 NMR 데이터를 연관시킨다. 이 데이터베이스는 종종 FTIR 및 질량 분석법과 같은 다른 특성 분석 데이터도 포함한다.

2. 5. 반응 데이터베이스

대부분의 화학 데이터베이스는 안정적인 분자에 대한 정보를 저장하지만, 반응 데이터베이스에서는 중간체와 일시적으로 생성된 불안정한 분자도 저장한다. 반응 데이터베이스는 생성물, 반응물 및 반응 메커니즘에 대한 정보를 포함한다.

화학 반응 데이터를 나열하는 인기 있는 예로는 바일슈타인 데이터베이스가 있다.

2. 6. 열역학적 특성 데이터베이스

상 평형 정보, 기액 평형, 액체에 대한 기체의 용해도, 고체에 대한 액체의 용해도(SLE), 혼합열, 증발 엔탈피, 융해 엔탈피 등과 같은 정보와 열용량, 생성열, 연소열과 같은 열적 데이터, 점도, 열전도도와 같은 수송 특성을 포함한다.

3. 화학 구조 표현 방식

화학 구조는 전통적으로 원자 간의 화학 결합을 나타내는 선을 사용하여 종이에 그려 표현한다(2차원 구조식). 이는 화학자에게는 이상적인 시각적 표현이지만, 계산, 특히 검색 및 저장에는 적합하지 않다. 작은 분자(약물 설계 응용 분야에서는 리간드라고도 함)는 일반적으로 원자와 그 연결 목록을 사용하여 표현된다. 그러나 단백질과 같은 큰 분자는 아미노산 빌딩 블록의 서열을 사용하여 더 간결하게 표현된다. 방사성 동위원소도 표현되며, 이는 일부 응용 분야에서 중요한 속성이다. 구조에 대한 대규모 화학 데이터베이스는 수백만 개의 분자에 대한 정보를 저장하고 검색하며 테라바이트의 물리적 메모리를 차지할 것으로 예상된다.[6][7]

화학 구조를 디지털 데이터베이스에 표현하는 데는 크게 두 가지 주요 기술이 있다.


  • 연결 테이블 / 인접 행렬 / 결합 (edge) 및 원자 속성 (node)에 대한 추가 정보를 포함하는 목록
  • 깊이 우선 또는 너비 우선 순회를 기반으로 하는 선형 문자열 표기법


이러한 접근 방식은 입체화학적 차이와 전하, 그리고 유기 금속 화합물에서 볼 수 있는 특수한 종류의 결합을 표현할 수 있도록 개선되었다. 컴퓨터 표현의 주요 장점은 저장 공간 증가와 빠르고 유연한 검색이 가능하다는 것이다.

많은 화학 데이터베이스는 반응의 과정에서 일과성으로 나타나는 것이 아니라, 안정적인 분자 정보를 저장한다. 화학 구조의 표현은 전통적으로 원자와 화학 결합을 나타내는 선분을 사용하여 평면상에 그려진다(2D 구조).

화학 데이터베이스는 그 데이터 구성에 따라 '''화학 물질 데이터베이스'''(화합물 데이터베이스)와 '''화학 반응 데이터베이스'''로 나눌 수 있다. 화학 반응은 "반응물의 화학 물질"과 "생성물의 화학 물질"을 반응 조건 등으로 관련지은 데이터 구성이 되므로, 화학 반응 데이터베이스는 화학 물질 데이터베이스의 기술을 기반으로 구축되는 것이 일반적이다.

거대한 화학 데이터베이스는 수백만 개의 화합물을 테라바이트급의 스토리지에 저장하고 있다(2005년 시점에서 CAS는 2,500만 항목의 화합물을 저장하고 있다).

3. 1. 연결 테이블 기반 표현

화학 구조는 MDL 몰파일, PDB, CML과 같이 연결 테이블, 인접 행렬, 결합(edge) 및 원자 속성(node)에 대한 추가 정보를 포함하는 목록으로 표현될 수 있다.[6][7]

3. 2. 선형 표기법 기반 표현

화학 구조는 전통적으로 원자 간의 화학 결합을 나타내는 선을 사용하여 종이에 그려져 표현된다(2차원 구조식). 이는 화학자에게는 이상적인 시각적 표현이지만, 계산 사용, 특히 검색 및 저장에는 적합하지 않다.[6][7]

화학 구조를 디지털 데이터베이스에 표현하는 데는 두 가지 주요 기술이 있는데, 그중 하나는 깊이 우선 또는 너비 우선 순회를 기반으로 하는 선형 문자열 표기법이다. 여기에는 다음이 포함된다.[6][7]

  • SMILES, SMARTS, SLN, WLN, InChI


이러한 접근 방식은 입체 화학적 차이와 전하, 그리고 유기 금속 화합물에서 볼 수 있는 특수한 종류의 결합을 표현할 수 있도록 개선되었다. 컴퓨터 표현의 주요 장점은 저장 공간 증가와 빠르고 유연한 검색이 가능하다는 것이다.[6][7]

4. 화학 데이터베이스 검색

펍켐(PubChem)[11][20] 및 켐스파이더(ChemSpider)[21]와 같은 대규모 화학 데이터베이스는 검색을 위한 그래픽 인터페이스를 제공한다. 화학 초록 서비스(Chemical Abstracts Service)는 화학 문헌 검색 도구를 제공하며, 엘스비어(Elsevier)의 리액시스(Reaxys)는 바일슈타인 데이터베이스(Beilstein database)의 정보를 포함하여 화학 물질 및 반응 정보를 제공한다.[22] PATENTSCOPE를 통해 하위 구조 기반 화학 특허 검색이 가능하며, 위키백과의 개별 화학 물질 문서도 이 방식으로 검색할 수 있다.[23][24]

합성 중간체나 고속 처리 스크리닝에 사용되는 화학 물질 공급업체들은 일반적으로 검색 인터페이스를 제공한다. 현재 대중이 자유롭게 검색할 수 있는 가장 큰 데이터베이스는 ZINC 데이터베이스로, 370억 개가 넘는 상업적으로 이용 가능한 분자를 포함하고 있다고 주장한다.[25][26]

4. 1. 부분 구조 검색

화학자들은 구조의 일부, IUPAC 명칭의 일부, 그리고 속성에 대한 제약 조건을 사용하여 데이터베이스를 검색할 수 있다. 화학 데이터베이스는 사용자가 지정한 원자와 결합 패턴과 일치하는 화학 물질을 검색하는 방법인 부분 구조 검색을 지원한다는 점에서 다른 일반적인 데이터베이스와 다르다. 이러한 종류의 검색은 부분 그래프 동형 사상(때로는 단형 사상이라고도 함)을 찾는 것으로 이루어지며, 이는 그래프 이론의 널리 연구되는 응용 분야이다.[8][9][10]

쿼리 구조는 유연성을 제공하기 위해 "단일/방향족" 또는 "모든"과 같은 결합 패턴을 포함할 수 있다. 마찬가지로, 실제 화합물에서 특정 원자가 될 정점은 쿼리에서 원자 목록으로 대체될 수 있다. 시스-트랜스 이성질체는 E 형태, Z 형태 또는 둘 다 검색하는 선택 사항을 제공하여 처리된다.[8][11]

펍켐(PubChem)[11][20] 및 켐스파이더(ChemSpider)[21]는 검색을 위한 그래픽 인터페이스를 갖추고 있다. 화학 초록 서비스(Chemical Abstracts Service)는 화학 문헌을 검색하는 도구를 제공하며, 엘스비어(Elsevier)에서 제공하는 리액시스(Reaxys)는 바일슈타인 데이터베이스(Beilstein database)에 원래 보관되었던 정보를 포함하여 화학 물질과 반응 정보를 모두 다룬다.[22] PATENTSCOPE는 하위 구조에 따라 화학 특허에 접근할 수 있도록 하며,[23] 위키백과의 개별 화학 물질을 설명하는 문서도 이 방식으로 검색할 수 있다.[24]

합성 중간체 또는 고속 처리 스크리닝에 사용되는 화학 물질 공급업체는 일반적으로 검색 인터페이스를 제공한다. 현재 대중이 자유롭게 검색할 수 있는 가장 큰 데이터베이스는 ZINC 데이터베이스로, 370억 개가 넘는 상업적으로 이용 가능한 분자를 포함하고 있다고 주장한다.[25][26]

화학자는 부분 구조나 IUPAC 명의 일부와 같은 속성에 의한 제약과 유사한 검색 조건을 사용하여 데이터베이스 검색을 실행한다. 화학 데이터베이스는 다른 범용 데이터베이스와 달리 부분 구조 검색을 제공한다는 점이 특징이다. 이러한 종류의 검색은 '''부분 그래프 동형 사상'''(sub-graph isomorphism, 때로는 단사 monomorphism라고 불리는 방법) 또는 그래프 이론의 응용을 통해 탐색할 수 있다. 검색 알고리즘은 계산량에서 O(''n''3) 또는 O(''n''4) 배의 복잡도로 증가한다(n은 포함된 원자의 수). 검색 기능을 집약한 컴포넌트는 atom-by-atom-searching (ABAS)라고 불리며, 검색 대상 분자 구조의 원자와 결합으로 구성된 부분 구조를 탐색할 수 있도록 매핑을 수행한다. ABAS 검색은 '''울만 알고리즘''' 또는 그 변형을 사용하여 일반적으로 구현된다. 검색 속도 향상은 분할 실행을 통해 실현되며, 전처리로 여러 검색 작업으로 분할되어 저장된다. 전처리에는 일반적으로 분자의 단편 구조 유무를 표현하는 비트열로 전개하는 작업도 포함된다. 검색 구조가 단편에 있는지 여부를 찾으려면, 탐색되는 분자 구조와 ABAS 비교 시에 검색 구조를 나타내는 단편이 존재할 수 없는 것을 제외해야 한다. 이 제외 연산은 '''스크리닝'''이라고 불리며, 이를 구현하는 데 비트열이 사용되며, 이는 '''구조 키'''(structural keys)라고도 불린다. 이러한 키의 검색 효율은 단편 선택에 사용하는 키의 구성 방법과 데이터베이스 내 분자 구조에 해당 키가 존재하는 확률에 따라 달라진다. 다른 종류의 키 구축 방법으로는 단편으로부터 산술식으로 유도되는 '''해시값'''을 기반으로 하는 방법이 사용되고 있다. 이 방법은 '''핑거프린트'''라고도 불리지만, 때로는 이 단어가 구조 키와 동의어처럼 사용된다. 구조 키나 핑거프린트를 저장하는 데 필요한 기억 용량은 폴딩 처리를 통해 감소되며, 키 비교 부분을 비트 단위 연산으로 비교하므로, 비트열 전체를 비교하지 않아 속도가 향상된다.

4. 2. 유사성 검색

분자 유사성에 대한 단일 정의는 없지만, 이 개념은 응용 분야에 따라 정의될 수 있으며, 종종 역수로, 설명자 공간에서의 거리의 척도로 설명된다. 예를 들어, 두 분자의 분자량 차이가 다른 분자들과 비교했을 때 더 적을 경우, 두 분자는 더 유사하다고 간주될 수 있다. 다양한 다른 척도를 결합하여 다변량 거리 척도를 생성할 수 있다. 거리 척도는 삼각 부등식이 성립하는지에 따라 유클리드 척도와 비유클리드 척도로 분류된다. 최대 공통 부분 그래프(MCS) 기반 부분 구조 검색(유사성 또는 거리 척도)도 매우 일반적이다. MCS는 또한 공통 부분 그래프(부분 구조)를 공유하는 분자를 사용하여 약물 유사 화합물을 스크리닝하는 데 사용된다.[28]

데이터베이스의 화학 물질은 유사성에 따라 '유사한' 분자 그룹으로 클러스터될 수 있다. 계층적 클러스터링 방식과 비계층적 클러스터링 방식 모두 여러 속성을 가진 화학 물질에 적용할 수 있다. 이러한 속성 또는 분자 특성은 경험적으로 결정되거나 계산적으로 유도된 설명자일 수 있다. 가장 인기 있는 클러스터링 방식 중 하나는 자비스-패트릭 알고리즘이다.[29]

약리학 지향적인 화학 저장소에서 유사성은 일반적으로 화합물의 생물학적 효과(ADME/독성) 측면에서 정의되며, 이는 QSAR 방법을 사용하여 유사한 물리화학적 설명자의 조합으로부터 반자동적으로 추론될 수 있다. 화학자는 부분 구조나 IUPAC 명의 일부와 같은 속성에 의한 제약과 유사한 검색 조건을 사용하여 데이터베이스 검색을 실행한다. 화학 데이터베이스는 다른 범용 데이터베이스와 달리 부분 구조 검색을 제공한다는 점이 특징으로 꼽힌다. 이러한 종류의 검색은 부분 그래프 동형 사상(sub-graph isomorphism, 때로는 단사 monomorphism라고 불리는 방법) 또는 그래프 이론의 응용을 통해 탐색할 수 있다. 검색 알고리즘은 계산량에서 O(''n''3) 또는 O(''n''4) 배의 복잡도로 증가한다(n은 포함된 원자의 수). 검색 기능을 집약한 컴포넌트는 atom-by-atom-searching (ABAS)라고 불리며, 검색 대상 분자 구조의 원자와 결합으로 구성된 부분 구조를 탐색할 수 있도록 매핑을 수행한다. ABAS 검색은 울만 알고리즘 또는 그 변형을 사용하여 일반적으로 구현된다. 검색 속도 향상은 분할 실행을 통해 실현되며, 전처리로 여러 검색 작업으로 분할되어 저장된다. 전처리에는 일반적으로 분자의 단편 구조 유무를 표현하는 비트열로 전개하는 작업도 포함된다. 검색 구조가 단편에 있는지 여부를 찾으려면, 탐색되는 분자 구조와 ABAS 비교 시에 검색 구조를 나타내는 단편이 존재할 수 없는 것을 제외해야 한다. 이 제외 연산은 스크리닝이라고 불리며, 이를 구현하는 데 비트열이 사용되며, 이는 구조 키(structural keys)라고도 불린다. 이러한 키의 검색 효율은 단편 선택에 사용하는 키의 구성 방법과 데이터베이스 내 분자 구조에 해당 키가 존재하는 확률에 따라 달라진다. 다른 종류의 키 구축 방법으로는 단편으로부터 산술식으로 유도되는 해시값을 기반으로 하는 방법이 사용되고 있다. 이 방법은 핑거프린트라고도 불리지만, 때로는 이 단어가 구조 키와 동의어처럼 사용된다. 구조 키나 핑거프린트를 저장하는 데 필요한 기억 용량은 폴딩 처리를 통해 감소되며, 키 비교 부분을 비트 단위 연산으로 비교하므로, 비트열 전체를 비교하지 않아 속도가 향상된다.

4. 3. 3차원 구조 검색

분자의 3차원 입체구조를 일치시켜 검색하거나 공간적 제약 조건을 지정하는 기능은 특히 신약 설계에 유용하다. 이러한 종류의 검색은 계산 비용이 매우 많이 들 수 있다. 예를 들어, BCUTS,[12][13][14] 특수 함수 표현, 관성 모멘트, 광선 추적 히스토그램, 최대 거리 히스토그램, 형태 다중극 등과 같은 많은 근사 방법이 제안되었다.[15][16][17][18][19]

5. 화학 등록 시스템

등록 시스템은 화합물에 대한 고유한 기록을 유지하기 위한 데이터베이스 시스템이다. 이는 종종 화학적 색인, 특허 시스템 및 산업 데이터베이스에 사용된다.[52][53][54][55][56]

등록 시스템은 일반적으로 고유한 표현을 사용하여 데이터베이스에 표시된 화학 물질의 고유성을 강제한다. '캐노니컬 SMILES'와 같은 고유한/'캐노니컬' 문자열 표현은 문자열 표기법 생성에 대한 우선 순위 규칙을 적용하여 얻을 수 있다. CAS 시스템과 같은 일부 등록 시스템은 고유한 해시 코드를 생성하는 알고리즘을 사용하여 동일한 목표를 달성한다.[52][53][54][55][56]

등록 시스템과 단순한 화학 데이터베이스의 주요 차이점은 알려진 것, 알려지지 않은 것 및 부분적으로 알려진 것을 정확하게 표현하는 능력이다. 예를 들어, 화학 데이터베이스는 입체화학이 지정되지 않은 분자를 저장할 수 있지만, 화학 등록 시스템은 등록자가 입체 배치가 알려지지 않은 것인지, 특정(알려진) 혼합물인지, 또는 라세미인지 지정해야 한다. 이 각각은 화학 등록 시스템에서 다른 레코드로 간주된다.[52][53][54][55][56]

등록 시스템은 또한 화학 물질의 할로겐 이온의 차이와 같은 사소한 차이를 고려하지 않도록 분자를 전처리한다.[52][53][54][55][56]

예로는 화학 초록 서비스(CAS) 등록 시스템, CAS 등록 번호 등이 있다.

레코드가 화학 물질로서 중복 없이 관리되는 데이터베이스 시스템은 등록 시스템(registration systems)이라고도 불린다. 이러한 데이터베이스는 화학 물질의 목록이나 특허 시스템 또는 산업용 데이터베이스로 널리 이용되고 있다.

등록 시스템은 일반적으로 데이터베이스 내 화학적 표현의 변동을 특정 표현 규칙에 따르도록 강제함으로써 고유성을 유지한다. 문자열화 표현을 생성할 때 우선 규칙을 적용함으로써 "정규 SMILES"와 같은 고유/「정규화」 문자열 표현을 등록 시스템은 저장할 수 있다. CAS 시스템과 같은 어떤 종류의 등록 시스템은 동일한 등록 항목에 대해 고유한 해시 값을 생성하는 알고리즘을 채용하고 있다.

등록 시스템에서는 염화합물의 할로겐 이온의 차이와 같은 상이점이 검색상의 차이로 무시되도록 분자 구조를 전처리하는 경우도 있다.

6. 화학 카트리지 목록


  • 어코드 (Accord)
  • 다이렉트 (Direct)[47]
  • J Chem[48]
  • 캠브리지소프트 (CambridgeSoft)[49]
  • 빙고 (Bingo)[50]
  • 핀포인트 (Pinpoint)[51]
  • 어코드
  • 다이렉트[30]
  • J Chem [31]
  • 캠브리지소프트[32]
  • 빙고[33]
  • 핀포인트[34]

7. 화학 등록 시스템 목록

시스템 이름출처
ChemReg[52], [35]
Register[53], [36]
RegMol[54], [37]
Compound-Registration (화합물 등록)[55], [38]
Ensemble[56], [39]


8. 웹 기반 화학 데이터베이스

CDD Vault는 콜라보레이티브 드럭 디스커버리가 2018년에 출시한 웹 기반 화학 데이터베이스이다.[57][58][59]

9. 관련 도구

화학 데이터의 계산 표현은 일반적으로 화학자들에게 투명하게 시각적으로 표시된다. 데이터 입력 또한 화학 구조 편집기를 사용하여 단순화된다. 이러한 편집기는 그래픽 데이터를 내부적으로 계산 표현으로 변환한다.

다양한 표현 형식 간의 상호 변환을 위한 수많은 알고리즘도 존재한다. 변환을 위한 오픈 소스 유틸리티는 OpenBabel이다. 이러한 검색 및 변환 알고리즘은 데이터베이스 시스템 자체 내에서 구현되거나, 현재 추세에 따라 표준 관계형 데이터베이스 시스템에 적합한 외부 구성 요소로 구현된다.

IUPAC 명칭을 구조 표현으로 변환하거나, 그 반대로 변환하는 알고리즘은 텍스트 마이닝을 통해 텍스트에서 구조 정보를 추출하는 데에도 사용된다. 그러나 여러 가지 IUPAC 방언이 존재하기 때문에 어려움이 있다. 고유한 IUPAC 표준을 확립하기 위한 연구가 진행 중이다 (InChI 참조).

참조

[1] 웹사이트 Home Page - ScrubChem http://www.scrubchem[...]
[2] 서적 Bioinformatics and Drug Discovery
[3] 웹사이트 PubChem https://pubchem.ncbi[...]
[4] 논문 PubChem BioAssay: 2017 update
[5] 웹사이트 ChEMBL Database https://www.ebi.ac.u[...]
[6] 논문 The next level in chemical space navigation: going far beyond enumerable compound libraries 2019
[7] 논문 Computational approaches streamlining drug discovery 2023
[8] 서적 Chemical Information for Chemists 2014
[9] 논문 An Algorithm for Subgraph Isomorphism 1976
[10] 논문 Representation of chemical structures 2011
[11] 웹사이트 PubChem Structure Search https://pubchem.ncbi[...] 2024-08-01
[12] 논문 Metric Validation and the Receptor-Relevant Subspace Concept
[13] 웹사이트 BCUTDescriptor (cdk 2.5 API) https://cdk.github.i[...] 2021-05-05
[14] 논문 Molecular identification number for substructure searches 1989-08-01
[15] 논문 Metric Validation and the Receptor-Relevant Subspace Concept
[16] 논문 An analytical, variable resolution, complete description of static molecules and their intermolecular binding properties
[17] 논문 Shape Signatures: speeding up computer aided drug discovery
[18] 논문 A fast method of molecular shape comparison: A simple application of a Gaussian description of molecular shape
[19] 논문 Ultrafast shape recognition for similarity search in molecular databases
[20] 논문 Exploring Chemical Information in PubChem 2021
[21] 서적 Enhancing Learning with Online Resources, Social Networking, and Digital Libraries 2010
[22] 논문 Property Information in Substance Records in Major Web-Based Chemical Information and Data Retrieval Tools: Understanding Content, Search Opportunities, and Application to Teaching 2020
[23] 웹사이트 Substructure Search Now Available in PATENTSCOPE https://www.wipo.int[...] 2019-02-11
[24] 논문 Wikipedia Chemical Structure Explorer: Substructure and similarity searching of molecules from Wikipedia 2015
[25] 논문 ZINC-22─A Free Multi-Billion-Scale Database of Tangible Compounds for Ligand Discovery 2023
[26] 논문 Exploration of Ultralarge Compound Collections for Drug Discovery 2022
[27] 논문 Small Molecule Subgraph Detector (SMSD) toolkit
[28] 논문 Small Molecule Subgraph Detector (SMSD) Toolkit http://www.ebi.ac.uk[...]
[29] 논문 Unsupervised Data Base Clustering Based on Daylight's Fingerprint and Tanimoto Similarity: A Fast and Automated Way To Cluster Small and Large Data Sets
[30] 웹사이트 BIOVIA Direct - BIOVIA - Dassault Systèmes® https://www.3ds.com/[...] 2023-09-08
[31] 웹사이트 JChem Engines | ChemAxon https://chemaxon.com[...]
[32] 웹사이트 Chemistry – Oracle Cartridge | Inside Informatics http://insideinforma[...]
[33] 논문 Bingo from SciTouch LLC: Chemistry cartridge for Oracle database
[34] 웹사이트 Small Molecule Drug Discovery Software https://www.dotmatic[...]
[35] 웹사이트 BIOVIA Chemical Registration - BIOVIA - Dassault Systèmes® https://www.3ds.com/[...] 2023-09-07
[36] 웹사이트 Register https://web.archive.[...] 2021-03-13
[37] 웹사이트 Scilligence RegMol | Scilligence https://www.scillige[...] 2016-06-06
[38] 웹사이트 Compound Registration https://chemaxon.com[...]
[39] 웹사이트 Signals Notebook - PerkinElmer Informatics https://perkinelmeri[...]
[40] 웹사이트 CDD Vault Update: CDD Vault is Now an ELN https://www.collabor[...] 2018-02-16
[41] 웹사이트 CDD Electronic Lab Notebook (ELN) https://www.collabor[...] 2019-08-14
[42] 웹사이트 Electronic Lab Notebooks: What they are (And why you need one) https://www.collabor[...] 2019-08-04
[43] 웹사이트 Review of SDF Pro from Adroit DI. June 2023 – Macs in Chemistry https://macinchem.or[...] 2023-11-05
[44] 웹사이트 Adroit DI main page https://adroitdi.com[...]
[45] 웹사이트 Adroit DI's SDF Pro: The Fast and Affordable Solution to Storing, Sorting and Wrangling 10 Million Molecules in Seconds https://www.business[...] 2023-05-16
[46] 웹사이트 Best of the Best Entity Registration https://www.20vision[...]
[47] 웹인용 BIOVIA Direct - BIOVIA - Dassault Systèmes® https://www.3ds.com/[...]
[48] 웹인용 JChem Engines | ChemAxon https://chemaxon.com[...]
[49] 웹인용 Chemistry – Oracle Cartridge | Inside Informatics http://insideinforma[...] 2021-12-10
[50] 저널 Bingo from SciTouch LLC: Chemistry cartridge for Oracle database
[51] 웹인용 Small Molecule Drug Discovery // Drug Development https://www.dotmatic[...]
[52] 웹인용 BIOVIA Chemical Registration - BIOVIA - Dassault Systèmes® https://www.3ds.com/[...]
[53] 웹인용 Register https://www.dotmatic[...] 2021-12-10
[54] 웹인용 Scilligence RegMol | Scilligence https://www.scillige[...] 2016-06-06
[55] 웹인용 Compound Registration | ChemAxon https://chemaxon.com[...]
[56] 웹인용 Registration https://www.cambridg[...] 2021-12-10
[57] 웹인용 CDD Vault Update: CDD Vault is Now an ELN https://www.collabor[...] 2018-02-16
[58] 웹인용 CDD Electronic Lab Notebook (ELN) https://www.collabor[...] 2019-08-14
[59] 웹인용 Electronic Lab Notebooks: What they are (And why you need one) https://www.collabor[...] 2019-08-04



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com