3X-DBANK

바이오 빅데이터 플랫폼

신약개발을 목표로 대규모의 바이오 빅데이터 기반 In-House Platform을 구축하였습니다. AI 기술을 적용하여 새로운 신약 후보군의 발굴 및 다양한 신소재 발굴에 대한 연구를 진행할 수 있으며, 새로운 바이오 빅데이터를 구축하고 활용할 수 있는 노하우를 보유하고 있습니다. 

바이오 빅데이터 통합

현재 약 60개 이상의 데이터베이스를 BT, IT 전문가들이 통합 ・ 구축 하였고, 지속적인 업데이트와 확장을 이어가고 있습니다.

유전자, 질병, 약물, 임상시험, 네트워크 등 생물정보학에 사용될 수 있는 다양한 데이터를 수집하고 정제하여 연구 목적에 맞게 바로 사용할 수 있습니다.

3X-DBANK 플랫폼

통합된 데이터베이스의 정보들을 연계하여 신약개발에 도움을 줄 수 있는 웹 기반의 플랫폼을 구축하였습니다.

데이터베이스 정제 및 통합

데이터 통합 과정에서의 다양한 문제점

서로다른 데이터베이스를 통합하는 과정은 매우 어렵습니다. 데이터의 에러, 동일한 이름의 서로다른 정보, 파일 형태의 다양성, 등의 문제를 전문가들이 하나하나 검토하고 확인하며 하나의 데이터베이스로 구축하였습니다.

Data Heterogeneity

Data Model Heterogeneity

Multiple data formats

Data Errors

수많은 데이터베이스를 정제하는 과정을 거쳐 하나의 데이터베이스로 구축

Data Cleaning

▪︎ Fill in missing values
▪︎ Identify or remove outliers
▪︎ Resolve inconsistencies

Data Integration

▪︎ Integration of multiple database, data cubes or files

Data Transformation

▪︎ Normalization & Aggregations

Diseae-Target-Drug의 다양한 데이터를 통합적으로 구축하여 Drug Discovery를 위한 정보를 제공합니다.

Disease

  • Gene
  • Pathway
  • Biomarkers
  • Target / EC50, IC50 etc.
  • Gene expression
  • Transcription factor
  • Clinical trial information
  • Marked drugs
  • Adverse events
  • Drug-Protein interactions

Target

  • Drugs
  • Pathway
  • Disease
  • Biomarkers
  • Target / EC50, IC50 etc.
  • Tissue specification expression
  • Gene expression drug, disease
  • Transcription factor
  • Clinical trial information
  • Marked drugs
  • Target-Target interaction

Drug

  • Clinical trial information
  • Gene
  • Pathway
  • Drugs
  • Biomarkers
  • Gene expression
  • Disease-gene relationship