본문바로가기

이 누리집은 대한민국 공식 전자정부 누리집입니다.

메뉴

보건의료자원정보센터(CODA)

수정일
2024-12-11
SHARE 페이지주소 복사하기 인쇄
개요
  • 보건의료연구자원정보센터 시스템(Clinical & Omics Data Archive, 이하 CODA)은 2016년에 국립보건연구원에서 설립하였으며, 국가연구개발사업에서 축적된 보건의료 연구데이터와 자발적 정보 제공자로부터 수집하여 공유 확산을 위한 국가 보건의료연구자원정보 수집·공유 및 활용 플랫폼입니다.
내용
  • 국가연구개발사업 등 다양한 연구과제로부터 등록․기탁된 보건의료 연구자원*을 연구자들에게 분양하여 활용할 수 있도록 지원하고 있습니다.

    * 임상·역학정보, 오믹스정보, 건강기록, 이미지 데이터 등

  • CODA에서는 연구자들을 위해 보건의료 연구데이터를 활용할 수 있는 고성능 분석 인프라를 제공하여 인프라 사각지대에 있는 연구자들의 연구 편의를 지원합니다.
주요자원현황
  • 공개자원 현황
    • 질환, 감염병, 일반인, 암, 만성질환 등 176개 DB를 수집·정제하여 고품질 보건의료 연구데이터 약 77만건(약 3PB)를 공개 중입니다.
    공개자원 현황 연번 DB명 공개년월 정보유형로 구성
    연번 DB명 공개년월 정보유형
    1 KoGES 전장유전체 DB ’22.8., ’23.4. KoGES 5,000명의 임상·역학변수(1차 199개, 2차 202개), 유전체정보(FASTQ, BAM, gVCF, VCF) 569.8TB
    2 대장암 DB ’22.8., ’23.6. 대장암 322명의 임상·역학변수(1차 88개, 2차 95개), 유전체정보(BAM, VCF) 48.17TB
    3 자페증 DB ’22.8., ’23.5. 자폐증 892명의 임상·역학변수(1차 69개, 2차 73개), 유전체정보(BAM, gVCF, VCF) 42.4TB
    4 희귀질환 DB ’22.9., ’23.5. 희귀질환 14,905명의 임상·역학변수(1차 19개, 2차 23개, 추가 26개), 유전체정보(FASTQ, BAM, gVCF, VCF) 1,860.97TB
    5 울산게놈 DB ’22.12., ’23.4. 울산시 일반인 2,504명의 임상·역학변수(1차 112개, 2차 117개), 유전체정보(BAM, gVCF, VCF) 94.84TB
    6 K-MASTER DB ’23.4. 고형암 7,305명의 임상·역학변수(128개), 유전체정보(FASTQ, BAM, VCF) 48TB
    7 폐암 DB ’23.7. 폐암 84명의 임상·역학변수(19개), 유전체정보(VCF) 1.4GB
    8 치매 DB ’23.7. 치매 995명의 임상·역학변수(139개), 유전체정보(BAM, BAI, VCF) 48.58TB
    9 코로나19 DB ’23.8. 코로나 19 확진자 659명의 임상·역학변수(2020 245개, 2021 320개), 유전체정보(WGS, Cytokine, COVID-seq, HLA typing, Bulk TCR-seq, Bulk BCR-seq, scRNA-seq, SNP array) 118.13TB
    10 간호사 건강 연구(KNHS) DB ’23.9. 간호사 20,613명의 임상·역학변수(404개)
    11 KoGES 지역사회기반 코호트 ’24.2. 10,030명의 임상·역학변수(기반 2,479개, 1차 2,310개, 2차 3,023개, 3차 2,627개, 4차 2,989개, 5차 3,141개, 6차 2,930개, 7차 2,395개, 8차 2,482개, 9차 2,545개)
    12 KoGES 농촌기반 코호트 28,337명의 임상·역학변수(기반 1,578개, 1차 1,405개, 2차 1,405개, 3차 1,404개, 4차 746개)
    13 KoGES 도시기반 코호트 173,195명의 임상·역학변수(기반 2,401개, 1차예비 959개, 1차 1,606개)
    14 KoGES 기반조사 통합자료 211,562명의 임상·역학변수(201개)
    15 KoGES 추적조사 통합자료 10,030명의 임상·역학변수(502개)
    16 KoGES 쌍둥이 및 가족코호트 3,202명의 임상·역학변수(1,221개)
    2,030명의 임상·역학변수(1,048개)
    17 미진단 희귀질환 DB ’24.5. 56명의 임상·역학변수(9개), 유전체정보(WES VCF) 194MB
  • 활용 현황
    • CODA는 임상・역학정보, 오믹스정보 등을 보건의료 연구자에게 제공하고 있으며, 데이터 활용 연구 수요는 계속 증가 추세입니다.
      활용 연도 임상·역학정보 오믹스정보 활용 과제 로 구성
      연도 임상·역학정보 오믹스정보 활용 과제
      2022 31,971 160,569 3,049,941
      2023 44,055 174,821 90,465
      2024.7월 현재 14 23 25
  • CODA 분석 인프라
    • CODA에서는 보건의료 연구자들에게 정보분석을 위한 분석 인프라와 웹 분석 서비스를 지원하고 있습니다. 분석 인프라는 CODA 분양 승인 후 신청하여 사용할 수 있으며, 웹 분석 서비스는 별도의 승인 절차 없이 활용이 가능합니다. 이용을 원하시는 분께서는 CODA 홈페이지를 통해 분석 인프라 사용 신청을 하시길 바랍니다.
    • ❶ 한국인 임퓨테이션 서비스
      • - 한국인 임퓨테이션 서비스 (Korean Imputation Service, 이하 KIS)는 웹 기반 임퓨테이션 서비스입니다. 임퓨테이션이란 유전체 칩 정보를 전염기서열정보 수준으로 확장하여 정보 활용을 극대화하는 방법입니다. 국립보건연구원에서 구축한 한국인 4,799명의 전염기서열정보로 한국인 참조패널을 지원하여 한국인 유전체 연구의 정확도 향상을 지원하고 있으며, 슈퍼컴퓨터 기반으로 분석하여 빠르게 분석 결과를 얻을 수 있습니다. 또한, 웹 기반 임퓨테이션 서비스를 통해 쉽게 분석을 진행할 수 있습니다.
    • ❷ 국립보건연구원 피웹(PheWeb) 서비스
      • - 국립보건연구원 피웹 (Korea National Institute of Health Phenome-Wide Association Study Web Service, 이하 KNIH PheWeb)은 다양한 질병 및 표현형에 대한 연관성 분석 결과 공유 및 검색 기능을 제공하는 웹 서비스입니다. 연구자가 관심 있는 유전변이나 유전자, 특정 질병 등으로 검색하여 다양한 질병 및 표현형과의 연관성을 확인 할 수 있습니다. 또한, 연관성 분석 결과를 맨하튼 플롯*, 지역 플롯** 등 시각적으로 제공하여 연구자가 쉽고 빠르게 직관적으로 해석이 가능한 장점이 있습니다. 검색 결과와 제공하고 있는 연관성 분석 결과를 받아 통합 분석을 수행할 수 있어 다양한 연구에 활용할 수 있습니다.
이용안내
  • 등록 • 기탁 절차
    • 연구데이터를 등록․기탁 하기를 원하시는 연구자께서는 CODA 홈페이지의 등록․기탁 신청 메뉴를 통하여 신청해주시기 바랍니다. 신청 후 승인 절차를 거쳐 CODA에 등록․기탁이 완료되게 됩니다.
      등록·기탁 절차 안내
      1. 01 로그인
        회원가입 및 디지털 원패스 인증
      2. 02 신청
        등록·기탁 과제정보 입력
        등록·기탁하고자 하는 과제정보 및 기탁신청자 정보 등록
        등록·기탁 필수서류 등록
        등록·기탁심의를 위해 필요한 서류 업로드
        등록· 기탁 데이터 등록
        업로드 및 하드디스크 발송
      3. 03 등록·기탁 검토
        등록·기탁 데이터 검토 및 QC
        등록·기탁 관련 서류 검토 및 데이터 품질 검토
      4. 04 등록·기탁 완료
        데이터 등록
        최종 승인완료된 등록기탁 건은 신청기관에서 등록기탁신청 공문 접수를 통해 공식적으로 데이터 등록 완료
        등록·기탁이전협약
        데이터 등록 완료 후 기관 간 인체자원기탁이전협약서 작성을 통한 협약 체결
  • 분양 신청
    • 연구데이터를 분양하기 원하시는 연구자께서는 분양 신청 메뉴를 통하여 데이터 분양 신청을 하시기 바랍니다. 분양 신청 이후 분양심의를 거쳐 연구자께 데이터가 분양됩니다.
      분양 신청 절차 안내
      1. 01 로그인
        회원가입 및 디지털 원패스 인증
      2. 02 검색
        보건의료연구자원정보센터시스템에 등록되어 있는 데이터를 원하는 검색조건에 따라 검색
      3. 03 신청
        분양 필수서류 등록
        분양심의를 위해 필요한 서류 업로드
      4. 04 분양 심의
        분양 심의위원회 개최
        데이터 분양 승인여부 결정
      5. 05 데이터 분양
        최종 승인된 데이터 분양 방문분석 원격분석
      6. 06 데이터 폐기
        분양 데이터의 이용기간 만료일이 도래하면 정해진 기간 안에 데이터 폐기 확인서 업로드 및 데이터 폐기
      7. 07 성과물등록
        분양받은 데이터의 연구 성과물 업로드
  • 분석 인프라 신청
    • CODA는 연구자들에게 정보분석을 위한 분석 인프라를 지원하고 있습니다. 분석 인프라는 CODA 데이터 분양 승인 후 분석 인프라 신청 절차에 따라 이용할 수 있습니다.
      분석 인프라 신청 안내
      1. 01 로그인
        회원가입 및 디지털 원패스 인증
      2. 02 신청
        분석 인프라 신청
        필요 분석 프로그램 설치 및 데이터 반입 요청
      3. 03 관리자 승인
        신청 정보 확인 및 인프라 배정
        분석에 필요한 인프라 배정 후 사전에 신청한 프로그램 및 데이터 확인
      4. 04 데이터 분석
        데이터 분석을 위하여 보건의료연구자원정보센터에 방문하여 데이터 분석
      5. 05 데이터 반출
        데이터 분석 완료 후 결과 데이터 반출
connect