가입하기

작업 용지

과학을 위한 데이터와 AI: 주요 고려 사항

본 논문은 인공지능(AI)을 위한 과학 데이터를 준비할 때 고려해야 할 기술적, 윤리적, 환경적 요인을 개괄적으로 설명하고, 이러한 요인들이 '오픈 사이언스' 운동과 어떻게 연계되는지 살펴봅니다. 제시된 정보는 과학 연구자, 데이터 전문가, 과학 단체, 그리고 정책 입안자들에게 유용한 정보를 제공합니다.

이 논문은 AI의 다양한 기술적 차원과 과학에 미치는 영향을 탐구하는 3부작 입문서 시리즈의 일부입니다.

  1. 과학 분야의 AI 유형
  2. 과학 분야에서 AI의 환경 영향에 대한 고려 사항
  3. 과학 분야의 AI를 위한 데이터

첫 번째 섹션 과학 데이터를 AI에 적합하게 만드는 기본 개념을 소개하고 그 이점과 과제에 대해 논의합니다.

두 번째 섹션 AI를 위한 데이터 준비성과 반대로 AI가 데이터를 큐레이션하는 데 있어 핵심 고려 사항을 살펴봅니다. 데이터 표준을 기반으로 기계 가독성 및 편향 완화와 같은 AI 관련 고려 사항을 논의하는 동시에, 과학 분야에서 AI를 위한 데이터 준비성과 관련된 윤리적 및 환경적 고려 사항을 강조합니다.

세 번째 섹션 오픈 사이언스 프레임워크 내에서 데이터 준비성에 대해 논의하고, 오픈 사이언스 관행이 과학 연구를 위한 AI 준비성을 어떻게 지원할 수 있는지 보여주는 두 가지 사례 연구를 제시합니다.

추천

  • 기존 데이터 프레임워크 및 표준과의 융합예를 들어, FAIR-R과 Croissant는 과학자와 데이터 관리자가 사용해야 합니다.
  • 데이터 거버넌스 구조 기술 표준을 넘어 형평성, 컴퓨팅 리소스 접근성, 역량 강화를 촉진해야 합니다.
  • 데이터 인프라 및 기술 개발에 대한 투자 과학 분야에서 AI를 효율적이고 경쟁적으로 활용하기 위한 전제 조건입니다.
  • 인정 데이터 관리 경력 과학 분야에서 이러한 기술을 장려하기 위한 인센티브를 제공하는 것이 위 투자의 초석이 되는 구현 경로입니다.

과학을 위한 데이터와 AI: 주요 고려 사항

2025년 9월

DOI : 10.24948 / 2025.11


본 연구는 캐나다 오타와에 위치한 국제개발연구센터(IDRC)의 지원금으로 수행되었습니다. 본 보고서에 표현된 견해는 IDRC 또는 이사회의 견해를 반드시 대변하는 것은 아닙니다.