의료 분야도 AI 편향성 우려...흑인·여성 질환 놓쳐

2025-04-03     김정은 기자
ⓒ데일리포스트=이미지 제공/Unsplash

ㅣ데일리포스트=김정은 기자ㅣ최근 인공지능(AI) 기술을 기반으로 진료 체계를 개선하고 환자에게 도움을 주기 위한 다양한 연구가 진행되고 있다. 그러나 일각에서는 AI 알고리즘의 편향 문제로 인해 AI 기술의 의료 적용에 신중해야 한다는 지적이 나온다. 

미국 캘리포니아 대학교 로스앤젤레스(UCLA) 연구팀이 스탠퍼드대에서 2022년 개발된 'CheXzero'라는 AI 모델을 통한 질환 검출 정확도를 검증한 결과, "흑인 및 여성 환자의 질환 검출에서 편향이 확인됐다"고 보고했다.

연구 결과는 국제학술지 '사이언스 어드밴시스 (Science Advances)'에 게재됐다.

CheXzero는 흉부 X선 이미지를 기반으로 질환을 검출하기 위해 사용되고 있는 AI 모델이다. 연구팀이 666장의 흉부 X선 영상 사진 데이터를 검증한 결과, ▲흑인 환자 ▲여성 환자 ▲40세 이하 환자의 경우 의사가 진단한 질환을 AI는 검출하지 못하는 비율이 높은 것으로 나타났다.

특히 흑인 여성 환자는 무려 절반의 비율로 심장 크기를 측정하는 '심비대증(Cardiomegaly) 등의 상태를 검출할 수 없었다. 이러한 문제는 스페인과 베트남 등 다른 지역의 데이터 세트에서도 동일하게 관찰됐다.

연구팀은 편향성의 원인을 찾기 위해 'CheXzero'가 흉부 X선 이미지에서 환자의 성별, 나이, 인종을 예측할 수 있는지 테스트했다. 그 결과, AI는 약 80%의 정확도로 인종을 식별하는 반면, 경험이 풍부한 방사선과 의사는 동일 테스트에서 최대 약 50%의 성공률에 그쳤다. 

이를 바탕으로 연구팀은 '방사선 이미지 내에 사람이 시각적으로 식별할 수 없는 숨은 신호가 있을 가능성이 있다'고 추정했다.

ⓒ데일리포스트=이미지 제공/Science Advances

편향성을 줄이기 위해 연구팀은 의도적으로 환자의 인종, 성별, 연령 정보를 X선 이미지와 함께 AI에 제공했다. 그 결과 진단을 놓치는 비율은 절반으로 감소했지만, 효과를 보인 것은 일부 질환에 그쳤다.

연구팀은 'CheXzero'의 머신러닝에 사용된 데이터 세트에 남성, 40-80세 연령층, 백인 환자가 상대적으로 많이 포함돼 있다며 더 다양한 데이터 세트를 활용해야 한다고 주장했다.

앞선 연구에서도 의료비 차이 등으로 흑인과 여성에 대한 불평등한 AI 의료 알고리즘이 표면화되고 있다는 지적이 나온 바 있다. 

미국 에모리 대학의 방사선과 의사인 주디 기초야(Judy Gichoya)는 "분명한 것은 AI가 가진 편향을 줄이는 문제는 매우 어렵다는 사실이다. AI를 테스트해 결함을 확인하고 우선 소규모라도 다양한 데이터 세트로 수정할 필요성이 있다"며 "의료 진단은 인간이 관여해야 한다. AI 단독으로 맡길 수 없다"고 언급했다.