ㅣ데일리포스트=김정은 기자ㅣ챗GPT와 미드저니(MidJourney) 등 생성형 AI가 막대한 정보 제공을 넘어, 창의성 분야에서도 그 존재감을 높이고 있다.
AI와 인간의 아이디어를 평가한 실험 결과, AI가 창의적 사고에서 인간 평균보다 유의미하게 높은 점수를 획득한 것으로 나타났다.
이번 논문은 국제학술지 '사이언티픽 리포트'(Scientific Reports)에 게재됐다.
핀란드 투르쿠대 미카 코이비스토 교수와 노르웨이 베르겐대 시몬 그라시니 교수 연구팀은 실험 참여자 256명과 3종의 생성형 AI에 주제를 주고 답변을 비교하는 실험을 진행했다.
실험 참여자 256명은 ▲여성 108명 ▲남성 145명 ▲기타 및 성별을 밝히고 싶지 않은 3명으로 구성됐고, 연령은 19~40세, 평균 연령은 30.4세였다.
연구팀은 오픈AI가 개발한 생성형 챗봇인 '챗GPT3.5'와 '챗GPT4', 챗GPT3.5 기반의 '카피.AI(Copy.Ai)'의 3가지를 사용했다.
실험은 밧줄·상자·연필·촛불 등 4가지 사물에 대해 원래와 다른 대체적인 용도를 최대한 많이 고안하는 방식의 '확산적 사고 실험'으로 진행됐다. 응답 독창성은 짧은 시간 내에 가능한 한 많은 대체 용도를 생각해내는 '대체 용도 과제'(AUT:Alternate Uses Task)를 통해, '의미적 거리'(응답이 본래의 용도와 얼마나 가까운지)와 '창의성'의 두 가지로 평가했다.
의미적 거리는 분석용 계산 기법으로 0~2점, 창의성은 6명의 사람이 1~5점 척도로 주관적으로 평가했다. 평가자는 AI의 아이디어가 섞여 있는지 모르는 상태였다.
집계 결과 AI 독창성 점수의 평균점이 '의미적 거리'와 '창의성' 모두에서 인간의 평균점을 유의하게 웃돈 것으로 나타났다. 다만 최고점은 인간이 더 높은 것으로 나타났다.
아래는 실험 결과를 나타낸 그래프다. 의미적 거리의 평균점(A)과 최고점(B), 창의성 평균점(C)과 최고점(D)을 보여준다.
평균점을 보면 의미적 거리에서는 0.95대 0.91로 AI가 앞섰고, 창의성에서도 2.91대 2.47로 AI가 인간을 앞질렀다. 반면, 인간의 응답은 AI에 비해 편차가 크고 최소 점수가 AI보다 훨씬 낮았지만, 최고 점수에선 8개 평가 항목 중 7개가 AI의 최고 점수를 웃돌았다.
특히 챗GPT4가 창의적 사고에서 우수한 것으로 확인됐다. 주제별 창의성 평균 점수에서 연필(C) 외에는 가장 뛰어난 성적을 거두었다.
이번 연구에 대해 코이비스토 교수는 "이는 가장 전형적인 창조적 사고 테스트인 AUT에서 AI가 이미 평균적인 인간의 아이디어 생성 능력과 동등하거나, 혹은 이를 웃도는 수준임을 시사한다. 가장 우수한 인간이라면 여전히 챗봇과 경쟁할 수 있다. 그러나 AI 기술은 급속히 발전하고 있어 반년 후에는 결과가 달라질 수 있다"고 언급했다.
- 챗GPT, "전문의 17명이 실패한 7세 소년 통증 원인 찾았다"
- 美빅테크 AI 패권경쟁...메타도 본격 가세
- 급성장 메타 '스레드' vs 최대 위기 '트위터'
- 일론 머스크, AI 스타트업 'xAI' 출범 발표
- "열풍 지나고 역풍?" 챗GPT, 이용자 감소에 연이은 소송까지
- 애플, 챗GPT 사내 이용 금지...정보 유출 우려
- 창의적인 사람의 조건? "지루한 시간도 즐긴다"
- 아마존, 연말 쇼핑시즌에 'AI 광고' 총력전
- 빅테크·AI 스타트업 '윈-윈'..."투자금은 클라우드로 회수"
- 대규모 언어 모델을 이용한 '3D-GPT' 등장
- 구글 참전으로 판 커진 AI 플랫폼 패권 경쟁
