ⓒ데일리포스트=이미지 제공/Pixabay

ㅣ데일리포스트=김정은 기자ㅣ오픈AI가 개발한 인공지능 챗봇 서비스 '챗GPT' 등 정교한 대규모 언어모델(LLM)이 등장하면서 AI가 생성한 문장인지 사람이 생성한 문장인지 구분하기가 점차 어려워지고 있다.

최근 미국 스탠퍼드대 인간중심인공지능연구소(HAI) 연구팀이 "특정 문장이 AI에 의해 쓰여졌는지 여부를 사람이 정확하게 특정할 수 있는 확률은 약 50%에 불과하다"는 연구 결과를 발표했다. 

논문은 국제학술지 '미국국립과학원회보(PNAS)'에 게재됐다. 

 ⓒ데일리포스트=이미지 제공/PNAS(2023.03)

AI가 생성한 텍스트는 우리 일상 속에 깊게 파고들고 있다. 가령 마이크로소프트(MS)의 빙(Bing)에는 챗GPT가 탑재돼, 대화하는 형태로 손쉽게 정보를 검색할 수 있다. 또 글로벌 보안소프트웨어 기업 맥아피(McAfee) 조사에 따르면 성인 31%가 데이트 앱 프로필에 AI를 사용할 계획이 있거나 이미 사용하고 있다고 답했다.

미국 스탠퍼드대 인문과학대학원 커뮤니케이션학 교수이자 HAI 연구원인 제프 핸콕((Jeff Hancock) 박사 연구팀은 ▲온라인 데이팅 앱 '오케이큐피트(OKCupid)' ▲글로벌 숙박공유업체 '에어비앤비(Airbnb)' ▲일자리 중개 앱 '구루닷컴(Guru.com)'을 통해 사람이 '사람이 쓴 글'인지 'AI가 쓴 글'인지를 얼마나 정확하게 파악할 수 있는지 조사했다.

4600명의 실험 참여자들은 ▲오케이큐피트 ▲에어비앤비 ▲구루닷컴에서 제시한 문장 샘플을 보고 해당 문장이 사람이 작성한 것인지, 아니면 AI가 작성한 것인지를 판단했다. 

그 결과, 50~52% 정확도로 구분이 가능한 것으로 나타났다. 이는 동전 던지기 확률 수준에 불과한 것으로, AI가 쓴 문장을 사람이 판별하는 것은 매우 어렵다는 것을 시사한다. 

 ⓒ데일리포스트=이미지 제공/Unsplash

다만 실험 참여자들은 이를 무작위로 판단하는 것은 아니었으며, 일련의 특징을 보였다. 예를들어 문법이 정확하고 일인칭 대명사를 사용하는 특징을 갖춘 문장은 사람이 쓴 것으로 판단했다. 그 외에 가정생활을 언급하거나 캐주얼한 구어문을 사용하는 경우도 사람이 썼다고 여겼다.  

핸콕 박사는 "매우 우려스러운 결과다. AI의 발전 속에 기계가 우리보다 사람답다고 여기고, AI의 텍스트로 사람을 속일 가능성도 있다"고 언급했다. 

이어 "AI가 생성하는 콘텐츠 양은 불과 몇 년 만에 사람이 생성하는 콘텐츠를 추월할 것이다. 그렇게 되면 우리의 정보체계는 붕괴되고, 서로에 대한 신뢰도 저하될 수 있다"고 경고했다.

핸콕 박사는 "우리는 종종 기술에 주목하지만, 이 기술을 사용하고 적응하는 것은 결국 우리 인간이라는 사실을 간과하고 있다. AI 사용을 통제할 방법을 고민하고, 규범을 만들고, 나아가 부정적 사용을 제한하는 정책과 법률을 만들 필요성이 한층 높아지고 있다"고 전했다. 

저작권자 © 데일리포스트 무단전재 및 재배포 금지