ⓒ데일리포스트=이미지 제공/Meta

[데일리포스트=김정은 기자] 최근 메타버스 사업에 주력하고 있는 메타(구 페이스북)가 현재 가동중인 AI 슈퍼컴퓨터 가운데 가장 빠른 'AI 리서치 슈퍼클러스터(AI Research SuperCluster, 이하RSC)'를 구축하고 있다고 발표했다. 

AI 개발에는 초당 수십억회의 연산 능력를 갖춘 계산에 특화된 AI 슈퍼 컴퓨터가 필요하다. 메타는 이미 RSC를 가동중이다. 2022년 중반 완전하게 구축을 완료하면 1만 6000개 GPU를 탑재한 세계에서 가장 빠른 AI 슈퍼컴퓨터가 될 전망이다.

메타 연구팀은 RSC를 기반으로 자연언어처리 및 컴퓨터 비전의 대규모 모델을 학습하기 시작했으며, 앞으로 몇 조의 매개 변수를 가진 모델을 학습하게 된다.  

ⓒ데일리포스트=이미지 제공/Meta

2013년 '페이스북 AI 리서치 랩(Facebook AI Research Lab)'을 설립한 이래 메타(당시 페이스북)는 AI에 장기 투자를 하고 있으며, 2017년 NVIDIA V100 Tensor Core GPU를 2만2000기 탑재한 1세대 AI 슈퍼 컴퓨터를 구축해 일일 35,000회의 트레이닝 작업을 수행해 왔다.

RSC에는 NVIDIA DGX A100이 760기 탑재돼 있다. 1기의 DGX A100에, V100보다 강력한 NVIDIA A100 Tensor Core GPU가 8기 탑재되어 GPU 총합은 6080기에 달한다. 또 스토리지는 175PB, 캐시는 46PB, 퓨어스토리지 플래시블레이드는 10PB다. 

ⓒ데일리포스트=이미지 제공/Meta

RSC는 V100 탑재 모델에 비해 컴퓨터 비전 워크플로우를 최대 20배 고속으로 실행할 수 있고, NCCL(NVIDIA Collective Communication Library)도 9배 이상 빠르다. 이를 통해 수백억 개의 매개 변수를 가진 모델의 트레이닝을 불과 3주 만에 완료할 수 있는 놀라운 성능을 제공한다. 

메타에 다르면 이는 1세대 수준이며, 완전히 구축될 2세대에서는 DGX A100이 1000기로 늘어 GPU 총수는 총 1만 6000기가 된다.  

저작권자 © 데일리포스트 무단전재 및 재배포 금지