[오스틴=IT동아 강일용 기자] 옵테론(Opteron), 참으로 영욕의 이름이다. AMD의 서버 및 워크스테이션 프로세서였던 옵테론은 한때 시장 점유율 20%를 확보하며 인텔 제온과 데이터센터(IDC), 슈퍼컴퓨터(HPC) 시장을 양분했다. 특히 뛰어난 병렬 데이터 처리 능력을 바탕으로 전 세계 슈퍼컴퓨터 상위 500대 대부분이 옵테론을 활용해 제작되던 시절도 있었다.
하지만 불도저 아키텍처의 실패로 AMD가 흔들리면서 옵테론의 명백도 끊기고 만다. 때문에 전 세계 IDC와 클라우드 컴퓨팅 시장은 인텔 제온 천하가 되고 만다. 인텔은 현재 데이터센터용 프로세서 시장을 98% 이상 점유하고 있다.
AMD가 라이젠으로 일반 사용자용 프로세서 시장에서 재기하면서, 서버 및 워크스테이션 시장에서도 반등을 꾀하고 있다. 비결은 바로 옵테론의 후속 제품인 '에픽(EPYC)'이다. 지난 6월 AMD는 애널리틱스 데이를 개최하고 전 세계 기자와 애널리스트들에게 에픽을 공개했다. 에픽의 가장 큰 특징은 현재 IT 시장의 가장 큰 화두인 인공지능을 지탱하는 기술인 딥러닝(Deep Learning, 심층신경망) 구현에 최적화된 프로세서라는 것이다.
에픽은 현재 서버 시장의 주류인 듀얼 소켓(CPU 2소켓) 서버와 싱글 소켓(CPU 1소켓) 서버에 대응하기 위한 제품이다. 라이젠과 동일한 젠 아키텍처 기반의 MCM(Multi Chip Module) 형태로 설계된 CPU다. (MCM은 CPU 내부에 두 개 이상의 칩을 배치하는 방식으로 병렬연산에는 강해지지만 칩간의 데이터 공유 능력이 떨어지면 단일연산에는 취약해지는 단점이 일어나는 설계 방식이다. 주로 AMD와 IBM이 자주 이용하고 있으며, 엔비디아도 도입할 계획이다.)
인공지능 시대를 위한 프로세서
에픽은 모델 별로 최소 8코어 16스레드에서 최대 32코어 64스레드를 제공하며, 모든 모델이 PCI 익스프레스 128레인을 지원한다. 여기서 모든 모델이 PCI 익스프레스 128레인을 지원하는 점을 눈 여겨 봐야 한다.
현재 인공지능은 딥러닝 기술을 활용해 기계에게 학습능력을 부여하는 방식(딥러닝 기반의 머신러닝)으로 개발되고 있다. 딥러닝은 수 많은 인공신경망을 클라우드 컴퓨팅 또는 슈퍼컴퓨터 내부에 생성하는 방식으로 구현되는데, 이러한 대규모 인공신경망 구현을 위해 필요한 것이 바로 병렬로 연결된 GPGPU다. 즉, 현재 인공지능 기술은 데이터 처리는 GPGPU가 담당하고, CPU는 이러한 GPGPU를 관리하는 관리자 역할만 한다. CPU가 관리자와 연산자 역할을 모두 담당했던 과거의 프로그램 처리와는 대조적인 모습이다.
에픽은 하나의 CPU에 최대 6대의 GPGPU를 병렬로 연결할 수 있다. 하나의 CPU로 6대의 GPU를 관리할 수 있는 것이다. 경쟁 제품인 인텔 제온이 PCI 익스프레스 48레인만 지원하기 때문에 하나의 CPU에 3대의 GPGPU만 연결할 수 있는 것과 대조적이 모습이다. 제온으로 6대의 GPGPU를 관리하려면 2개의 CPU가 필요하다. 게다가 1대 당 PCI 익스프레스 16레인을 차지하는 GPGPU의 특징 상 6대의 GPGPU를 연결하면 저장장치를 연결할 수 있는 대역폭이 남지 않는다(96레인, 16x6). 때문에 별도의 스토리지 컨트롤러가 반드시 필요하다. 반면 에픽은 32레인의 여유가 있기 때문에 별도의 스토리지 컨트롤러 없이 CPU에 저장장치를 바로 연결해서 관리할 수 있다.
즉, 에픽은 제온보다 더 저렴하게 딥러닝 구현을 위한 하드웨어 시스템을 구축할 수 있는 뜻. 인공지능 시대에 어울리는 CPU인 것이다.
<AMD 에픽과 인텔 제온의 딥러닝 머신 구축 구조 비교. 128레인을 지원하는 에픽이 훨씬 저렴하게 딥러닝 전용 머신을 구축할 수 있다>
인피니티 패브릭으로 듀얼 소켓의 데이터 처리 효율 상승
에픽은 듀얼 소켓용 모델 9종과 싱글 소켓용 모델 3종으로 구성되어 있다. 싱글 소켓용 모델은 제품 모델명 뒤에 P를 붙여서 구분한다. 제온 E3처럼 소형 서버와 워크스테이션에 대응하기 위한 8코어 모델(에픽 7200 시리즈)부터 제온 E5처럼 대형 서버와 클라우드 컴퓨팅 IDC에 대응하기 위한 16코어 모델(에픽 7300 시리즈)과 24코어 모델(에픽 7400 시리즈), 그리고 제온 E7처럼 대규모 IDC와 슈퍼컴퓨터(HPC)를 위한 32코어 모델(에픽 7500 시리즈)까지 모든 라인업을 갖추고 있다.
에픽은 라이젠과 동일한 젠 아키텍처를 이용하고 있지만, 보안만을 전담하는 ARM Cortex A5 보조 프로세서를 도입해 서버와 워크스테이션을 위한 강력한 하드웨어 보안 기능을 제공한다.
특히 최신 양방향 통신 기술인 '인피니티 패프릭(Infinity Fabric)'을 도입해 듀얼 소켓 서버의 CPU간의 병렬 처리 효율을 향상시켰다. 기존 병렬 처리 기술의 경우 1+1이 2가 되는 경우가 매우 드물었다. 기껏해야 1.5가 되는 경우가 많았다. 인피니티 패브릭은 최대 90%까지의 데이터 처리 효율을 보여준다. 아직은 1+1이 2가 되지는 않지만, 인피니티 패브릭을 활용하면 효율을 1.9까지 끌어올릴 수 있다.
에픽의 가격은 모델 별로 400~1200 달러 선이다.
스캇 에일러 AMD 부사장은 "에픽의 벤치마크 테스트 결과 최상위 모델인 EPYC 7601가 인텔 제온 E5-2699A V4보다 최대 47% 뛰어난 성능을 나타냈다"며, "이러한 에픽의 성능을 바탕으로 클라우드 시장과 HPC 시장의 점유율을 되찾아올 것"이라고 자신감을 드러냈다.
AMD의 GPGPU, 라데온 인스팅트
이날 AMD는 에픽과 함께 베가, 피지, 폴라리스 아키텍처 기반의 GPGPU 라데온 인스팅트(Radeon Instinct)를 공개했다. 라데온 인스팅트는 MI25, MI8, MI6 등 아키텍처가 다른 세 가지 모델로 구성되어 있다. MI25는 베가 아키텍처 기반의 플래그십, MI18은 피지 아키텍처 기반의 소형 모델(제품 사이즈 자체가 미니 사이즈로 다른 GPGPU에 비해 매우 작다. 공간절약을 위한 모델이다), MI6는 폴라리스 아키텍처 기반의 보급형 모델이다.
최상위 모델인 라데온 인스팅트 MI25의 경우 경쟁 제품인 엔비디아 테슬라 V100과 비교해 75% 정도의 딥러닝 구현을 위한 반정밀도 부동소수점 연산(FP16) 능력을 보여준다. 라데온 인스팅트를 정식으로 출시함에 따라 AMD는 파이어스트림 이후 명맥이 끊겼던 인공지능과 암호해독을 위한 GPGPU 라인업도 갖추게 되었다.
글 / IT동아 강일용(zero@itdonga.com)