적응형(Adaptive) 가속컴퓨팅 기술을 활용한 코어 인프라 개선법 ①

최태우 기자 / 기사승인 : 2020-06-18 13:14:50
  • -
  • +
  • 인쇄
▲ [source=pexels]
데이터 중심의 상시 동작이 가능한 AI 시대가 다가오면서 오늘날의 기술 및 폼 팩터 성능을 넘어서는 대역폭 향상에 대한 요구가 높아지고 있다. 이를 위해서는 현재의 CPU나 GPU 기술의 한계를 극복할 수 있는 확장이 가능하고 보다 효율적인 퍼베이시브 컴퓨팅(Pervasive Compute)이 필요하다.

데이터 중심의 상시 동작이 가능한 AI 시대
데이터가 세상을 변화시키고 있다. 데이터의 이동 및 관리, 분석은 모든 분야의 중심이 되고 있다.

도시계획과 건강관리, 환경보호, 비즈니스 개선 등과 같은 다양한 목적으로 데이터를 수집하는 원격 IoT 엔드 포인트에서 컨텐츠 스트리밍과 온라인 생활 공유는 물론, 상시 연결된 개인용 IoT기기의 사용 증가, 엔터프라이즈 및 과학연구를 위한 AI 기반 애플리케이션 증가에 이르기까지 모든 분야에서 데이터의 중요성은 높아지고 있다.

디지털 생활방식과 새롭게 부상하는 IoT는 불가피하게 클라우드의 컴퓨팅 및 데이터 서비스의 급속한 증가를 촉발하게 된다. 여기에서 클라우드는 새로운 생활 및 업무 방식의 중심에 있다.

이동 중에도 액세스가 가능하도록 대량의 개인용 컨텐츠를 저장하고, 주문형 음악 및 비디오 스트리밍 서비스를 호스팅하고, 산업 및 엔터프라이즈 데이터를 수집 및 분석하고, 재무분석, 데이터베이스 검색, 유전자 서열분석과 같은 작업을 위해 주기적으로 비용 효율적으로 액세스할 수 있는 강력한 소프트웨어 애플리케이션을 구현하는데 있어 클라우드는 가장 중요한 핵심 요소다.

새로운 실시간 셀룰러 서비스를 가능하게 하는 MMTC(Massive Machine-Type Communication) 및 ULLC(Ultra-Low-Latency Communication)를 도입한 5G 뉴라디오(NR)이 부상하면서 백홀과 메트로, 코어 네트워크의 용량과 성능 향상에 대한 요구도 늘고 있다.

코어 인프라에 대한 압력 증가
오늘날의 모든 클라우드와 데이터센터, 이동통신 및 셀룰러 백홀 네트워크 전반에 걸쳐 데이터 대역폭 및 컴퓨팅 처리량에 요구가 폭발적으로 증가하고 있다.

이로 인해 데이터센터 내외부 링크를 비롯해 지리적으로 분산된 데이터센터 사이트를 연결하는 DCI(Data Centre Interconnect) 및 인프라 인터페이스 카드는 물론, 가속기 카드와 같은 핵심 구성요소들의 혁신이 요구되고 있다.

실제로 코어 인프라의 데이터 대역폭에 대한 요구는 명목상으로 연평균 51%(CAGR) 증가한 것으로 나타났지만 트래픽 용량에 대한 요구는 5G 출시로 인해 약 1백배까지 증가할 것으로 예상되고 있다.

이러한 요구에 부합하는 보다 높은 성능의 새로운 장비를 구현하기 위해 프로토콜 프로세싱 및 인터페이스 칩과 같은 개별 컴포넌트를 이용하게 되면, 시간이 많이 소요되고 복잡할 뿐만 아니라 성능 요구에 따른 확장이 불가능하게 된다.

또 이러한 방식으로 설계된 시스템은 크고, 전력소모가 매우 높기 때문에 데이터센터 및 인프라 장비의 점유면적 및 전력소모, 열관리에 대한 제약조건을 충족할 수 없게 된다. 차세대 장비는 기존의 물리적, 전기적, 열적 제한조건 내에서 성능을 대폭 향상시켜야 한다.

가능한 시장에 빨리 출시하기 위해서는 최종 사양이 합의되기 이전에 최신 프로토콜 및 표준을 이용해 설계 작업이 시작되어야 하는 이슈도 있다. 시장 출시를 앞당겨야 하는 장비 공급업체들은 사양이 완성될 때까지 기다릴 수 없다. 따라서 프로젝트의 진행에 따라 하드웨어 레벨에서 적응이 가능한 유연성이 필요하다.

획기적인 프로그래머블 가속기가 필요한 이유
고밀도 FPGA 및 프로그래머블 시스템온칩(SoC) IC(MPSoC)와 같은 프로그래머블 로직 디바이스는 기존의 CPU나 GPU 아키텍처로는 충분히 빠르게 실행할 수 없거나 전력 규격을 충족시키지 못하는 작업부하를 위한 가속기로 채택되고 있다.

이러한 프로그래머블 로직 디바이스는 신호 프로세싱 및 최근의 신경망과 같은 특정 컴퓨팅 작업을 매우 효과적으로 오프로드할 수 있는 고도의 병렬처리 기능과 함께 프로그래머블 디바이스 고유의 적응성을 제공한다.

최근에는 보다 까다로운 성능과 대역폭, 전력 및 통합 목표를 충족시키기 위해 적응형 컴퓨팅 가속화 플랫폼(Adaptive Compute Acceleration Platform, ACAP)이라는 새로운 차원의 프로그래머블 디바이스가 등장했다.

자일링스(Xilinx)의 버샬(Versal) ACAP은 프로그램이 가능한 네트워크온칩(NoC) 인터커넥트를 통해 긴밀하게 연결된 지능형 AI/DSP 컴퓨팅 엔진과 FPGA 로직 패브릭에 해당하는 적응형 엔진을 포함, 애플리케이션 프로세싱 및 실시간 스칼라 엔진 어레이를 하나로 탑재하고 있다.

DDR4와 100G 이더넷, PCIe 5세대(Gen5) 및 멀티 기가비트 광학 인터페이스를 비롯한 최신 인터페이스와 소프트웨어 제어 플랫폼 관리 기능도 통합됐다.

버샬 DSP 엔진은 디지털 신호 프로세싱은 물론, 넓은 동적 버스 시프터와 메모리 어드레스 생성기, 와이드 버스 멀티플렉서 및 메모리 매핑 I/O 레지스터를 비롯해 애플리케이션의 속도 및 효율성을 높일 수 있도록 INT8 및 32bit 부동소수점 등과 같은 피연산자를 기본적으로 지원하는 향상된 DSP 블록을 갖추고 있다.

스칼라 엔진은 듀얼코어 ARM Cortex-A72 애플리케이션프로세서와 듀얼코어 ARM Cortex-R5F 실시간 프로세싱 장치로 구성된다. 이러한 이기종 엔진은 시간이 지나면서 변화하는 작업 부하나 알고리즘 구현 또는 신경망 모델의 발전에 따라 재프로그램이 가능한 점도 ACAP의 장점 중 하나다.

▲ 그림 1. 112Gb/s PAM4와 600G 이더넷, 600G 인터라켄과 400G HSC를 지원하는 버샬 프리미엄 ACAP
이러한 새로운 차원의 혁신적인 프로그래머블 디바이스를 기반으로 구현된 버샬 프리미엄(Versal Premium) 시리즈는 오늘날 코어 인프라에 대한 성능 압박을 해결하기 위해 설계된 ACAP이다.

고대역폭 디바이스로서 높은 컴퓨팅 밀도와 추가로 제공되는 전용 고속 암호화(High-Speed Cryptographic, HSC) 엔진 및 최신 네트워크 인터페이스도 갖췄다.

집약적인 네트워크 커넥티비티는 최신 이더넷 및 인터라켄(Interlaken) 레이트와 프로토콜을 지원하는 최대 9Tb/s의 총 양방향 대역폭을 갖춘 확장이 가능한 광 트랜시버를 비롯해 112Gb/s PAM4 트랜시버와 최대 400Gb/s의 고속 암호화 엔진을 갖춘 암호화 프로세싱과 적응형 하드웨어를 포함하고 있다(그림 1).

코어 및 메트로, DCI 인프라에 112G PAM4 트랜시버를 사용하면 기존의 58Gb/s PAM4 기술 대비 포트당 대역폭 밀도가 2배로 증가하여 전면 패널 랙 공간에 여유를 확보할 수 있으며, 통신 및 데이터센터 애플리케이션에서 단위 체적 당 대역폭을 2배로 늘릴 수 있다.

데이터의 페이로드를 전송하기 위한 지연시간도 약 50% 줄어들기 때문에 지리적으로 분산되어 있는 데이터센터를 상호 연결할 때 애플리케이션 응답성을 향상시키고 지연시간으로 인한 영향을 완화할 수 있다.

칩 상에 통합된 리소스는 자일링스의 16나노(nm) 버텍스 울트라스케일+(Virtex UltraScale+) FPGA의 최대 3배에 이르는 대역폭과 2배의 컴퓨팅 밀도를 제공한다. 애플리케이션별로 특화된 전용 OTN(Optical Transport Network) 프로세서와 비교하면, 애플리케이션 처리능력이 3배에서 5배까지 더 뛰어나다.

 

 

글 : 마이크 톰슨(Mike Thompson) / ACAP 제품군 수석매니저 / 자일링스

 

[저작권자ⓒ IT비즈뉴스. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

마켓인사이트

+

컴퓨팅인사이트

+

스마트카

+

PHOTO NEWS