데이터처리프로세서(DPU), 가속컴퓨팅 환경 구현의 또 다른 핵심요소

최태우 기자 / 기사승인 : 2020-06-09 09:04:31
  • -
  • +
  • 인쇄
▲ [source=pixabay]
중앙처리장치(CPU)는 유연성과 대응력이 뛰어나서 수년간 대부분의 컴퓨터에서 프로그래밍 가능한 유일한 요소였다. 그러나 최근에는 그래픽처리장치(GPU)가 컴퓨팅의 중심 역할을 하고 있다.

본래 풍부한 실시간 그래픽을 제공하기 위해 고안됐던 GPU는 병렬처리 능력으로 모든 다양한 컴퓨팅 작업을 가속화하고, 인공지능(AI), 딥 러닝, 빅데이터 분석 애플리케이션을 구축하는데 핵심이 됐다.

CPU와 GPU를 통해 지난 10년 간 컴퓨팅은 개인용PC와 서버를 넘어 하이퍼스케일 데이터센터로 확장됐다. 이러한 데이터센터는 새로운 범주의 강력한 프로세서와 함께 구성된다.

젠슨 황 엔비디아 창립자 겸 CEO는 CPU와 GPU에 이어 데이터처리장치(Data Processing Unit, DPU)가 데이터 중심의 가속컴퓨팅의 또 하나의 핵심 축이 될 것이라고 밝히기도 했다. CPU는 범용컴퓨팅, GPU는 가속컴퓨팅을 위한 것이라면 데이터센터에서 데이터를 이동시키는 DPU는 데이터 처리에 최적화됐다는 말이다.

그렇다면 프로그래밍이 가능한, 새로운 종류의 프로세서인 DPU란 무엇일까? 우선, 업계 표준의 소프트웨어 프로그래밍 가능 멀티코어 CPU다. 일반적으로 널리 사용되는 ARM의 아키텍처로 설계되었고, 다른 시스템온칩(SoC) 구성요소와도 밀접하게 결합된다.

고성능 네트워크 인터페이스로 데이터를 파싱(parsing) 및 처리하고 데이터를 GPU 및 CPU로 효율적으로 전송하는 기능도 담당한다.

아울러 유연하며 프로그래밍 가능한 가속화엔진도 탑재해 인공지능/머신러닝(AI/ML), 보안, 통신, 스토리지를 위한 애플리케이션 성능을 오프로드해 리소스를 효율적으로 활용할 수 있도록 돕는 역할도 한다.

이러한 DPU 기능은 차세대 클라우드 컴퓨팅 환경이 될 베어메탈 방식의 클라우드 네이티브 컴퓨팅을 구현하는 데 매우 중요하다.

스마트네트워크카드(SmartNIC)에 통합된 DPU의 미래
DPU는 독립형 임베디드 프로세서로도 사용 가능할 수 있지만 차세대 서버의 핵심 구성요소인 네트워크인터페이스카드(SmartNIC)에 통합돼 사용되는 경우가 많다. 

 

업계에는 DPU 라고 주장하는 디바이스가 다수 있으나 실제로는 DPU를 구성하는 핵심 기능 중에서 중요한 요소가 결여된 경우가 많다.

가령 몇몇 벤더는 ARM CPU 생태계가 제공하는 개발환경과 애플리케이션 인프라의 이점을 활용하지 않는 독자적인 프로세서를 사용한다. 또 DPU를 갖췄다고 주장하지만 데이터 경로 프로세싱을 위해 임베디드 CPU에만 집중하는 오류를 범하는 경우도 있다.

이는 경쟁력이 없을 뿐더라 확장도 불가능하다. 무모한 성능 향상으로 전통적인 x86 CPU를 뛰어넘으려는 것은 승산이 없다.

대신 네트워크 인터페이스가 모든 네트워크 데이터 경로 프로세싱을 감당할 수 있을 정도로 강력하고 유연해야 한다. 임베디드 CPU는 컨트롤 경로 초기화 및 예외적인 프로세싱을 위해 사용하는 것이 적절하며 그 이외의 용도는 부적절하다.

네트워크 가속화를 위해서는 OVS(open virtual switch)를 구현하기 위한 데이터 패킷 파싱-매칭-조작할 수 있는 유연성을 제공하고, ZTR(Zero Touch RoCE)를 위한 RDMA 데이터 전송 가속을 지원하며, CPU를 우회하고 네트워크로 연결된 데이터를 GPU로 직접 전송하는 GPU-다이렉트 가속기능은 매우 중요하다.

5G를 위한, 5T와 같은 텔코클라우드(telco Cloud) RAN을 위한 타이밍 가속기으로 확장할 수 있어야 하며, IPSEC 및 TLS에 대한 암호화 가속이 인라인으로 수행되기에 가속 기능의 연속성도 보장해야 하는 등,네트워크 데이터 경로 가속화엔진이 지원하는 다양한 이점을 고루 제공해야 한다.

위의 기능은 DPU가 무엇인가라는 질문에 대한 답변에 꼭 핵심적으로 들어가야 할 가속·하드웨어 기능 중 몇 개에 불과하다. 소위 DPU의 이름을 딴 많은 장치들이 이런 기능들 중 하나 또는 두 개를 제공하는 데 중점을 둔다.

최악의 경우는 독점적 프로세서에서 데이터 경로를 오프로드하려고 한다. 이와 같은 방법은 프로토타입 제작에는 좋지만 데이터센터의 규모, 범위와 대역폭 확장에 있어서는 의미가 없다고 보는 이유다.
 

 

글 : 케빈 디얼링(Kevin Deierling) / 마케팅 부사장 / 멜라녹스

 

[저작권자ⓒ IT비즈뉴스. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

마켓인사이트

+

컴퓨팅인사이트

+

스마트카

+

PHOTO NEWS