英 AI칩 설계 스타트업 ‘그래프코어’, TSMC 7나노 공정기반 2세대 IPU 공개

최태우 기자 / 기사승인 : 2020-07-19 13:44:58
  • -
  • +
  • 인쇄
콜로서스 Mk2 GC200 IPU, 전세대 플랫폼 대비 ML성능 8배 향상
▲ 콜로서스 Mk2 GC200 IPU [source=graphcore]
[IT비즈뉴스 최태우 기자] 그래프코어(Graphcore)가 2세대 인텔리전스프로세서(IPU) 플랫폼 ‘IPU-머신 M2000(IPU-Machine M2000)’을 공개했다. 그래프코어는 2016년 엔비디아 출신 엔지니어들이 설립한 AI칩 설계 스타트업이다.

IPU는 CPU나 GPU, IP블록 단인 NPU나 FPGA와 조금 다르게 프로세서에 직접 메모리 블록을 대칭한 것이 가장 큰 특징이다.

이번에 공개한 2세대 IPU 기반 플랫폼은 블레이드 유닛 하나로 1페타플롭(PetaFlop)에 달하는 머신 인텔리전스 컴퓨팅 성능을 구현하며 AI 스케일아웃에 최적화된 통합 네트워킹 기술이 탑재된 점은 사측이 내세우는 강점이다.

각각 IPU-머신 M2000은 그래프코어의 7나노(nm) 콜로서스 Mk2 GC200 IPU(Colossus Mk2 GC200 IPU) 프로세서 4개가 탑재됐으며 자체 포플러(Poplar) 소프트웨어 스택으로 구현된다.

IPU-머신 M2000은 새로운 그래프코어 콜로서스 Mk2 GC200 IPU를 탑재하고 있다. TSMC의 7나노 공정이 적용됐으며 칩에는 823평방밀리미터(sqmm) 넓이의 단일 다이(die)에 594억 개가 넘는 트랜지스터가 탑재됐다.

GC200에는 1472개의 개별 IPU-코어가 통합돼 있으며 8832개의 개별적인 병렬 연산 스레드를 실행할 수 있다. 산술 구현 성능을 조정해 ML 연산의 전력 소비와 성능을 개선하고 각각의 IPU-머신 M2000 블레이드 유닛 하나 당 최대 1 페타플롭의 AI 연산 성능을 제공하도록 자체 개발한 ‘AI-플로트(AI-Float)’ 기술이 적용됐다.

기존 Mk1 IPU 제품의 모델 및 시스템과 Mk2 IPU 시스템 간 호환도 가능하다. 사측 자료에 따르면 ML 성능은 1세대 그래프코어 IPU 대비 8배나 향상됐다.

포플러 SW는 IPU가 그래프코어의 독자적인 익스체인지-메모리(Exchange-Memory) 통신 기능을 통해 스트리밍 메모리(Streaming Memory)에 액세스할 수 있도록 지원한다. 이론상 각 IPU-머신 M2000은 최대 450GB의 밀도를 제공하며 초당 180TB의 대역폭으로 익스체인지-메모리를 지원한다.

서버를 병렬연결, 성능을 비약적으로 높일 수도 있다. IPU-머신 M2000의 아키텍처는 최대 6만4000 IPU의 데이터센터 규모 시스템을 IPU-POD 구성 방식으로 구축해 16엑사플롭(ExaFlops)의 ML 연산 성능을 구현할 수 있다.

▲ IPU-머신 M2000
단일 IPU-머신 M2000 박스 하나를 기존의 CPU 서버 중 하나에 직접 연결해 구축할 수 있으며 서버 한대에 최대 8대의 IPU-머신 M2000을 추가 연결하는 것도 가능하다. 대규모 시스템의 경우, 표준 19인치 랙에 내장된 16개의 IPU-머신 M2000으로 구성된 랙 스케일 IPU-POD 64를 사용해 랙을 스케일아웃할 수도 있다.

여기에는 그래프코어의 IPU-패브릭(IPU-Fabric) 연결기술이 적용된다. 내장된 AI네트워킹 시스템이자 ML 통신전용으로 설계됐으며 저지연의 전용 패브릭을 구현해 데이터센터 전반에 걸쳐 IPU를 연결시킨다는 게 사측 설명이다.

한편 워크로드에 단일 IPU 혹은 수천 개의 IPU를 사용하는 경우에도 그래프코어의 포플러 소프트웨어개발키트(Poplar SDK)를 통해 작업을 간소화할 수 있다.

포플러는 텐서플로우(TensorFlow)나 파이토치(PyTorch) 등의 AI 프레임워크와 통합 가능하며 연산 내용, 데이터 및 통신을 포괄하는 연산 그래프를 구축할 수 있다. 해당 연산 그래프를 컴파일하고 연산, 메모리 및 네트워킹 통신을 관리하는 런타임 프로그램을 구축해 가용 IPU 하드웨어의 활용성을 극대화할 수 있다고 사측은 설명했다.


나이젤 툰 그래프코어 CEO는 “2세대 IPU 플랫폼을 선보이게 돼 기쁘다. M2000은 기존에 비해 8배 가량 향상된 성능을 제공해 가장 까다로운 ML 및 대규모 데이터센터급 워크로드 처리도 가능하다”며 “탄탄한 글로벌 파트너 생태계를 바탕으로 ML 분야의 다양한 고객층을 지원하기 위해 적극적인 시장 공략에 나설 것”이라고 말했다.

 

[저작권자ⓒ IT비즈뉴스. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

마켓인사이트

+

컴퓨팅인사이트

+

스마트카

+

PHOTO NEWS