머신러닝(ML) 구현에서 ‘상위수준합성(High Level Synthesis, HLS)’이 주목받는 이유 ②

최태우 기자 / 기사승인 : 2020-04-06 11:09:40
  • -
  • +
  • 인쇄
▲ [source=freepik]
지난 글에 이어 이번 글에서는 커스텀IC 부문에서 ML 구현에 접근하는 다양한 방식에 대한 사례와 RTL 대비 HLS가 현재 주목을 받는 이유에 대해 알아본다.

데이터센터를 벗어나 유비쿼터스 환경으로
ML 활동(교육과 추론 양쪽 모두에서)의 대부분은 여전히 클라우드 데이터센터에 집중되어 있다. 추론 장치는 대부분이 랙 장착 서버에 부착되어 있는 TPU, ASIC 또는 FPGA 추론 가속기를 갖춘 상용 서버로서 구글 번역(Google Translate)과 상용 ML 인프라 서비스와 같은 소비자 서비스를 구동하는 데 활용되고 있다.

하지만 디바이스, 그 중에도 특히 커스텀IC 부문에서는 ML에 대해 매우 흥미로운 접근방식이 다양하게 시도되고 있는 것을 볼 수 있다.

커스텀 디지털 및 IP 접근방식, 주요 IP 벤더들의 뉴로모픽(neuromorphic) 디자인이나 프로세서 또는 코프로세서를 사용하는 아날로그 디바이스가 다양하게 시도되는 것을 볼 수 있다. 이를 전통적인 SoC 부문과 함께 이용해 맞춤화된 엣지 장치를 구현할 수 있어 밑바닥부터 새로 구축할 필요가 없다.

물론 알고리즘을 제대로 작성해야 한다는 점에는 변함이 없지만, 모든 분야에서 유용한 진전이 이루어지고 있음을 본다는 것은 흥미로운 일이다.

추론 가속기를 스마트폰에 탑재한 뒤 클라우드를 통해 ML 서비스를 제공한다는 것은 매우 합리적이다. 허나 이러한 서비스 중 일부는 상당한 성능을 요구하며 최근까지만 해도 반맞춤형 추론 가속기조차 비용이 너무 많이 들어 다양한 실험을 시도할 수 없었다.

ML 추론에 최적화되지 않은 하드웨어에서 음성응답 서버 같은 것을 실행하는 사례는 이미 많이 나타나고 있다. 대부분의 경우, 이들은 텐서플로우(TensorFlow)나 다른 프레임워크에 대해 알 필요조차 없다.

특히 FPGA 칩이나 기타 세미커스텀 하드웨어를 기반으로 하는 디바이스의 가격이 상대적으로 떨어지면서 신경망 추론에 최적화되지 않은 하드웨어에서 추론 소프트웨어 전체를 실행하는 장치도 증가할 것으로 보인다.

모든 휴대폰 프로세서가 신경망 엔진을 탑재하고 있거나 머지않아 탑재하게 될 것으로 보이는데, 이는 ML 애플리케이션을 개발하고자 하는 이들에게 있어서 엄청난 수의 플랫폼이 아닐 수 없다. 화웨이나 퀄컴, 그 밖의 모바일 칩 업체들이 자사 폰의 API와 인터페이스를 개방하고 있다.

이를 활용하는 개발자들이 크게 늘고 있는데, 의료 탐지 및 이미징 부문에서는 이미 많은 일들이 진행되고 있으며, 이들은 상당히 주목을 받을 것으로 예상되는 부분이다.

많은 회사들이 ASIC과 FPGA의 비교 테스트에 상당한 시간을 소비하고 있다. 특정 유형의 행렬곱셈에서 16비트, 8비트 및 4비트 정밀도를 비교하는 작업도 여기에 포함되어 있다. 이러한 테스트를 하는 이유는 구현 제품을 보다 예리하고 연산 효율성도 높게 만들기 위해서다. 하지만 사전구성 되었거나 클라우드 기반인 ML 기능들이 이미 출시된 상태다. 이러한 분야 전체가 개인이나 기업의 기술 인프라 중 또 다른 한 부분이 되고 말 가능성도 있다.

예를 들자면, 플렉스 로직스(Flex Logix)는 자사의 eFPGA 기능을 중심으로 하는 신경망 인프라를 발표했는데,이를 통해 칩에 대해 하는 작업을 장치의 일부분에서 함으로써 실제로 맞춤화가 가능하다.

매우 다양한 이용 사례가 있으며 접근 방법도 다양하다. 필요한 종류의 효율성을 얻기 위해 자사의 디바이스를 맞춤화해야 한다면 그것도 가능하다. 전력소비 문제 따위는 아무래도 좋다거나 그 정도로 극단적인 최적화 수준을 원하는 것이 아니라면 할 수 있는 일은 그야말로 많다.

흥미로운 점은, 신경연결망(Neural networking)은 이미 엣지에서 관심을 끌고 있다. 음성 인터페이스 분야의 인기가 이미 상당히 높아지고 있는 듯한데, 이것은 이를 통해 할 수 있는 일이 많기 때문이다.

우리는 현재 폰에 탑재된 시리와 얘기할 수 있다. 즉, 신경망이 이미 폰에서 작동하고 있는 것이다. 이는 다른 제품들에서도 꽤나 흔해지고 있는 추세이다. 우리는 이미 거대한 이정표에 도달했다는 사실을 이제서야 깨닫고 있는 것인지도 모른다.

상위수준합성은 RTL 설계보다 빠른 설계 자동화 방법으로서 특히 잘 알지 못하는 분야에서의 신속하고 실험적인 설계에 있어서 전도유망하다. 하지만 상위수준합성에서 가장 유용한 특징은 설계가 아니라 반복 작업일지도 모른다.

즉, 마스터 레이아웃에 변화를 준 수많은 버전을 쉽게 작성한 뒤 이러한 모델들에 대해 검증 및 성능 테스트를 실행하여 해당 유형의 신경망이 목적에 맞게 제작된 ML 칩이나 FPGA, 커스텀 ASIC 또는 x86에서조차도 최고의 실행성능을 제공할 수 있는지 보다 신속하게 결정할 수 있는 것이다.

어느 쪽이든, ML 추론 장치의 성능과 인기는 계속 치솟을 가능성이 높다. 그리고 그 과정에서 칩 제조업체들이 설계와 검증에 어떤 방식으로 접근하기로 하든 상관없이, 이들을 위한 자원과 시장을 모두 창출하게 될 것이다.

 

글 : 케빈 포가티(Kevin Fogarty) / 반도체산업 전문 자유기고가

 

 

[저작권자ⓒ IT비즈뉴스. 무단전재-재배포 금지]

[관련기사]

멘토, TSMC 5나노·7나노 공정기술 지원 솔루션 확대2018.10.19
비메모리반도체 1위 내세운 삼성, “독자 NPU 개발로 경쟁력 확보”2019.06.18
“미래 반도체시장, 미세공정기술 아닌 칩의 다양성에 좌우될 것”2019.06.26
정부, 시스템반도체·미래차에 3578억원 투입…내년도 R&D 예산안 확정2019.07.01
[그것을 알려주마] "삼성이 NPU 설계자산(IP) 개발에 나서는 진짜 이유"2019.07.05
‘십년 만에 최악’ 반도체시장, ‘무역분쟁’ 이슈로 공급체인 변화도 감지2019.07.24
네이버가 선택한 팹리스기업, “퓨리오사AI를 아십니까?”2019.08.14
인공지능(AI)이 반도체시장에 제공하는 기회, ‘ML+EDA는 트렌드 아닌 필수’2019.08.31
한컴MDS·다쏘시스템, 전자설계자동화(EDA) 툴 공급계약 체결2019.09.26
[단독] 자일링스, 머신러닝(ML) 라이브러리 수백 개…오픈소스로 푼다2019.10.02
파운드리 생태계 강화하는 삼성, 美‘서 SAFE 포럼’ 개최2019.10.21
차세대 IPU ‘블루필드2(BlueField 2)’ 공개한 멜라녹스, “보안-성능 모두 잡았다”2019.10.30
[그것을 알려주마] SK텔레콤은 왜? AI가속기에 ‘GPU’ 아닌 ‘FPGA’를 선택했나2019.11.04
멘토, 그래프코어 AI칩(IPU) 디자인 검증에 ‘퀘스타’ 툴 공급2019.12.02
정부, 반도체·헬스케어·미래차 ‘빅3’ 부문 벤처·스타트업 집중 지원한다2019.12.12
바이두 AI칩 ‘쿤룬(Kunlun, 昆仑)’, 내년 양산시작…공정은 삼성 파운드리 적용2019.12.18
[그것을 알려주마] AI/ML 구현의 핵심 실리콘…“CPU, GPU, NPU와 FPGA, 그럼 IPU는 뭐야?”2020.02.05
인공지능(AI) 가속기의 생태계, 하드웨어 가속기의 개발속도를 높이기 위한 방법론2020.02.18
자일링스, ‘알비오(Alveo)’ 브랜드 단 스마트-NIC ‘U25’ 공개2020.03.05
[그것을 알려주마] CPU·FPGA·NNP, 그리고 뉴로모픽…인텔이 ‘로이히(Loihi)’를 공개한 이유2020.03.23
머신러닝(ML) 구현에서 ‘상위수준합성(High Level Synthesis, HLS)’이 주목받는 이유 ①2020.03.30
머신러닝(ML) 구현에서 ‘상위수준합성(High Level Synthesis, HLS)’이 주목받는 이유 ②2020.04.06
[톡 with 스타트업] 퓨리오사AI(Furiosa AI)는 어.떻.게 유니콘을 꿈꾸고 있나?2020.04.28
시스템온칩(SoC) 설계를 위한 리셋 검증 방법론2020.04.28
  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

마켓인사이트

+

컴퓨팅인사이트

+

스마트카

+

PHOTO NEWS