2024-11-24

Korea Scoop

한국 특종 – 인기 급상승 뉴스

AMD, 성능 10배 높인 ‘2세대 버설 AI 엣지·프라임’ 임베디드 칩 출시 | KS News

AMD, 성능 10배 높인 ‘2세대 버설 AI 엣지·프라임’ 임베디드 칩 출시 | KS News

[IT동아 남시현 기자] AMD가 임베디드 시스템용 AMD 버설(Versal) 적응형 시스템 온 칩(Adaptive SoC)에 AI 가속 기능을 추가한 2세대 버설 AI 엣지 및 2세대 버설 프라임 칩을 공개했다. 2세대 버설 시리즈는 전처리부터 AI 추론 및 후처리까지 단일 칩에서 처리할 수 있고, 통합 Arm CPU를 탑재해 1세대 버설 AI 엣지 및 프라임 시리즈 장치 대비 최대 10배에 달하는 정수 및 부동 소수연산 처리 성능을 보여준다.

AMD 임베디드, AI 지원으로 활용폭 넓힌다

스테프 고티에 AMD AECG(적응형 및 임베디드 컴퓨팅 그룹) 버설 AI 엣지 시리즈 제품라인 시니어 매니저는 “오늘날 AI는 데이터센터부터 클라우드에 이르는 모든 IT 분야에서 중추 기술이 됐고, AMD 역시 시장 수요에 대응해 수년간 AI 대응 임베디드를 선보여왔다”라면서, “하지만 임베디드는 작동 환경과 적용 범위가 넓어서 사양 인증, 실시간 반응성은 물론 확장성과 신뢰성이 모두 뛰어나야 한다. 여기에 더 강력한 AI 기능을 요구하면서 앞으로 더 많은 컴퓨팅 역량과 어려움이 뒤따르는 상황”이라고 소개를 시작했다.

AMD, 성능 10배 높인 ‘2세대 버설 AI 엣지·프라임’ 임베디드 칩 출시 | KS News
AI 엣지 프로세서는 데이터를 수집하고 가공하는 전처리, 제작된 모델을 구동하는 AI 추론, 처리된 데이터를 수집하고 처리하는 후처리 과정을 진행한다 / 출처=AMD

스테프 고티에는 “인공지능 처리 절차는 크게 전처리, 추론, 후처리로 나뉜다. 전처리는 센서 등을 통해 데이터를 수집하고, 추론할 수 있도록 정리한다. 추론 단계에서는 신경망 네트워크 등을 활용해 결과를 얻고, 판단과 결정을 내린다. 만약 전처리 단계에서 반응성이 떨어지면 시스템 병목이 발생한다. 후 처리 단계는 피드백과 의사 결정, 데이터 처리가 필요하며, 이를 위해 고성능의 장치가 필요하다”라고 설명했다.

스티브 고티에는 “AMD 1세대 적응형 SoC는 전처리와 추론까지는 진행하지만, 핵심 장치로 쓰기엔 CPU 성능이 부족했다. 그래서 세 과정을 모두 하나의 칩으로 처리하기는 어렵고 다중 칩으로 써야 했다. 그러다 보면 전력 소모나 발열, 칩 간 통신 지연, 물리적 한계 등의 문제가 발생한다”라고 말했다.

AMD 2세대 버설 AI 엣지 및 프라임 칩 / 출처=AMD
AMD 2세대 버설 AI 엣지 및 프라임 칩 / 출처=AMD

NPU 탑재를 통해 이 문제를 해결한 것이 2세대 버설 AI 엣지 버설 및 버설 프라임 칩이다. 그는 “2세대 버설 AI 엣지 시리즈는 AI 엔진을 탑재해 추론 기능이 크게 개선했고, 1세대 대비 최대 3배 더 높은 와트당 TOPS(1조당 연산 처리수)와 10배의 정수 및 부동 소수 연산 처리 성능을 제공한다”라고 말했다.

차량, 스마트시티, 비디오 등 주로 이미지 모델에서 강세를 보인다 / 출처=AMD
차량, 스마트시티, 비디오 등 주로 이미지 모델에서 강세를 보인다 / 출처=AMD

성능은 단일 칩 기준으로 레벨 2+ 및 3 첨단운전자보조시스템(ADAS)에서 최대 4배의 이미지 처리 성능을 보이며, 스마트 시티 관련 이미지 처리에서 스트림당 30%씩 최대 65%까지 빨라졌다. 비디오 스트리밍 및 인코딩 기능 역시 FHD 기준 최대 두배 많은 영상을 처리한다.

AMD 2세대 버설 AI칩은 이전 세대 제품 대비 최대 10배에 가까운 정수연산 처리 성능을 갖춘다 / 출처=AMD
AMD 2세대 버설 AI칩은 이전 세대 제품 대비 최대 10배에 가까운 정수연산 처리 성능을 갖춘다 / 출처=AMD

정수 연산 처리는 최대 8개의 Arm 코텍스-A78AE 코어가 2.2GHz로 동작하는 조건에서 최대 20만 DMIPs(Dhrystone MIPS)까지 발휘한다. DMIPs는 특정 작업을 수행했을 때 걸리는 시간을 측정하고, 이를 정수화하여 시스템 성능을 비교하는 단위다. 동일 조건에서 자일링스 zynq 울트라스케일+ MPSoC CG 장치는 약 1만 DMIPs, 1세대 버설 적응형 SoC도 2만 2000 DMIPs 정도 성능을 낸다.

2세대 버설 AI, 자동차 산업 시작으로 영역 넓힐듯

AMD는 우선 프리미엄 제품보다는 일반 제품군에 집중하는 모양새다 / 출처=AMD
AMD는 우선 프리미엄 제품보다는 일반 제품군에 집중하는 모양새다 / 출처=AMD

일본의 자동차 기업 스바루(Subaru)는 자사의 ADAS 장치인 아이사이트에 2세대 버설 AI 엣지 시리즈를 탑재한다. 아이사이트는 스바루의 일부 자동차 모델에 탑재돼 어댑티브 크루즈 컨트롤, 차선 이탈 방지, 충돌 방지 등 첨단 안전 기능을 제공한다. 스티브 고티에는 “스바루가 AMD 버설 AI를 선택하는 이유는 우수한 정확성과 높은 데이터 처리량 때문이다. 또한 물리적, 기능 안정성도 검증되었으며, 프로그래머블 가능한 환경이 제공하는 이점, 스바루 자체 기술력 등을 적용한 점도 관련이 있다.

AMD는 2세대 버설 시리즈가 우선적으로 자동차 산업의 AI 엣지 임베디드에 주로 활용될 것으로 보며, 발전된 성능과 안정성을 토대로 항공우주 및 방위, 산업, 비전인식 AI, 의료, 방송 및 프로 영상 시장에 대응할 것으로 본다. 한편 AMD 버설의 고성능 버전인 버설 HBM과 프리미엄 시리즈의 2세대 제품 출시와 관련해서는 대답을 아꼈다.

글 / IT동아 남시현 (sh@itdonga.com)

—————

원천: IT동아 (CC BY-NC-ND 2.0)

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

Copyright © KoreaScoop.com - Design & Compiled