인텔 ‘비욘드 무어’ 달성할 핵심기술 6가지

아키텍처, 미세공정 극복하고 개방형 혁신 추구

인텔 포베로스의 구조. 베이스 다이 위에 10나노 CPU와 GPU가 얹히고 2개의 D램이 덮힌다.

인텔이 2년마다 반도체 집적도가 두 배 증가한다는 창업자 고든 무어의 이론(무어의 법칙)을 지속하기 위한 새로운 ‘모어 댄 무어(More than Moore)’를 마련했다.

크게 6개의 전략 기둥으로 나뉜다. △프로세스(Process) △아키텍처(Architecture) △메모리(Memory) △인터커넥트(Interconnect) △보안(Security) △소프트웨어(Software) 분야가 전략의 핵심이다. 아키텍처와 미세공정 전환이 번갈아 이뤄진 ‘틱(Tick)-톡(Tock)’에서 벗어나 중앙처리장치(CPU)와 주변을 둘러싸고 있는 모든 요소를 종합하겠다는 게 핵심이다. 칩 단위가 아닌 컴퓨팅 차원의 접근 방법이다.

6가지 전략적 기둥 발표는 지난해 12월 인텔 공동창업자인 로버트 노이스 가옥에서 소개됐다. 노이스는 직접회로(IC)를 고안했다. 오직 기술만 파고들어 마이크로프로세서의 기초를 닦은 인물이다. 토론을 즐기며 아이디어를 발전시키는 재주가 탁월했다. 인텔은 현장에서 노이스가 즐겨 썼던 “시대를 벗어나 멋진 일을 하라”는 말을 내걸었다. 변화를 두려워하지 않고 즐기겠다는 의미로 풀이된다.

아래는 인텔이 아키텍처 데이에서 선보였던 주요 발표 내용이다.

1 3D 패키징으로 ‘CPU+GPU+메모리’ 통합
CPU, 애플리케이션 프로세서(AP)은 반도체 칩을 소형화하기 위한 3D 트랜지스터 설계 구조인 핀펫(FinFET)을 사용하고 있다. 낸드플래시도 셀을 위로 올리는 3D 적층 방식이 상용화됐다. 패키징도 2D에서 3D로의 진화가 이뤄졌다.

올해 하반기 나올 3D 패키징 기술 ‘포베로스(Foveros)’는 CPU, 그래픽처리장치(GPU), 인공지능(AI) 프로세서 등 여러 개의 칩을 하나의 다이에 쌓았다. 기존 패키지 온 패키지(PoP:Package on package)가 메모리 적층에 그쳤다면, 포베로스는 다양한 고성능 칩과 입출력(I/O) 인터페이스까지 포함했다.

포베로스는 4개 층으로 이루어져 있다. 베이스 다이는 캐시메모리와 I/O가 깔린다. 그 위로 10나노 CPU와 GPU가 얹히고 2개의 D램이 덮힌다. CPU는 아래 소개할 ‘서니 코브(Sunny Cove)’, 젠(Gen) 11 GPU가 사용됐다. 0.5MB 용량의 낸드플래시까지 품었다.

2 병렬처리에 특화된 CPU
서니 코브 아키텍처는 지연시간을 줄이기 위한 새로운 알고리즘과 함께 더 많은 데이터 처리를 위해 병렬처리 기법이 강화됐다. 데이터를 임시로 담아두기 위한 캐시메모리 용량도 키웠다. 구체적으로 L1 캐시는 50%(32KB에서 48KB), L2 캐시는 제품마다 다르다. 게임, 동영상은 물론 데이터 중심의 애플리케이션까지 사용할 수 있다. PC부터 서버까지 모두 적용하는 아키텍처라는 의미다. 서니 코브 이후에는 윌로우 코브(Willow Cove), 골든 코브(Golden Cove)가 매년 공개될 예정이다.

3 외장 그래픽카드 내놓기 전 나오는 GPU
인텔은 1990년대 후반 외장형 그래픽카드를 내놨다가 내장형 그래픽코어로 전략을 바꿨다. 그 사이에 GPU 시대가 열렸고 AI 가속기로 쓰임새가 넓어졌다. 자율주행차에도 쓰인다. 이에 인텔도 발맞춰 2020년 외장 그래픽 프로세서를 도입하기로 했다. 인텔 아키텍처 데이에 선보인 젠11 GPU를 통해 대략적인 발전 방향을 가늠해 볼 수 있다.

젠11 GPU는 기존 젠9 GPU와 비교해 클록 당 연산 성능을 2배 높였다. 1테라플롭스(Teraflops, 1초에 1조번 연산) 이상의 성능을 갖췄다. AI 성능도 강화해 사진 인식과 같이 널리 사용한 추론 애플리케이션에 유용하다. 4K와 8K 콘텐츠도 제작할 수 있으며 어댑티브 싱크 기술을 지원해 게임에서 보다 부드러운 화면을 만들어준다. GPU와 모니터의 화면 주사율을 동기화해 매끄럽게 프레임이 표현된다.

4 하드웨어가 복잡해? ‘One API’로 해결
포베로스와 같이 하나의 다이에 여러 개의 칩이 모여 있으면 구조가 복잡해진다. 소프트웨어 개발에 어려움을 겪을 수 있다. One API는 CPU, GPU, NPU, 프로그래머블반도체(FPGA) 등 포베로스에 접목된 각종 하드웨어를 간편하게 조작하는 기술이다. 인텔이 직접 미들웨어와 프레임워크를 제공한다. 명령어가 포함되어 있어 개발자가 원하는 부분을 선택하면 자동으로 작동되는 방식이다.

포베로스 CPU나 x86뿐 아니라 ARM 아키텍처까지 포함되어 있다는 점이 고려됐다. 설계가 다른 이기종 컴퓨팅은 운영체제(OS), 애플리케이션 호환이 어렵다. One API를 사용하면 CPU는 OS가 작동될 때까지만 개입한다. 이후에는 어떤 아키텍처가 작동되더라도 문제가 생기지 않는다. 인텔은 다른 기업에서 One API를 사용할 수 있도록 개방형으로 꾸몄다. 호환성을 높인다는 전략이다

5 차차세대 메모리!
인텔은 상변화메모리(P램) 일종인 3D 크로스포인트 메모리를 개발하고 ‘옵테인’이란 이름으로 메모리 중심 컴퓨팅에 나선 상태다. ‘옵테인 DC 퍼시스턴트 메모리(Optane DC Persistent Memory)’는 데이터 중심의 기술 혁신을 위한 차차세대 메모리다. 옵테인 DC 퍼시스턴트 메모리를 사용했을 때와 그렇지 않을 때 인-메모리(In-Memory) 분석은 8배, 카산드라(Cassandra) 데이터베이스는 9배 더 성능이 높다. 데이터베이스 서버를 재시동했을 때 걸리는 시간은 불과 16초로 34분이 걸리는 D램 기반 제품보다 훨씬 빠르다.

기존 옵테인은 솔리드 스테이트 드라이브(SSD) 형태로도 나온다. 4비트(QLC)를 저장하는 3D 낸드플래시와 함께 빈번하게 사용되는 데이터에 대한 접근 지연을 낮춰준다. 빅데이터에서 원하는 정보를 찾고 정리하는 시간이 줄어든다는 의미다.

6 AI 개발 더 쉽게
서버 CPU 시장에서 90% 이상의 점유율을 가지고 있는 인텔은 AI 개발을 위한 오픈소스를 제공한다. ‘딥 러닝 레퍼런스 스택’은 제온 스케일러블 CPU에 최적화됐다. 클라우드 환경에서 개발이 가능하고 여러 개의 소프트웨어를 사용해도 복잡하지 않도록 맞춤형 솔루션으로 설계됐다. 예컨대 OS는 클리어 리눅스, 애플리케이션 관리는 큐버네티스, 가상화는 도저 컨테이너를 사용할 수 있다. 인공 신경망 구성은 ‘매스 커널 라이브러리’로 해결한다. 파이선, 텐서플로, 쿠브플로 등 오픈소스를 이용하는 업계 개발도구(SDK)도 갖췄다.

이수환 기자 다른기사 보기

익 2019-02-25 13:59:45

삭제하기

젠9 GPU → 9세대 iGPU, 젠11 GPU → 11세대 iGPU