본문 바로가기

뉴스거리/프로세서

다시한번 네할렘 아키텍처의 캐시설계에 대해 밝힘.


Core i7 프로세서가 이미 발표 됐지만, 아직도 이 새로운 Nehalem 아키텍처에 대한 말들은 끊임없이 나오고 있습니다. 특히 캐시메모리 문제가 가장 큽니다. 여러분들도 "도대체 L3캐시는 왜 집어넣었고, L2캐시는 또 왜 이렇게 작냐?" 라고 생각하실 껍니다.

권위있는 하드웨어 싸이트 AnanTech.com의 편집자이자 창시자인 Anand Lal Shimpi 역시 같은 의문을 갖고 있다고 합니다. 그는 심지어 직접적으로 Nehalem 아키텍처 수석 설계가인 Ronak Singhal 한테 “네할렘의 캐시용량 설계는 내 견해로는 에러같다. " 라고 말했으며, 이말을 들은 Ronak Singhal는 이 모든게 8MB의 L3 때문 이라고 말했습니다.

일단 우리모두 1998년 부터 지금까지 나온 Intel 프로세서 각 코어들의 L2 캐시 용량 발전 역사에 대해 집어 봅시다.


(클릭해서 크게보세요.)



일단 짧은 요약으로 설명 하자면, 위 자료에서 비스듬한 선이 보이죠? 저게 바로 Pentium III의 256KB 캐시부터 시작되어 45nm Core 2 Duo/Quad의 3MB 까지의 발전 추세를 보여주는 선 입니다. 하지만 이 선 근처엔 네할렘 Core i7이 안보입니다. 거의 밑바박 근처에서 자리잡고 있는 네할렘은 한순간에 10년을 거슬러 올라간 것과 같은 느낌 입니다. 그 이유는 Core i7의 각코어별 할당된 L2 캐시는 불과 256KB 밖에 안되기 때문 입니다.




하지만 L2 와 L3를 합친다면 어떻게 될까요, 이둘을 합친 캐시의 발전 역사를 그래프로 그리면, 위 자료와는 크게 달라 집니다.




(클릭해서 크게보세요.)



1998년 부터 2004년까지 Intel 프로세서의 외부 캐시는 계속 작은 형태 였습니다. 하지만 2005년 부터 시작해서 어떠한 수식을 가지고 늘어나기 시작 했습니다. 그 이유는 바로 듀얼코어의 등장 이며, 그다음 쿼드코어가 등장하고, 마침내 최대 캐시 메모리가 12MB 까지 많아 졌습니다. 그리고 총 10MB의 캐시를 갖고있는 Core i7은 기본적으로 이 발전 추세 곡선 주위에 자리잡고 있네요.
 
이것으로 멀티코어가 캐시메모리 설계에 큰 영향을 끼치고 있다는 결과가 나오게 됩니다. 이유는 현재의 멀티코어 캐시성능을 만족시키기 위한 것이며, 결코 싱글코어를 위한 설계가 아닙니다. 멀티코어는 필연적인 추세이며, 네할렘
아키텍처는 처음부터 쿼드코어를 염두하고 설계한 구조입니다. 거기다 좋은 탄력성(확장성)을 갖고 있습니다. 때문에 이미 쿼드코어에서 늘어난 8스레드로 확장되었으며,  최소한으로 줄이면 듀얼코어 까지도 줄어들게 됩니다.

많은 엔지니어들이 생각하는, 현재의 작업 환경에 대하여, Nehalem의 L2캐시는 확실히 너무 작다고 말하고 있습니다. 하지만 L2 캐시를 늘리는 것은 면적의 문제가 아니라 바로 캐시 메모리 지연시간(레이턴시)이 문제 입니다. Nehalem L2 캐시 메모리의 지연시간은 10 싸이클 이며, 이후로도 더 1~2 싸이클이 증가하게 될 것입니다. 그리고 각 코어마다 지금의 두배용량인 512KB 가 탑재된다고 친다면, 액세스 지연속도는 20% 정도 느려질 것이며 기본적으로 받아들일 수 없는 속도가 나오게 됩니다.

오늘날 이후의 L2 캐시는 반드시 큰게 좋은 걸까요?  이 문제는 꼭 그렇다고 확신할수는 없습니다. 게다가 Intel이 생각하고 있는 현재의 주요 관점은 L3캐시의 속도입니다. 현재 8MB의 L3 캐시의 엑세스 지연속도는 41 싸이클 이며, 아직 좀더 개선될 여지가 남아 있습니다. 예를들어 30 싸이클로 만드는것이 가능할 것입니다. 하지만 안타깝게도 Ronak Singhal는 이문제에 대해 확답을 못하고 얼버무렸습니다. 구체적으로 뭘 어떻게 할껀지에 대해서 말하지 못했고, 그저 "마이크로 아키텍처를 조절하겟다." 라고만 말했다고 합니다.

8MB의 L3 캐시는 보기에도 결코 작은 용량은 아닙니다.하지만 각 코어마다 쪼개서 나눈다면 2MB밖에 안되며, Ronak Singhal의 눈에도 아직 성에 차는 양이 안됩니다.  앞으로의 계획은 차세대 32nm 공정에서 이 부분을 보강할 것이며, 저 위에서 보인 캐시 메모리의 발전 추세 곡선에 부합하는 용량을 보여준다고 합니다.

사실 아키텍처가 어찌됐건간에 실제로 가장 와닿는 것이 바로 체감 성능입니다.
Nehalem(네할렘)은 Penryn(펜린)과 비교해서 0~60%의 모든 방면에서 성능이 올라갔고, 이것은 명백한 사실 입니다. 떄문에 비록L2캐시가 작게 변했다고 하지만, 원망을 살만한 일은 아닌것 같습니다.







驱动之家[原创] 作者:上方文Q 编辑:上方文Q 2008-11-20 16:04:47