Core 아키텍처가 성공을 거둔후 그뒤를이어 Penryn 이 이 아키텍처를 연장시켜 주었고, 그다음 후속타자로 Nehalem 이 등장했습니다. 사람들의 기대를 한몸에 받고있는 이 아키텍처가 그 기대에 부합해 주는것인지 아닌지에 대해서 사람들마다 의견에 편차가 존재합니다. 여기서 우리는 평소에는 소홀히 했던 부분에 대해 짧은 이야기를 하나 전해 드리겟습니다. 역시 이 몇몇 방면은 또 중요한 부분에 속하고요.
이야기에 앞서서 짚어볼 것이 있습니다. Nehalem 아키텍처의 제일큰 중점은 고성능계산(HPC) 강화 이며, 데이타베이스와 가상화성능, 게임성능의 강화가 2차적으로 중요한 임무입니다. 하지만 게임쪽은 우선 그래픽 카드가 먼저 중점이 되어야 겟지만요.
아마도 물리 가속기술이 CPU에 더 의지된다면 달라 질수 있습니다. 하지만 최소한 현재는 그렇지 않습니다.
이 점은 바로 HEXUS.net 에서 어제 발표했던,3DMark와 3D게임 쪽으로, Nehalem이 결코 Penryn보다 좋은점이 크게 없었다는 점 이겟습니다.
그렇다면 과연 왜그런 결과가 생겼을까요? 이유는 대다수 게임들이 더욱 빠른 캐쉬와 더욱 고성능의 정수연산에 의지해 돌아가기 때문입니다. 더더욱 현단계의 Intel 프로세서 캐쉬는 AMD보다 의존도가 더욱 큽니다. 또한 P4와 K8을 비교해 봐도 Core 아키텍처의 정수성능은 크게 상승됐습니다. 이때문에 게임에서도 좋은 성능을 보여주는 것이며, Nehalem의 이러한 쪽의 성능향상은 아주 작습니다. 어떤 점에서는 오히려 후퇴한 부분도 있고요.
자 새로운 캐쉬 시스템에 대해 살펴 봅시다. Nehalem은 매 코어마다 2×32KB의 L1 캐쉬와 256KB의 L2 캐쉬를 장착했고, 전체 코어가 공유하는 8MB의 L3캐쉬가 있습니다. 이것은 각각 4, 12, 40 싸이클씩 엑세스 레이턴시를 갖고있습니다. 그리고 Penryn은 L1 레이턴시 가 3사이클 이며, L2 캐쉬는 14사이클로 느린편 입니다. 하지만 용량은 6MB x2 이며 Nehalem의 24배에 해당됩니다. 주의할점은 여기서 설명한 캐쉬는 하이앤드 상품으로 설명한 것입니다. 보급형 상품과는 차이가 있습니다.
Penryn에서 대다수 게임들은 L2캐쉬 히트율이 좋은편 입니다. 그러나 Nehalem은 다릅니다. 비록 메모리 컨트롤러를 내장했다 하더라도 이게 도움을 주는건 크지 않습니다. L3 캐쉬의 낮은 속도와 L2캐쉬의 적은 용량의 영향은 이처럼 큰것입니다.
게임에서 좀 딸린다고 이게 막상 나쁘게 볼 일도 아닙니다. Nehalem의 전체적인 성능은 여전히 많은 개선이 이루어 졌습니다. Core、Penryn 모두 좋은 아키텍처 지만, 고성능 계산이나, 데이타베이스성능 에서는 여전히 AMD Opteron 보다 한참 못했었습니다. 그러나 Nehalem에서 이러한 부분을 개선한 것입니다.
대다수 데이타 베이스 코드는 제대로 Penryn 아키텍처를 이용하지 못합니다. 매 순환 명령 수는 0.5개 까지 되질 못하고, 이 때문에 대다수는 한없이 기다리기만 합니다. Nehalem의 SMT 기술은 이러한 문제를 해결해 주었습니다. 1개의 스레드가 메모리를 기다리고, 다른 한개의 스레드가 다른 작업을 수행합니다. 반대상황도 역시 마찬가지 고요.
두 번째,4스레드(혹은 8스레드) Nehalem 시스템은 동시에 4스레드(혹은 8스레드) 가 L3에 접속이 가능합니다. 이와 유사한 것으로 Tigerton 이 8개 스레드로 L2캐쉬를 동시접속 하며, 이것으로 왜 Nehalem의 캐쉬 구조가 서버에서 요구되는 성능에 적합한지 설명이 됩니다. 하지만 이것으로 인해 게임성능에서 소홀히 하게된 원인이기도 합니다.
또하나 살펴볼 점은, 우리가 보통 말하는 네할렘은 일종의 새로운 아키텍처 입니다. 하지만 여전히 콘로의 CORE 아키텍처에서 개선된 것이기 떄문에 그 효과가 엄청나게 차이 날 리가 없습니다.
이것은 IDF 현장의 Inte이 이야기하던 Core i7 의 이름에서도 알수가 있습니다.
아래부터는 IDF 에서 전시한 인텔의 Nehalem 시스템 Core i7 사진들 입니다.
사진 클릭하면 커져요
'뉴스거리 > 프로세서' 카테고리의 다른 글
Atom 의 또다른 강적 AMD Sempron BGA 등장 (0) | 2008.08.22 |
---|---|
헐퀴~! NVIDIA가 다음주에 x86 프로세서를 발표? (0) | 2008.08.21 |
IBM이 업계 최초로 22nm SRAM 을 완성, Intel의 강력한 맞수 (0) | 2008.08.19 |
HyperTransport 3.1 대역폭 3.2GHz 로 업그레이드 (0) | 2008.08.19 |
CPU+GPU 합체된 Fusion 상세 규격 공개 (0) | 2008.08.19 |