본문 바로가기

컴퓨터

AMD 페넘 플랫폼 - 듀얼채널과 싱글채널에 따른 성능차이


대역폭이 곧 생명이라 할만큼 AMD 플랫폼에서는 메모리가 중요한 부분을 차지하고 있습니다.

페넘 K10 플랫폼과 애슬론 K8 은 메모리컨트롤러가 내장되어 있으며, 메모리에 따른 성능차이가 인텔에비해 큰편입니다. 때문에 AMD 시스템에서의 성능에 있어서, 대단히 중요하다고 볼수 있습니다.

하지만 K10 과 K8의 메모리 컨트롤러는 조금 차이가 납니다.

K8에서는 메모리컨트롤러 클럭이 곧 CPU 와 노스브릿지 클럭과 동기화 됐었지만,

K10에서는 메모리컨트롤러 클럭이 CPU 와 노스브릿지 클럭과 비동기 방식입니다.

때문에 듀얼메모리에 대한 성능차이는 K8이 훨씬 더 높다고 볼수있습니다.

대신 K10 에서는 비동기인 메모리컨트롤러 클럭을 만회하기 위해, 메모리컨트롤러 자체를
듀얼로 구성했습니다. 즉 메모리컨트롤러가 물리적으로 [ 64bit X 2개 ]입니다. 
이에 관한 부분은 전에도 소개한바 있으니 참고하세요. 

지난 관련글 : 2008/10/12 - 페넘의 Ganged/Unganged 방식에 따른 성능 비교

자 그럼 페넘 플랫폼을 가지고, 제가 직접 메모리를 싱글/듀얼 로 구성한 후, 각각 차이점에 대해서 짚어보도록 하겟습니다. 
 
 


라이트마크의 멀티 스레드 메모리 테스트 입니다.

위의 스샷이 CPU-z 에서 확인 할 수 있듯이 싱글채널 이며, 아래쪽이 듀얼채널 입니다.

비록 돌린 시간이 다소 차이가 납니다. 하지만 오래돌린다고 그리 큰차이는 안납니다.
 
이건 돌리는 순간 풀로드로 가동 되거든요.

싱글에서의 평균 메모리 대역폭은  25295.2 메가바이트/초 이며,
듀얼에서의 평균 메모리 대역폭은  25714.1 메가바이트/초 이군요.

많은쪽이 좋은 겁니다.












이번엔 산드라 2009 에서의 메모리 대역폭 테스트 입니다.

싱글채널 상태에서의 메모리 대역폭은
Int    :   6186 메가바이트/초
Float :   6198 메가바이트/초

듀얼채널 상태에서의 메모리 대역폭은
Int    :   10475 메가바이트/초
Float :   10261 메가바이트/초

딱봐도 듀얼채널쪽이 더 대역폭이 넓다고 할수 있겟습니다.
거의 60% 이상 더 대역폭이 넓다고 할수 있겟네요.















계속해서 산드라 2009 에서의 메모리 테스트 입니다.
이번엔 메모리 레이턴시를 테스트 해 보았습니다.

싱글채널 상태에서의 메모리 레이턴시는 
Memory Latency    :   88ns
Speed Factor        :   77ns

듀얼채널 상태에서의 메모리 레이턴시는
Memory Latency    :   88ns
Speed Factor        :   79.5ns

이 결과로 보아 듀얼채널은 메모리 레이턴시 부분에서 영향을 주지 않는것으로 보입니다.












계속해서 산드라 2009 에서의 메모리 테스트 입니다.
이번엔 캐쉬 메모리 테스트를 해 보았습니다.

싱글채널 상태에서의 캐쉬 메모리 대역폭은 
Memory Latency    :   25.531 기가바이트/초
Speed Factor        :   42.3

듀얼채널 상태에서의 캐쉬 메모리 대역폭은
Memory Latency    :   31.940 기가바이트/초
Speed Factor        :   24.1

이 항목을 보면 듀얼채널이 캐쉬 메모리 대역폭에도 영향을 주는것으로 보입니다.

듀얼채널로 인해 캐쉬 메모리 대역폭은 24% 의 향상을 보이네요.

















이번엔 듀얼채널로 인한 체감을 몸소 실천해 볼수있는  인코딩 테스트를 해 보았습니다.

메구이를 이용한 x264 인코딩 입니다.

동영상은 SBS 081105 초콜릿 TP 파일이며 VOS 가 부른 무대영상 부분을 1패스로 인코딩 하였습니다. 동영상은  재생 시간이 3분 47초 짜리 입니다.

동일한 동영상을 인코딩 하였고, 메구이 인코딩 옵션 설정도 동일합니다.
 
위의 스샷이 싱글채널 상태에서 저장한 스샷이고, 아래는 듀얼채널 입니다.













위는 싱글채널 에서의 결과물 이며, 아래는 듀얼채널 에서의 결과물 입니다.

인코딩에 걸린 시간은
싱글채널 에서 13분 45초가 걸렸으며,

듀얼채널 에서는 12분 1초가 걸렸습니다.

3분 37초 짜리 영상에 1패스라는 점을 감안하면, 결코 무시할수 없는 속도차이 입니다.
2패스에 영화 한편을 인코딩한다고, 가정 했을때는 더욱 큰 차이를 보일 것입니다.














듀얼채널 메모리 설정에 따른 게임에서의 성능 향상에도 변화가 있을까요?

3Dmark06 을 이용하여 비교해 보았습니다.  

위 스샷은 싱글채널 상태이며, 아래 스샷은 듀얼채널 상태의 스샷 입니다.

싱글채널에서의 3Dmark06  점수는

SM2.0          : 558
HDR/SM3.0  : 680
CPU             : 2925
종합             : 1754

듀얼채널에서의 3Dmark06 점수는

SM2.0          : 617
HDR/SM3.0  : 766
CPU             : 2909
종합             : 1952


내장그래픽의 탓도 있겟지만, 내장그래픽은 시스템 메모리를 공유하기 때문에, 메모리 듀얼채널의 영향을 확실히 많이 받습니다.

그래서 내장그래픽 본연의 능력도 듀얼채널구성시 한층 향상시킬수 있는것 입니다. 

때문에  SM2.0 과 HDR/SM3.0  부분에서 큰 차이를 보이고 있네요. 반면에 CPU 부분은 큰 변화가 없습니다. 오히려 듀얼채널 쪽이 16점 정도 낮게 나타났는데, 이건 아마도 오차범위로 해석 됩니다. 

외장그래픽이었다면 이것과 다른 차이를 보여줄 수도 있겠지만, 결과적으로 봤을 때 듀얼채널이 더 좋다는 점은 변화가 없을 것입니다.   

 












아까 인코딩한 VOS 무대영상 PNG 스샷 파일 입니다.
그냥 테스트용으로 인코딩한 것이기 때문에 비트레이트도 낮고,  인코딩 설정도 1패스라 화질이 별로네요.









마지막으로 에버레스트 한번 해봤습니다.

솔직히 에버레스트는 페넘 테스트에 딱 맞는 벤치마크 프로그램이 아니지만

그냥 참고로 보시면 될꺼 같습니다.


위 스샷이 싱글채널 상태 이며, 아래 스샷이 듀얼채널 상태의 스샷 입니다. 

싱글채널
메모리 읽기 6823 메가바이트/초
메모리 쓰기 5113 메가바이트/초
메모리 복사 6007 메가바이트/초

듀얼채널
메모리 읽기 7273 메가바이트/초
메모리 쓰기 5235 메가바이트/초
메모리 복사 7806 메가바이트/초

확실한 메모리 성능 차이를 보이긴 하네요. 그런데 에버레스트는 페넘에 적합한 벤치툴은 아닌것 같습니다.....참고로만 보세요.  


 







결론



닥치고 듀얼채널로..................