본문 바로가기

뉴스거리/그래픽 카드

AMD Radeon HD4870/4850 정식 발표 및 벤치

최근 그래픽카드 분야가 대단히 떠들썩 합니다. NVIDIA 와 AMD 의 잇달은 신제품 출시가 신시대를 열고 있습니다. 먼저 GT200 아키텍처의 GeForce GTX 280/260 가 등장했고,그간 경쟁속에서 엔비디아는 확고한 자리를 굳혔으며, 이어서 Radeon HD4850 가  AMD 로 부터 나타났습니다. 그리고 여러군데 에서의 성능 테스트 는 실제로 많은 사람들을 흥분 시켰습니다. 이에 NVIDIA 는 무리해서 55nm 공정의 새로운 졸속작품으로 맞서고 있습니다. 현재 RV770 아키텍처의 Radeon HD 4870/4850 가 정식으로 발표 되었고, 드디어 이제 AMD 의 정식 공격이 시작된것 입니다.

ATI Radeon HD4800 시리즈 공식 웹페이지:http://www.unleashonetera.com/

사용자 삽입 이미지

RV770 코어는 TSMC 의 55nm 공정으로 생산되었습니다.
9.56억 개의 트랜지스터가 집적 되어 있으며,(발표전의 소문은 9.65 억개 였습니다.)
같은 나노공정의 선배인 RV670 보다 2.90억개나 더많이 트랜지스터가 집적되어 있습니다. 퍼센트 로는43.5% 가 더 많아진 셈입니다. 하지만 14억 개의 트렌지스터가 집적 되어있는 65nm 의 GT200 역시 만만치 않습니다. 트랜지스터 집적 양으로는 후자보다 68.3% 나 많은 거네요. 하지만 제조공정이 틀립니다. 때문에  RV770 과GT200 의 코어 면적은 큰 차이가 납니다. 아래의 사진을 참고해서 비교하세요.

사용자 삽입 이미지
Penryn、RV770、GT200 코어 면적 비교

사용자 삽입 이미지
RV770 웨이퍼 일부분

스펙방면은,RV770 에는 800개의 쉐이더가 집적되어 있습니다.(한때는 480개 라고 여겨지기도 했음) 이것은 RV670 보다 2.5 배나 많은것 입니다. 또한 텍스처 유닛은 40개 이지만ROP 유닛은 아직도 16개 입니다. 그나 철저히 튜닝을 해서, 안티엘리어싱(AA) 같은 경우는 아주 효과적 으로 성능을 보여준다고 할수 있겟습니다.

하이앤드 급인 Radeon HD4870 코어는 클럭이 750MHz 입니다. 메모리는 512MB GDDR5 이구요,메모리 대역폭 비트는 256-bit 이며,클럭은 900MHz 입니다. 해당 데이타 전송률은 3.6Gbps(QDR)에 달합니다. 실제 대역폭은 115.2GB/s 이며,이미 448-bit 의  999MHz 클럭 896MB 용량 GDDR3 의 GeForce GTX260 111.9GB/s 보다 앞서있는 대역폭 입니다. 부동소수점 연산 능력은 1.2TFlops 이며,사상 제일 빨리 부동소수점 연산능력이 1TFlops 를 넘어선 싱글코어 그래픽 카드입니다. 거기에 새로운 GDDR5 메모리를 제일 처음 사용했으며, NVIDIA 는 아마도 빨라야 내년 하반기가 되어야 GDDR5 를 채용한 그래픽카드를 선보일 것입니다.

퍼포먼스 급인 Radeon HD4850 코어는 클럭이 625MHz 이며,슬롯을 간단화 시켜 발열을 내렸으며,그래픽 메모리도 현재 사용되고 있는 GDDR3 를 사용했습니다. 메모리 대역 비트는 256-bit 이며、512MB 용량에、993MHz 클럭이며,  메모리는 2Gbps 、그래픽카드 전송률은 63.6GB/s 이며、부동소수점 연산 능력은1.0TFLops 입니다.
종합해 볼때 클럭도 낮고 데이타 전송률도
HD3870 이나 9800GTX 에 비해 느리지만,성능은 매우 출중합니다.

AMD 는 이 두개의 그래픽카드의 전력소모율을 공개한적이 한번도 없습니다. 하지만 상세하게 규정된 파워의 와트를 요구 합니다. :
Radeon HD4870 싱글카드는 500W 는 되어야 한다. 그리고 두개의 6핀 전원커넥터를 사용해야 합니다. 듀얼 CrossFire 시에는 600W 이상은 되어야 합니다.
Radeon HD4850 싱글카드는 450W 이상은 되어야 합니다. 그리고 한개의 6핀 전원 커넥터를 이용합니다. 듀얼 CrossFire 시에는 적어도 550W 이상은 되어야 합니다.

Radeon HD4850 의 공식 권장소비자가격 은 199 달러 입니다. 이미 대량이 시장에 풀렸습니다.
Radeon HD4870 의 공식 권장소비자가격 은 299 달러 입니다. 7月8日 에 시장에 풀릴것으로 예정되어 있습니다. 하지만 이미 많은 제조사들이 이 카드를 만들어 놨습니다. 그래서 곳곳에서 벤치들이 쏟아지고 있죠.

사용자 삽입 이미지

사용자 삽입 이미지

AMD 공식 짤방 입니다 (클릭하면 커집니다):

사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지


구체적인 아키텍처의 방면으로는,RV770 은 상당히 RV670 의 강화버전 이라고 볼수있습니다. 그리고 뿐만아니라 480개의 쉐이더 유닛이 추가 됐구요, 그외에도 아주 많은 개선의 흔적이 보입니다. 그중 특별히 꼽을게 있다면 메모리 컨트롤러의 변화 입니다.

과거 R520 부터 시작해서,ATI 는 고리형 구조의 데이타 버스 “Ring Bus” 를 대입 시켯습니다.  이것은 매우높은 속도와 넓은 대역폭을 가능케 했습니다. 그후에 R600 에 오면서 이 링버스는 업그레이드가 됐습니다. 내부 데이타 대역폭이 100GB/s 에 도달했던 것입니다. 이것은 ATI 에 있어서 줄곧 이것이 진리로 여겨져 왓습니다. 하지만,이러한 기술도 치명적인 결점이 존재 합니다. 바로 쉽게 만들어지는 대역폭과 에너지의 낭비 입니다. 전력소모율을 제어하는데 불리한 것입니다.  특히 AMD는 현재 와트당 성능비의 우수성을 추구하고 있기 때문에 이러한 정황으로 비추어 보아 RV770 에서는 Ring Bus 기술을 포기하기에 이릅니다. 기존의 전통적인 중심교환식 아키텍처인 “Switched Hub” 로 바꾸게 되었습니다.

이러한 아키텍처로, 그래픽 전문 제어기나, PCI-E 인터페이스、UVD2 엔진 등등 에서  데이타를 멀리 빙빙 돌려 지나가게 하지 않아도 되게끔 되었습니다. 이때문에 에너지가 절약이 되었으며,게다가 링버스를 포기함으로써 효력을 낮추었습니다. 그 이유는 데이타가 현재 p2p 방식을 사용하고 있기 때문이며, 당연히 이러한 설계의 결점은 대역폭의 엄청난 하락으로 이어집니다. 하지만 사실상 현재의 그래픽카드는 일반적으로 지나치게 큰 대역폭을 필요로 하지는 않습니다. ATI 는 분명하게 R520, R600 에서 대역폭의 필요량을 높게 평가 했습니다.

그렇다면 대역폭의 하락은 혹시 멀티 CrossFire 에 손해가 아닐까요?
AMD 도 분명히 이러한 점을 고려했습니다. RV770 아키텍처 에서 “CrossFire Sideport” 라는걸 추가시켰습니다.  이것이 하는 작용은 멀티 GPU 사이에에서 코어와 코어 사이의 통신을 연결해주는 역활을 합니다. 당연히 RV770 은 싱글칩의 그래픽카드 이기 때문에 저런게 필요가 없습니다. 이것은 R700 에서나 필요한겁니다. 여기서도 AMD 가 앞으로 병렬연결 구조의 하나의 카드에 멀티 GPU 를 탑재하는 아키텍처를 고수할 것이라는 의지가 보여집니다.

사용자 삽입 이미지

RV770 의 아키텍처

 

사용자 삽입 이미지
RV670 의 링버스아키텍처

사용자 삽입 이미지
RV770 스위치 허브 아키텍처

전에 말했듯이,RV770 는 비록 ROP 유닛이 16개 밖에 없지만,설계를 완전히 새롭게 바꾼결과,하드웨어에서의 AA 처리 능력이 특별 해졌습니다. 거기다 쉐이더 숫자 또한 무섭게 증했습니다. RV770의 AA 성능은 RV670 의 성능에 비해 아주 큰폭으로 상승했습니다.  *AA : 안티엘리어싱

사용자 삽입 이미지
사용자 삽입 이미지


이제부터 3D 게임 성능을 가려봅시다.  RV770 카드들을 잘살펴 보세요.

사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지


아래는 전력 소비율 입니다.

사용자 삽입 이미지
사용자 삽입 이미지

데이타와 도표로 답이 딱 나옵니다. AMD 가 "단위면적의 성능" 에서 새로운 표준을 만들어 냈다고 보여집니다. 즉 각 평미밀리미터 당 GPU가 얼마나 많은 부동소수점 성능이나 게임성능을 보여주는가 입니다. RV770 과 GT200 의 코어면적의 데이타 성능 을 비교하여 말한것입니다.

사용자 삽입 이미지
매 평방밀리미터의 부동소수점 능력(GFlops)

사용자 삽입 이미지
매 평방센티미터의 게임 프레임(FPS)

사용자 삽입 이미지
매 평방센티미터 의 전력소비율(J 에너지 단위)

결론:

Radeon HD4850 은 우리들에게 큰 기쁨을 안겨줄 것입니다. 꾸준하게 그 증거가 뒷바침 되고 있으며,200 달러의 가격인 Radeon HD4850 의 경쟁력은 의심하지 않아도 될만합니다. 사고도 후회하지 않을 물건 이죠. 9800 GTX 가 비록 가격이 하락하여 199 달러라고 하지만,,HD4850 보다 모자라 보입니다. 신공정의 55nm 9800GTX+ 역시 경장자일수 있지만, 30달러나 더 비쌉니다. 또 출시날짜도 반달 이상 이나 남았습니다.

Radeon HD4870 의 가격대비 성능의 뛰어난 점을 간단하게 묘사하자면, 300달러 의 가격대로 450달러의 GeForce GTX260 을 교환받아 온것이랑 같은 수준입니다.어떨때는 600달러의 GeForce GTX280 과 거의 같은 수준일수도 있습니다.

하는김에 (GPGPU : 통용계산) 문제도 이야기 하겟습니다. NVIDIA 의 CUDA 기술은 이미 상당히 훌륭한 개발을 이뤄냈습니다. Ageia 를 구매한 이후 PhysX 물리가속을 자신의 그래픽 카드에 투입시킨 것은 모두 뛰어난 성과로 볼수있습니다. 비장의 무기로 봐도 되겟구요. 하지만 AMD의 통용계산 역시 상당히 조예가 깊습니다. 하지만 AMD 쪽은 실재로 응용성은 좀 뒤떨어집니다. 또 다른 방면 으로는,AMD는 자기만의 CPU가 있습니다. CPU와 GPU에 같이 손을 댈수있고 Intel-Havok 과 같은 관계를 보면 이는 증명이 됩니다. 그러나 NVIDIA 는 AMD intel 과 같은 일을 할수가 없습니다. 때문에 현재  NVIDIA 는 GPU의 중요성을 강조하고 있지요. 뭐 이런걸로 볼때 당연한 겁니다.현재 그래픽카드의 통용계산응용은 이제 시작입니다. 전체적으로 봤을땐 아직 뜨겁게 달궈지지가 않았습니다. 또 하드웨어적 / 소프트웨어적 제조사의 지원 여건도 만만치 않고요, 발전하는데 또 오래걸립니다. 즉 현재 취득한 NVIDIA 의 이익은 과시할만한게 못됩니다. 아마도 게임 카드와 게임도 되면서 통용연산을 지원하는 카드가 있다고 해도 현재는 게임카드를 사람들이 더 선호한다고 보여집니다.(RV770 과 9800GTX+ 의 비유)

당연히,NVIDIA와 AMD 는 전혀다른 그래픽 코어 기술이기도 합니다. 응용프로그램 과 3D게임은 최적화는 아주 중요합니다. 여기서 비기술적 측면을 이야기하면 사정은 더 설명하기 어려워 짐니다. 미래에는 앞으로  통용계산과 게임을 어떻게 이용하게 될지 지켜보도록 합시다.


마지막으로 AMD 의 공식자료인 Cinema 2.0  동영상 입니다.
Cinema 2.0 에 관한 정보는 여기로 보시면 아실수 있습니다.
http://jacks.tistory.com/23         http://jacks.tistory.com/13

Ruby 가 거미로봇 에게 쫒기는 영상:
http://download.amd.com/Corporate/AMD_RUBY_S04.mov

하얀 전갈:
http://download.amd.com/Corporate/Cinema/AMD_FINCHER_HD.mov

사용자 삽입 이미지
사용자 삽입 이미지

驱动之家[原创] 作者:上方文Q 编辑:上方文Q 2008-06-25 15:42:28