AMD RDNA와 GCN GPU 아키텍처의 차이점 | PC 정보

본문

BEST

PC 정보

전체

[참고] AMD RDNA와 GCN GPU 아키텍처의 차이점

잼잼버린

추천 18 | 조회 11071

일시 21.05.15 (23:39:04)

IP : (IP보기클릭)39.7.***.***

활동내역 | 작성글 | 쪽지 | 마이피 | 타임라인
출석 1696일 | LV. 44 | Exp. 91% | 비추력 16320

잼잼버린 일시 2021.05.15 추천 18 조회 11071 댓글수 16

Big Navi 그래픽 카드의 출시와 함께 AMD는 마침내 고급 GPU 공간으로 돌아왔습니다. RDNA 2 설계는 컴퓨팅 및 그래픽 파이프 라인 측면에서 RDNA 1과 거의 유사하지만 Infinity Cache 및 높은 부스트 클럭을 포함할 수 있는 몇 가지 변경 사항이 있습니다. 이 게시물에서는 Navi GPU가 GCN 아키텍처로 구동되는 기존 Vega 및 Polaris 부품과 어떻게 다른지에 대해 설명합니다.

* AMD RX 6800 리뷰: RTX 3080의 뒤꿈치를 깨물고 있습니다.

AMD의 GCN 아키텍처는 거의 10년 동안 Radeon 그래픽 카드를 지원했습니다. 디자인에는 강력한 Compute Engine, 하드웨어 스케줄러, 통합 메모리와 같은 장점이 있었지만 게임에는 그다지 효율적이지 않았습니다. 하드웨어 사용률은 최신 NVIDIA 부품에 비해 상당히 낮았으며 셰이더 엔진 당 처음 11개 CU 이후 확장이 급격히 떨어졌으며 전체적으로 GPU 당 64개 이상의 CU를 사용하는 것은 불가능했습니다.

퀘이사존

그 결과 강력한 컴퓨팅 아키텍처를 갖추고 있음에도 불구하고 AMD의 GCN GPU (Vega)는 NVIDIA의 하이엔드 게임 제품에 계속해서 패배하면서 훨씬 더 높은 전력을 소비했습니다.

퀘이사존

"RDNA는 GPU 아키텍처이고 Navi는 이를 사용하여 구축된 그래픽 프로세서의 코드명입니다. 마찬가지로 GCN은 아키텍처였고 Vega와 Polaris는 코드명입니다."

Navi 10 및 Navi 14 GPU (Radeon RX 5500 XT, 5600 XT 및 5700 / XT)를 지원하는 1세대 RDNA 아키텍처는 GCN과 동일한 빌딩 블록을 기반으로 합니다. 주소 계산 및 제어를 위한 몇 개의 전용 스칼라가 있는 벡터 프로세서 흐름, 별도의 컴퓨팅 및 그래픽 파이프 라인이 비동기 적으로 실행됩니다. 스트림 프로세서라고 하는 ALU는 연산 능력을 제공하고 명령 프로세서 (ACE와 함께)는 연산 장치 당 워크로드 스케줄링을 처리합니다.

핵심적인 차이점은 RDNA가 더 높은 IPC, 더 낮은 지연 시간 및 더 나은 효율성을 위해 GCN의 기본 구성 요소를 재구성한다는 것입니다. 이것이 Navi의 모든 것입니다. 훨씬 적은 하드웨어로 훨씬 더 많은 일을 합니다!

AMD GCN: 강력하지만 활용도가 낮음

AMD의 GCN 그래픽 아키텍처는 컴퓨팅 유닛 당 64개의 웨이브 프론트 또는 작업 항목 (및 ALU / 코어)으로 구성되었습니다. 이들은 각각 16개의 ALU (SP)를 포함하는 4개의 SIMD (다중 데이터 유형에 대한 단일 명령어)로 나뉩니다.

퀘이사존

여기에서 대부분의 사람들이 혼란스러워합니다. 예, 스케줄러가 4주기마다 새로운 웨이브 그룹을 발행할 수 있지만 한 번에 각 컴퓨팅 유닛은 64개 항목 웨이브 하나가 아닌 4개의 64 항목 웨이브에서도 작동합니다. 불도저와 마찬가지로 목표는 병렬화를 극대화하는 것이었습니다. 동시에 GCN은 비 순차적인 아키텍처가 아니었습니다. 웨이브 프론트 내의 명령은 여전히 주문에 따라 실행되었습니다. 차이점은 CU 또는 SIMD가 사용 가능한 네 가지 웨이브 중 하나로 전환할 수 있다는 것입니다.

* SIMD 란 무엇입니까? 어떻게 작동하며 SIMT와 어떻게 다릅니까?

이것이 그다지 효과적이지 않은 이유는 대부분의 게임이 더 짧은 작업 대기열을 사용하기 때문입니다. 그 이유는 4개의 웨이브 프론트 중 1 ~ 2개만 실행주기 당 포화 상태이기 때문입니다. 결과적으로 유사한 셰이더 수를 가진 경쟁 NVIDIA GPU는 Super-Scalar 아키텍처 덕분에 훨씬 빨랐으며 이러한 짧은 디스패치를 실행하는 데 1 ~ 2 사이클 만 걸렸습니다. 반면에 AMD는 추가 웨이브 프론트를 위한 공간이 있음에도 불구하고 다음 사이클을 위해 4사이클을 기다려야 했습니다.

"각 벡터는 여러 데이터 세트에서 동일한 명령어를 수행할 수 있습니다. 벡터 스케줄링은 항상 여러 항목에서 실행되는 하나의 명령이 있다는 것을 기반으로 작동합니다. 사용 가능한 세트가 하나 또는 두 개뿐이면 나머지 슬롯은 해당 주기 동안 유휴 상태가 됩니다."

퀘이사존

GCN 컴퓨팅 유닛

요약하자면 다른 많은 SIMD 설계와 마찬가지로 GCN 컴퓨팅 유닛은 한 번에 4개의 웨이브 프론트에서 작업했으며 이를 실행하는 데 4주기가 걸렸습니다. 이상적인 세계에서 이것은 한 파동에 소요되는 유효 시간이 한 사이클임을 의미합니다. 그러나 SIMD가 작동하는 방식 때문에 그렇지 않았고 CU는 종종 활용률이 낮았습니다.

* NVIDIA vs AMD 그래픽 카드: RDNA 및 Turing GPU 아키텍처 비교

AMD RDNA: 듀얼 컴퓨팅 아키텍처 및 Wave32

Navi에서 구현된 RDNA 아키텍처는 32개의 작업 항목이 있는 더 좁은 웨이브 프론트인 wave32를 사용합니다. 이전 wave64 디자인보다 훨씬 간단하고 효율적입니다. 각 SIMD는 더 넓지 만 컴퓨팅 유닛은 더 좁습니다.

퀘이사존

RDNA 듀얼 컴퓨팅 장치: 로컬 데이터는 두 CU 간에 공유됩니다.

컴퓨팅 유닛이 GCN의 기본 셰이더 유닛인 경우 RDNA는 이를 WGP (Work-Group 프로세서)로 대체합니다. 두 개의 CU가 공유 로컬 데이터와 함께 작동합니다. RDNA SIMD는 GCN의 두 배인 32개의 셰이더 또는 ALU로 구성됩니다. CU 당 2개의 SIMD가 있고 듀얼 컴퓨팅 장치에 4개의 SIMD가 있습니다. CU의 총 스트림 프로세서 수는 여전히 64개이지만 더 넓은 2개의 SIMD (4개가 아님)에 분산되어 있습니다. 아래의 지침 다이어그램 당 4개 사이클 대 1개 사이클을 참조하십시오.

"RDNA SIMD는 GCN의 두 배인 32개의 셰이더 또는 ALU로 구성됩니다. CU 당 2개의 SIMD가 있고 듀얼 컴퓨팅 장치에 4개의 SIMD가 있습니다. CU의 총 스트림 프로세서 수는 여전히 64개이지만 더 넓은 2개의 SIMD (4개가 아님)에 분산되어 있습니다."

퀘이사존

이 배열은 하나의 클록 사이클에서 하나의 전체 웨이브 프론트를 실행하여 병목 현상을 줄이고 IPC를 4배까지 높일 수 있습니다. 웨이브 프론트를 4배 빠르게 완료하면 레지스터와 캐시가 훨씬 더 빠르게 해제되어 전체적으로 더 많은 명령을 예약할 수 있습니다. 또한 wave32는 수 레지스터의 절반을 wave64로 사용하여 회로 복잡성과 비용도 줄입니다.

퀘이사존

더 좁은 파면을 수용하기 위해 벡터 레지스터 파일도 재구성되었습니다. 이제 각 벡터 범용 레지스터 (vGPR)에는 32-bit (FP32의 경우) 너비의 32개 레인이 포함되고 SIMD에는 총 1,024개의 vGPR이 포함됩니다. 다시 말해서 GCN에서와 같이 레지스터 수의 4배입니다.

* CPU 레지스터, 캐시 및 메모리

전반적으로 더 좁은 wave32 모드는 IPC와 총 동시 웨이브 프론트 수를 개선하여 처리량을 증가시켜 성능과 효율성을 크게 향상시킵니다.

퀘이사존

이전 GCN 명령어 세트와의 호환성을 보장하기 위해 Navi의 RDNA SIMD는 혼합 정밀도 컴퓨팅을 지원합니다. 따라서 새로운 Navi GPU는 게임 워크로드 (FP32) 뿐만 아니라 과학 (FP64) 및 AI (FP16) 애플리케이션에도 적합합니다. RDNA SIMD는 wave32 모드에서 2배, wave64 모드에서 44%의 지연 시간을 개선합니다.

퀘이사존

4주기 vs 명령 당 1주기

비동기 컴퓨팅 터널링

GCN 아키텍처의 주요 하이라이트 중 하나는 NVIDIA가 그래픽 카드에 통합하기 전에 비동기식 Compute Engine 방식을 사용하는 것입니다. RDNA는 그 기능을 유지하고 두 배로 늘어납니다.

퀘이사존

명령 프로세서는 API의 명령을 처리한 다음 각 파이프 라인에 실행합니다. 그래픽 명령 프로세서는 그래픽 파이프 라인 (셰이더 및 고정 기능 하드웨어)을 관리하고 4개의 비동기 Compute Engine (ACE)이 컴퓨팅을 처리합니다. Navi 10 다이 (RX 5700 XT)에는 그래픽 명령 프로세서 1개와 ACE 4개가 있습니다. 각 ACE에는 고유한 명령 스트림이 있으며 GCP에는 모든 셰이더 유형 (도메인, 정점, 픽셀, 래스터 등)에 대한 개별 스트림이 있습니다.

"GCN에서 명령 프로세서는 그래픽보다 컴퓨팅의 우선순위를 지정할 수 있습니다. RDNA 아키텍처에서 GPU는 우선순위가 높은 컴퓨팅 작업에 모든 리소스를 사용하여 그래픽 파이프 라인을 완전히 중단할 수 있습니다."

퀘이사존

RDNA 아키텍처는 비동기 컴퓨팅 터널링이라는 새로운 기능을 도입하여 명령 수준에서 병렬 처리를 개선합니다. GCN과 최신 Navi GPU는 모두 비동기 컴퓨팅 (그래픽 및 컴퓨팅 파이프 라인의 동시 실행)을 지원하지만 RDNA는 한 단계 더 나아갑니다. 한 작업 (그래픽 또는 컴퓨팅)이 다른 작업보다 지연 시간에 훨씬 더 민감 해지는 경우 Navi는 후자를 완전히 중단할 수 있습니다.

GCN 기반 Vega 설계에서 명령 프로세서는 그래픽보다 컴퓨팅의 우선순위를 지정하고 셰이더에 더 적은 시간을 소비할 수 있습니다. RDNA 아키텍처에서 GPU는 우선순위가 높은 컴퓨팅 작업에 모든 리소스를 사용하여 그래픽 파이프 라인을 완전히 중단할 수 있습니다. 이는 가상 현실과 같이 대기 시간에 가장 민감한 워크로드에서 성능을 크게 향상시킵니다.

제어 흐름을 위한 스칼라 실행

AMD의 GCN 및 RDNA 아키텍처에서 대부분의 계산은 본질적으로 벡터인 SIMD에 의해 수행됩니다. 여러 데이터 유형에 대해 단일 명령을 수행합니다 (주기 당 SIMD 당 32 INT / 32 FP가 동시에 실행됨). 그러나 각 CU에도 스칼라 단위가 있습니다. RDNA 1의 각 컴퓨팅 유닛은 사이클 당 4개의 명령어, 2개의 스칼라, 2개의 벡터를 시작 (디스패치) 할 수 있습니다. RDNA1 WGP 내에서 총 처리량은 클록 당 128개의 벡터와 4개의 스칼라입니다. 4개의 SIMD 각각은 그 수치에 똑같이 기여합니다.

퀘이사존

각 SIMD에는 20개의 웨이브 프론트 각각에 대해 128개의 항목이 있는 10KB 스칼라 레지스터 파일이 포함되어 있습니다. 레지스터는 폭이 32-bit이며 패킹된 16-bit 데이터 (정수 또는 부동 소수점)를 보유할 수 있으며 인접 레지스터 쌍은 64-bit 데이터를 보유합니다. 스칼라는 로드 / 저장 장치의 주소 생성에 사용되며 SIMD 제어 흐름을 관리합니다.

웨이브 프론트가 시작되면 스칼라 레지스터 파일은 상수를 전달하기 위해 최대 32개의 사용자 레지스터를 미리 로드하여 명시적 로드 명령을 피하고 웨이브 프론트의 시작 시간을 줄일 수 있습니다.

퀘이사존

16KB의 쓰기-백 스칼라 캐시는 4방향 연결 방식이며 각각 64B인 128개의 캐시 라인으로 구성된 두 뱅크로 구성됩니다. 각 은행은 전체 캐시 라인을 읽을 수 있으며, 캐시는 각 SIMD의 스칼라 레지스터 파일에 클럭당 16B를 전송할 수 있습니다. 그래픽 셰이더의 경우 스칼라 캐시는 일반적으로 저장된 상수 및 작업 항목 독립 변수에 사용됩니다.

캐시: L0 및 공유 L1

이전 GCN 및 라이벌 NVIDIA GPU는 두 가지 수준의 캐시에 의존하지만 RDNA는 Navi GPU에 세 번째 L1 캐시를 추가합니다. L0 캐시가 DCU 전용인 경우 L1 캐시는 이중 컴퓨팅 장치 그룹에서 공유됩니다. 이를 통해 비용, 대기 시간 및 전력 소비를 줄일 수 있습니다. L2 캐시의 로드를 줄입니다. GCN에서 코어 당 L1 캐시의 모든 캐시 미스는 L2 캐시에서 처리되었습니다. RDNA에서 새로운 L1 캐시는 각 셰이더 배열 내의 모든 캐싱 기능을 중앙 집중화합니다.

"L0 캐시는 DCU 전용이지만 L1 캐시는 듀얼 컴퓨팅 장치 그룹에서 공유됩니다."

퀘이사존

L0 캐시에서 발생하는 모든 캐시 누락은 L1 캐시로 전달됩니다. 여기에는 픽셀 캐시 외에도 명령어, 스칼라 및 벡터 캐시의 모든 데이터가 포함됩니다. L1은 읽기 전용 캐시이며 각각 4개의 뱅크로 구성되어 총 128KB가 됩니다. 16-way set-associative 캐시 메모리입니다. L1 캐시는 L2에 의해 지원됩니다. L1에 대한 쓰기는 무효화되고 L2 또는 메모리에 복사됩니다.

퀘이사존

L1 그래픽 캐시는 4개의 WGP 또는 셰이더 어레이 간에 공유됩니다.

L1 캐시 컨트롤러는 메모리 요청을 조정하고 클럭 사이클 당 4개를 각 L1 뱅크에 하나씩 전달합니다. 다른 캐시 메모리와 마찬가지로 L1 미스는 L2 캐시에서 처리됩니다.

퀘이사존

Polaris GPU에서는 컴퓨팅 유닛 만 L2 캐시의 클라이언트였습니다. RB, Copy Engine 및 CP가 메모리에 직접 기록하여 많은 L2 플러시가 발생했습니다. Vega는 L2의 RB 클라이언트도 만들어 L2 플러시를 줄임으로써 이 디자인을 개선했습니다. RDNA와 Navi는 복사 엔진을 L2의 클라이언트로 만들어 GCN 파생 제품보다 한발 앞서갑니다. 이로 인해 L2 플러시가 거의 발생하지 않습니다.

듀얼 컴퓨팅 유닛 프런트 엔드

각 컴퓨팅 유닛은 명령어 메모리 가져오기를 통해 명령어를 가져옵니다. GCN에서는 명령어 캐시가 4개의 CU 간에 공유되었지만 RDNA (Navi)에서는 L0 명령어 캐시가 듀얼 CU의 4개의 SIMD 간에 공유됩니다. 명령어 캐시는 32KB이며 4 방향 세트 연관입니다. L1 캐시와 마찬가지로, 각각 64 바이트 길이의 128개 캐시 라인의 4개 뱅크로 구성됩니다.

"GCN에서는 명령어 캐시가 4개의 CU 간에 공유되었지만 RDNA (Navi)에서는 L0 명령어 캐시가 듀얼 CU의 4개의 SIMD 간에 공유됩니다."

퀘이사존

가져온 명령은 웨이브 프론트 컨트롤러에 저장됩니다. 각 SIMD에는 별도의 명령 포인터와 20개 항목의 웨이브 프론트 컨트롤러가 있어 듀얼 컴퓨팅 유닛 당 총 80개의 웨이브 프론트가 있습니다. Wavefront는 작업 그룹 또는 커널과 다를 수 있습니다. 더 많은 수의 웨이브 프론트를 가져올 수 있지만 이중 컴퓨팅 장치는 동시에 두 개의 wave32 작업 그룹에서만 작동합니다.

퀘이사존

"이미 언급했듯이, GCN이 4 사이클마다 한 번씩 지시를 요청한 경우, Navi는 매 사이클(2-4 ins per cycle)마다 지시를 수행합니다. 그 후 RDNA 기반 Navi GPU의 각 SIMD는 사이클마다 명령을 디코딩하고 발행하여 처리량을 높이고 GCN을 통해 대기 시간을 4배 줄일 수 있습니다."

퀘이사존

새로운 wave32 모드를 수용하기 위해 각 RDNA SIMD의 캐시 및 메모리 파이프 라인도 개선되었습니다. 파이프 라인 너비는 GCN 기반 Vega GPU에 비해 두 배가되었습니다. 모든 SIMD에는 웨이브 프론트의 작업 항목에 대한 주소를 ALU 또는 vGPR (벡터 범용 레지스터)로 직접 전송할 수 있는 32 와이드 요청 버스가 있습니다.

한 쌍의 SIMD는 요청 및 리턴 버스를 공유하지만 단일 SIMD는 클럭 당 128B 캐시 라인의 두 청크를 수신할 수 있습니다. 하나는 LDS (Load-Store)에서, 다른 하나는 Vector L0 캐시에서 제공합니다.

렌더 백 엔드 (RB) 및 텍스처 단위

RDNA 기반 Navi GPU의 최종 고정 기능 그래픽 단계는 깊이, 스텐실 및 알파 테스트를 수행하고 앤티 앨리어싱 및 기타 최종 테스트를 위해 픽셀을 혼합하는 RB (렌더링 백엔드)입니다. 셰이더 배열의 각 RB는 클럭 당 4개의 출력 픽셀 속도로 픽셀을 테스트, 샘플링 및 혼합할 수 있습니다. 여기에서 RDNA 아키텍처의 주요 개선 사항은 RB가 그래픽 L1 캐시를 통해 데이터에 액세스한다는 것입니다. 이는 L2 캐시에 대한 부담을 줄이고 더 적은 데이터를 이동하여 전력을 절약합니다. GCN에서 RB가 메모리에 직접 데이터를 쓴 다음 L2 캐시를 통해 Vega에 데이터를 썼다는 것을 상기하십시오.

퀘이사존

텍스처 유닛은 RDNA와 Navi를 통해 상당한 향상을 얻었습니다. 로드 및 저장 처리 속도는 GCN에 비해 여러 배 빠르므로 GPU가 로드 및 저장을 통해 최대 대역폭에 쉽게 도달할 수 있습니다.

퀘이사존

RDNA 대 GCN: ALU 활용 비교

퀘이사존

GCN에 비해 SIMD와 RDNA(Navi)의 WGP를 포화시키는 것이 훨씬 쉽습니다. 하나의 WGP(2CU)를 사용하려면 (4개의 SIMD *32개 항목) 128개의 스레드만 있으면 ALU 활용률이 100%에 도달합니다. 반면, GCN은 100% 활용률에 도달하기 위해 512개의 스레드가 필요(2CU * 4 SIMD * 65개 항목) 했습니다. 그것은 네 배나 됩니다!

비디오 인코딩 및 디코딩

NVIDIA의 Turing 인코더와 마찬가지로 Navi GPU는 비디오 인코딩 및 디코딩을 위한 특수 엔진도 갖추고 있습니다.

퀘이사존

Navi 10(RX 5600 및 5700)에서는 Vega와 달리 비디오 엔진이 VP9 디코딩을 지원합니다. H.264 스트림은 1080p의 경우 초당 600프레임으로, 150fps의 경우 4K로 디코딩할 수 있습니다. 360fps에서 1080p, 90fps에서 4K 등 절반의 속도로 동시에 인코딩할 수 있습니다. HVEC 및 VP9에서 모두 24fps로 8K 디코드를 사용할 수 있습니다.

7nm 공정 및 GDDR6 메모리 표준

7nm 노드 및 GDDR6 메모리는 종종 새로운 아키텍처의 일부로 광고되지만 이들은 타사 기술이며 정확히 RDNA 마이크로 아키텍처의 일부가 아닙니다. 그러나 GPU는 이러한 기술을 최대한 활용하도록 최적화되어 있습니다.

퀘이사존

그러나 TSMC의 7nm 노드는 이전 GCN 설계, 즉 Polaris 및 Vega를 지원하는 이전 14nm 프로세스에 비해 와트 당 성능을 크게 향상시킵니다. 면적당 성능이 2.3배 향상되고 와트 당 성능이 1.5배 향상됩니다.

퀘이사존

대역폭을 최대화하기 위해 가능한 경우 데이터 압축이 적극적으로 추가되었습니다. GCN과 Navi는 RB에서 압축된 읽기 및 쓰기만 수행했지만 Navi는 후자를 CU로 확장하고 현재 대기열에서도 구현합니다.

퀘이사존

이제 RB 외에 WGP (CU)와 L2 캐시 사이에 압축기 모듈이 있습니다. Vega에는 전자가 없었고 데이터 압축은 L2에서 읽기로 제한되었습니다.

* Xbox Series X GPU 아키텍처 심층 분석: 레이 트레이싱, 메시 셰이딩, 샘플러 피드백 및 VRS

결론

보시다시피 RDNA와 Navi는 Radeon 디자인을 정확하게 재창조하지는 않지만 주로 수정합니다. 파이프 라인 병목 현상이 제거되고 지연 시간이 감소했으며 이제 모든 SIMD가 더 넓고 빨라졌습니다. 셰이더 엔진 당 더 많은 렌더 백엔드가 있으며, 세 가지 수준의 통합 캐시가 있으며 이는 이전 Vega GPU보다 크게 향상되었습니다. RDNA 2가 기존 Navi GPU와 얼마나 다른지 보는 것은 흥미로울 것입니다. 솔직히 말해서 급진적인 변화는 없을 것 같아요. 레이 트레이싱 가속 또는 업 스케일링을 위한 전용 코어가 있을 수 있습니다. AMD가 작업해야 하는 것은 소프트웨어와 드라이버입니다.

원문 출처 hardwaretimes

출처 : https://quasarzone.com/bbs/qn_hardware/views/992004

스크랩
URL

복사
페북
트위터
네이버
카톡
핀

BEST
일반인 레벨에서 체감되는 차이점은 더이상 플루이드 모션이 안된다는 정도죠.

Falchion | (IP보기클릭)223.39.***.*** | 21.05.16 02:28

BEST
RDNA 를 주도적으로 설계한 사람이 루 크라머 라는 여자분인데.. 이 업계에 워낙 드문 여자 천재 3d 엔지니어라서 참 신기합니다. AMD 는 여성이 더 강한 회사인 거 같아요.

Simbian | (IP보기클릭)211.202.***.*** | 21.05.16 11:57

BEST
일반인이 아닌 사람한테는 이것 때문에 유니티 엔진이 콘솔에서 언리얼보다 압도적으로 빨라지는 이유가 됩니다. 보통 wavefrot 스칼라라이징 이라는 작업을 모든 쉐이더에서 해주지 않으면 타일드 라이팅시 루프문이 스크린상에서 최대 수치로 실행되게 됩니다. 유니티는 HDRP 에 한해서만 이 작업을 해 놨고 언리얼은 아예 이 부분에 대해서는 신경 끄고 자기들 게임에만 적용해 놨죠. 뭐 패치 하면 되긴 합니다만.. 게임 개발사 개발자들도 일반인 들 수준의 지식밖에 없어서 그런 일이 있는 줄도 모릅니다.

Simbian | (IP보기클릭)211.202.***.*** | 21.05.16 11:54

	[삭제된 댓글의 댓글입니다.] 스타크래프트 이번만큼 이 짤이 공감되는 경우가 없었다 MICR0$0FT \| (IP보기클릭)211.216.*.* \| 21.05.16 09:50 0 / 3000 bytes 등록
BEST 일반인 레벨에서 체감되는 차이점은 더이상 플루이드 모션이 안된다는 정도죠. Falchion \| (IP보기클릭)223.39.*.* \| 21.05.16 02:28 0 / 3000 bytes 등록
	Falchion 그거랑 RT하고 DLSS가 제대로 지원되지 않는것 지니란 \| (IP보기클릭)118.33.*.* \| 21.05.16 08:29 0 / 3000 bytes 등록
예전에는 정말 흥미롭게 읽었었는데... 아 옛날이여~ 웹루리루리 \| (IP보기클릭)220.81.*.* \| 21.05.16 09:23 0 / 3000 bytes 등록
결론 마지막 부분만 읽으면 되네 네온알 \| (IP보기클릭)125.190.*.* \| 21.05.16 11:21 0 / 3000 bytes 등록
BEST 일반인이 아닌 사람한테는 이것 때문에 유니티 엔진이 콘솔에서 언리얼보다 압도적으로 빨라지는 이유가 됩니다. 보통 wavefrot 스칼라라이징 이라는 작업을 모든 쉐이더에서 해주지 않으면 타일드 라이팅시 루프문이 스크린상에서 최대 수치로 실행되게 됩니다. 유니티는 HDRP 에 한해서만 이 작업을 해 놨고 언리얼은 아예 이 부분에 대해서는 신경 끄고 자기들 게임에만 적용해 놨죠. 뭐 패치 하면 되긴 합니다만.. 게임 개발사 개발자들도 일반인 들 수준의 지식밖에 없어서 그런 일이 있는 줄도 모릅니다. Simbian \| (IP보기클릭)211.202.*.* \| 21.05.16 11:54 0 / 3000 bytes 등록
BEST RDNA 를 주도적으로 설계한 사람이 루 크라머 라는 여자분인데.. 이 업계에 워낙 드문 여자 천재 3d 엔지니어라서 참 신기합니다. AMD 는 여성이 더 강한 회사인 거 같아요. Simbian \| (IP보기클릭)211.202.*.* \| 21.05.16 11:57 0 / 3000 bytes 등록
확실한거 하나는 암드가 rdna2로 인해 290x 이 후 처음으로 엔비디아 하이엔드와 동급으로 올라왔다는 점이겠죠. 전성비로는 처음 역전했구요 루리웹-3487883112 \| (IP보기클릭)118.32.*.* \| 21.05.16 15:19 0 / 3000 bytes 등록
근데 다른사이트 기사 하나를 그냥 그림까지 통째로 복붙해도 되는건가? 무한의체력 \| (IP보기클릭)220.87.*.* \| 21.05.16 16:32 0 / 3000 bytes 등록
	무한의체력 국내 사이트가 문제지, 해외 사이트는 문제 없습니다. 문제 있었더라면 제제가 왔겠죠. (일반 사이트-메이플 인벤 자유게시판-에서 나온 소식을 올렸다고 경고를 받은 적 있습니다.) 잼잼버린 \| (IP보기클릭)116.127.*.* \| 21.05.18 22:19 0 / 3000 bytes 등록
	잼잼버린 글쌔요. 해외사이트 기사를 번역한 퀘이사존 기사인 것 같은데, 해당 기사 번역한분한테 허락 맡으셨나요? 맡으셨다면 뭐 문제없겠지만. 무한의체력 \| (IP보기클릭)220.87.*.* \| 21.05.18 22:23 0 / 3000 bytes 등록
"RDNA는 GPU 아키텍처이고 Navi는 이를 사용하여 구축된 그래픽 프로세서의 코드명입니다. 마찬가지로 GCN은 아키텍처였고 Vega와 Polaris는 코드명입니다" 여기까지 읽으니 한번 읽어볼만 하다 싶어서 쭉 읽으면서 내려와 추천 눌리고나니 하나도 기억 안나네요! ㅠㅠㅋ 죠리퐁국물™ \| (IP보기클릭)210.203.*.* \| 21.05.16 17:07 0 / 3000 bytes 등록
읽긴 읽었는데....-ㅅ-..뭘 읽은거지 Kaelic \| (IP보기클릭)1.232.*.* \| 21.05.17 04:50 0 / 3000 bytes 등록
RDNA로 되면서 훨씬 좋아지긴 한거 같음. 3세대 오면 진짜 쓸만하게 바뀌겠지. 라이젠처럼. 웹떠돌이 \| (IP보기클릭)1.227.*.* \| 21.05.17 12:55 0 / 3000 bytes 등록
GCN이 깡연산에 비해 게임성능이 안나오던게 4주기로 묶여 작동하면서 지연시간 낭비를 하고 있었다는 거구만.. 잡채만세 \| (IP보기클릭)112.218.*.* \| 21.05.17 16:18 0 / 3000 bytes 등록
암드 GPU는 이제 영 신뢰도가 떨어지는것 같음. 6000시리즈에서 희망이 보이긴 했는데 결국 RT에서 나사 빠지면서 또 무너짐 마스터코카 \| (IP보기클릭)210.96.*.* \| 21.05.17 21:20 0 / 3000 bytes 등록

로그인이 필요합니다.

37125 20

2년 기다림이 아깝지 않은 장독대 묵은지, 브이 라이징

99328 150

국산 게임의 별로서 기억될 칼, 스텔라 블레이드

95884 39

탐험으로 가득한 사막과 맛있는 메카 전투, 샌드랜드

134638 70

아쉬움 남긴 과거에 보내는 마침표, 백영웅전 리뷰

82687 29

고전 명작 호러의 아쉬운 귀환, 얼론 인 더 다크 리메이크

89285 342

자신만의 용을 찾는 여행, 드래곤즈 도그마 2

63874 185

공주의 변신은 무죄, 프린세스 피치 Showtime!

137542 101

창세기전: 회색의 잔영, 기념사업의 끝

76989 50

개발 편의적 발상이 모든 것을 쥐고 비틀고 흔든다, 별이되어라2

106925 62

여아들을 위한 감성 영웅담, 프린세스 피치 Showtime!

135266 377

해방군은 왜 여자 뿐이냐? 유니콘 오버로드

63626 26

진정한 코옵으로 돌아온 형제, 브라더스: 두 아들의 이야기 RE

위로가기

인증글 베스트

공지

업데이트 내역 / 버튜버 방송 일정

[공지] 국내외 언론 및 웹진 불펌 금지. (2)

핫딜! [스팀] Machinika: Museum (무료 배포)

[S/W] 오라클, AI 코딩 툴 레이스 가세...‘오라클 코드 어시스트’ 발표

사쿠라모리 카오리P | 추천 1 | 조회 262 | 날짜 2024.05.13

[H/W] 삼성의 HBM3E는 아직 엔비디아로부터 공식 검증을 받지 못한 것으로 전해졌다. (3)

젠슨 황 | 추천 3 | 조회 792 | 날짜 2024.05.13

[S/W] EU, "MS 오피스에 화상회의앱 끼워팔기 반독점 위반 결론 가닥" (3)

GPixel | 추천 9 | 조회 1540 | 날짜 2024.05.13

[ETC] 빅3 너머의 클라우드 환경

사쿠라모리 카오리P | 추천 0 | 조회 508 | 날짜 2024.05.13

[ETC] "알리바바, GPU 앞세워 중국 유망 AI 스타트업 싹쓸이"

사쿠라모리 카오리P | 추천 2 | 조회 1087 | 날짜 2024.05.13

[ETC] 네이버 노조 "라인야후 매각 반대…한국 기술 탈취" (19)

lille | 추천 55 | 조회 8762 | 날짜 2024.05.13

[S/W] 대통령실 "네이버, 입장 공개해야...반일 조장은 국익 훼손" (58)

불꽃남자 쟈기만 | 추천 30 | 조회 8032 | 날짜 2024.05.13

[S/W] 몽고DB, AWS 및 구글 클라우드와 협력 확대.생성형 AI 앱 구축 기능 강화 (7)

사쿠라모리 카오리P | 추천 0 | 조회 510 | 날짜 2024.05.13

[S/W] 美 노스웨스턴대, 새로운 AI 학습 알고리즘 'MaxDiff RL' 개발

사쿠라모리 카오리P | 추천 0 | 조회 609 | 날짜 2024.05.13

[H/W] 소프트뱅크 Arm, 2025년까지 'AI 칩' 출시 예정

사쿠라모리 카오리P | 추천 0 | 조회 496 | 날짜 2024.05.13

[S/W] 마이크로소프트 워드, 붙여넣기 업데이트 "원본 서식 유지가 기본값" (3)

사쿠라모리 카오리P | 추천 2 | 조회 1459 | 날짜 2024.05.13

[S/W] 진화한 단백질 구조 예측 AI…생체분자와 상호작용도 예측 (5)

사쿠라모리 카오리P | 추천 6 | 조회 2649 | 날짜 2024.05.13

[S/W] "여자친구와 통화했어요"…거짓말까지 능숙한 AI (9)

사쿠라모리 카오리P | 추천 1 | 조회 4169 | 날짜 2024.05.13

[S/W] "오픈AI, '시리' 등 음성비서 강화할 새 멀티모달 모델 개발"

사쿠라모리 카오리P | 추천 1 | 조회 693 | 날짜 2024.05.13

[S/W] "AI, 사기 치는데 점점 능숙해져...근본적인 해결책은 없어" (5)

사쿠라모리 카오리P | 추천 9 | 조회 4541 | 날짜 2024.05.13

[ETC] 일론 머스크 AI 기업 xAI, 8.2조원 투자 유치 눈앞 (1)

사쿠라모리 카오리P | 추천 1 | 조회 1066 | 날짜 2024.05.13

[ETC] 조급해진 애플, 더 멀리가는 MS (1)

사쿠라모리 카오리P | 추천 5 | 조회 3108 | 날짜 2024.05.13

[ETC] SAP, IBM 컨설팅과 ‘생성형 AI’ 서비스 제공을 위한 파트너십 체결

사쿠라모리 카오리P | 추천 0 | 조회 183 | 날짜 2024.05.13

[S/W] 팔로알토 네트웍스, 실시간 생성형 AI 접목한 보안 솔루션 ‘프리시전 AI’ 출시

사쿠라모리 카오리P | 추천 0 | 조회 324 | 날짜 2024.05.13

[S/W] 레드햇 서밋 2024 폐막, AI에 관심이 많은 레드햇

사쿠라모리 카오리P | 추천 0 | 조회 322 | 날짜 2024.05.13

[H/W] 웨이코스-만리. RTX4090 멜팅 현상 워런티 적용 불가 발표 (60)

스퀴니 | 추천 16 | 조회 11546 | 날짜 2024.05.12

[S/W] 사람과 게임하는 AI 에이전트 등장 (4)

사쿠라모리 카오리P | 추천 4 | 조회 2443 | 날짜 2024.05.12

[H/W] ASUS가 우리에게 사기를 쳤습니다 - Gamers Nexus (42)

또뚜마스 | 추천 38 | 조회 15580 | 날짜 2024.05.12

[S/W] [딥페이크] “중국男 아이 낳고 싶어”…러시아女 정체에 “역겹다” 반응, 이유는 (13)

불꽃남자 쟈기만 | 추천 8 | 조회 17309 | 날짜 2024.05.11

[S/W] 초유의 사법부 해킹, 北 소행 결론..."개인정보 자료 1TB 탈취" (17)

불꽃남자 쟈기만 | 추천 14 | 조회 6280 | 날짜 2024.05.11

[ETC] 네이버, 일본 라인야후에 대한 입장 밝혀 사실상 지분매각 가능성 열어둬 (68)

에루디토 | 추천 12 | 조회 12172 | 날짜 2024.05.11

[H/W] '반도체 불모지'에서 학생들이 일냈다 (2)

원히트원더-미국춤™ | 추천 7 | 조회 3287 | 날짜 2024.05.11

[ETC] 게임스컴에서 ‘붉은사막’ 공개하는 펄어비스…향후 전망은? (10)

lille | 추천 1 | 조회 1533 | 날짜 2024.05.11

1 2 3 4 5

글쓰기

	[삭제된 댓글의 댓글입니다.] 스타크래프트 이번만큼 이 짤이 공감되는 경우가 없었다 MICR0$0FT \| (IP보기클릭)211.216.*.* \| 21.05.16 09:50 0 / 3000 bytes 등록
BEST 일반인 레벨에서 체감되는 차이점은 더이상 플루이드 모션이 안된다는 정도죠. Falchion \| (IP보기클릭)223.39.*.* \| 21.05.16 02:28 0 / 3000 bytes 등록
	Falchion 그거랑 RT하고 DLSS가 제대로 지원되지 않는것 지니란 \| (IP보기클릭)118.33.*.* \| 21.05.16 08:29 0 / 3000 bytes 등록
예전에는 정말 흥미롭게 읽었었는데... 아 옛날이여~ 웹루리루리 \| (IP보기클릭)220.81.*.* \| 21.05.16 09:23 0 / 3000 bytes 등록
결론 마지막 부분만 읽으면 되네 네온알 \| (IP보기클릭)125.190.*.* \| 21.05.16 11:21 0 / 3000 bytes 등록
BEST 일반인이 아닌 사람한테는 이것 때문에 유니티 엔진이 콘솔에서 언리얼보다 압도적으로 빨라지는 이유가 됩니다. 보통 wavefrot 스칼라라이징 이라는 작업을 모든 쉐이더에서 해주지 않으면 타일드 라이팅시 루프문이 스크린상에서 최대 수치로 실행되게 됩니다. 유니티는 HDRP 에 한해서만 이 작업을 해 놨고 언리얼은 아예 이 부분에 대해서는 신경 끄고 자기들 게임에만 적용해 놨죠. 뭐 패치 하면 되긴 합니다만.. 게임 개발사 개발자들도 일반인 들 수준의 지식밖에 없어서 그런 일이 있는 줄도 모릅니다. Simbian \| (IP보기클릭)211.202.*.* \| 21.05.16 11:54 0 / 3000 bytes 등록
BEST RDNA 를 주도적으로 설계한 사람이 루 크라머 라는 여자분인데.. 이 업계에 워낙 드문 여자 천재 3d 엔지니어라서 참 신기합니다. AMD 는 여성이 더 강한 회사인 거 같아요. Simbian \| (IP보기클릭)211.202.*.* \| 21.05.16 11:57 0 / 3000 bytes 등록
확실한거 하나는 암드가 rdna2로 인해 290x 이 후 처음으로 엔비디아 하이엔드와 동급으로 올라왔다는 점이겠죠. 전성비로는 처음 역전했구요 루리웹-3487883112 \| (IP보기클릭)118.32.*.* \| 21.05.16 15:19 0 / 3000 bytes 등록
근데 다른사이트 기사 하나를 그냥 그림까지 통째로 복붙해도 되는건가? 무한의체력 \| (IP보기클릭)220.87.*.* \| 21.05.16 16:32 0 / 3000 bytes 등록
	무한의체력 국내 사이트가 문제지, 해외 사이트는 문제 없습니다. 문제 있었더라면 제제가 왔겠죠. (일반 사이트-메이플 인벤 자유게시판-에서 나온 소식을 올렸다고 경고를 받은 적 있습니다.) 잼잼버린 \| (IP보기클릭)116.127.*.* \| 21.05.18 22:19 0 / 3000 bytes 등록
	잼잼버린 글쌔요. 해외사이트 기사를 번역한 퀘이사존 기사인 것 같은데, 해당 기사 번역한분한테 허락 맡으셨나요? 맡으셨다면 뭐 문제없겠지만. 무한의체력 \| (IP보기클릭)220.87.*.* \| 21.05.18 22:23 0 / 3000 bytes 등록
"RDNA는 GPU 아키텍처이고 Navi는 이를 사용하여 구축된 그래픽 프로세서의 코드명입니다. 마찬가지로 GCN은 아키텍처였고 Vega와 Polaris는 코드명입니다" 여기까지 읽으니 한번 읽어볼만 하다 싶어서 쭉 읽으면서 내려와 추천 눌리고나니 하나도 기억 안나네요! ㅠㅠㅋ 죠리퐁국물™ \| (IP보기클릭)210.203.*.* \| 21.05.16 17:07 0 / 3000 bytes 등록
읽긴 읽었는데....-ㅅ-..뭘 읽은거지 Kaelic \| (IP보기클릭)1.232.*.* \| 21.05.17 04:50 0 / 3000 bytes 등록
RDNA로 되면서 훨씬 좋아지긴 한거 같음. 3세대 오면 진짜 쓸만하게 바뀌겠지. 라이젠처럼. 웹떠돌이 \| (IP보기클릭)1.227.*.* \| 21.05.17 12:55 0 / 3000 bytes 등록
GCN이 깡연산에 비해 게임성능이 안나오던게 4주기로 묶여 작동하면서 지연시간 낭비를 하고 있었다는 거구만.. 잡채만세 \| (IP보기클릭)112.218.*.* \| 21.05.17 16:18 0 / 3000 bytes 등록
암드 GPU는 이제 영 신뢰도가 떨어지는것 같음. 6000시리즈에서 희망이 보이긴 했는데 결국 RT에서 나사 빠지면서 또 무너짐 마스터코카 \| (IP보기클릭)210.96.*.* \| 21.05.17 21:20 0 / 3000 bytes 등록

게임게시판

뉴스/겜툰

PS5

SWITCH

XSX

PC

버튜버/VR

모바일

AC/고전

핫딜🔥

취미갤

유저게시판

만화

피규어

애니/책

프라모델

술🍷

차🍵

커피☕

끌올🔝

숏츠?

AI 이미지

BEST

커뮤니티🐳

본문

[참고] AMD RDNA와 GCN GPU 아키텍처의 차이점

신설 게시판