GPU – yuchi's development

인프런에 ‘CUDA프로그래밍 입문’강의 올렸습니다.

2026년 6월 11일

“CUDA 프로그래밍 입문”이라는 제목으로 인프런에 12챕터짜리 강좌를 올렸습니다.CUDA에 관심이 있지만 어떻게 시작해야 할지 막막하셨던 분들에게 도움이 되리라 생각합니다.인프런에서 검색하지 마시고 아래의 링크를 클릭해서 구입해주시면 제게 경제적으로 더 도움이 됩니다. CUDA프로그래밍 입문– https://inf.run/Ggqn5 다른 강의들도 도움이 될 수 있으므로 살펴보시기 바랍니다. D3D12프로그래밍 기초편 – https://inf.run/WYdmsD3D12프로그래밍 기초플러스 – https://inf.run/dW4QZDirectX Raytracing 프로그래밍 – https://inf.run/ovHNqWindows System 프로그래밍 – https://inf.run/JQMeCWindows Debugging Tips – https://inf.run/8TtQv온라인 게임 개발을 … More 인프런에 ‘CUDA프로그래밍 입문’강의 올렸습니다.

Resizable Bar & D3D12 GPU Upload Heaps

2025년 7월 27일

이전에 한번 발표했던 D3D12 GPU Upload Heaps 주제에 대해서 자료를 보강해서 최근에 다시 기술방송을 진행했습니다.

LightMap 구현전략

2024년 8월 22일

2024년 8월 22일 방송분입니다.

DXR의 BLAS 할당 최적화

2023년 9월 14일

최근 기술방송 -D3D12게임프로젝트 로딩성능 개선 ( https://www.youtube.com/live/R_sMY_jjZnE?si=qGerBiAmCkMehLbp )- 에서 언급했다시피 CreateCommittedResource()함수가 엄청 느리기 때문에 할당하는 버퍼 수가 많다면 성능에 상당한 영향을 준다. 이 문제를 해결하기 위해 D3D12Resource를 Heap에 맵핑한 D3DResourceBufferHeap를 만들었고 주요 매시 데이터는 D3DResourceBufferHeap에서 할당하도록 했다. 다만 RayTracing을 위한 BLAS메모리는 아직 처리하지 못했다. DXR렌더러에서 BLAS생성하느라 D3D12Resource를 엄청 많이 할당하는데 이게 성능에 적지 않게 영향을 … More DXR의 BLAS 할당 최적화

D3D12 게임 프로젝트 로딩 성능 개선

2023년 9월 14일

2023년 9월 13일 방송분입니다.

D3D12 Mesh Shader소개

2023년 8월 17일

D3D12 Mesh Shader소개2023년 8월 16일 방송분입니다.

D3D Tiled Resources를 이용한 텍스처 스트리밍 – wait제거하기

2023년 6월 26일

D3D Tiled Resources를 사용한 텍스처 스트리밍 기능을 D3D11 / D3D12 / DXR 3개의 렌더러에 모두 추가했다. 그 과정에 소소한 깨달음이 있었다. GPGPU를 사용하면 대부분의 경우 결국은 CPU측 메모리로 결과를 가져와야 할 때가 많다. 최근 작업중이었던 텍스처 스트리밍도 마찬가지인데 어쨌든 GPU스레드가 버퍼를 스캔해서 어떤 텍스처를 로딩할지 GPU메모리에 써넣은 후 그걸 CPU측 메모리로 가져와서 CPU가 읽어야 한다. … More D3D Tiled Resources를 이용한 텍스처 스트리밍 – wait제거하기

VOXEL HORIZON iPhone XBOX PC 네트워크 플레이 테스트

2023년 3월 29일

VOXEL HORIZON의 XBOX와 PC와 iPhone간의 네트워크 플레이 테스트. [지원 플랫폼]Windows Desktop(DX11/DX12/DXR)XBOX ONE(UWP on XBOX-DirectX11 feature level 11)XBOX Series S/X(UWP on XBOX-DirectX12 feature level 11)iPhone/iPad Devices(A12 Processor 이상 필요)mac(Apple Silicon) [사용된 기술]iOS/macOS – macOS API + metal API + BSD Socket + C++Windows Desktop – DirectX 11/12/DXR + winsock + IOCP + C++XBOX(UWP on XBOX) – … More VOXEL HORIZON iPhone XBOX PC 네트워크 플레이 테스트

apple silicon m1 8 Core GPU vs RTX3070

2023년 1월 28일

요새 VOXEL HORIZON의 DX11/12버전을 macOS/iOS로 포팅하고 있다.https://youtu.be/oYhuwkkuGzg 일체의 외부 라이브러리 없이 C++과 metal API를 사용해서 작업중이다. DXR버전은 아직은 한참 무리고 DX11/12렌더러 기준으로는 거의 비슷하게 포팅했다. 물/파티클 빼고는 다 구현했다.이제 nvidia GPU와의 성능비교를 할 수 있겠다 싶었다. 스샷의 씬에서 렌더링하는 오브젝트는 캐릭터 한마리에 복셀 오브젝트 5개, 그리고 하늘&구름이다. 구름처리(Volumetric Cloudscapes)가 대량의 픽셀에 대해 상당히 복잡한 쉐이더를 … More apple silicon m1 8 Core GPU vs RTX3070

프로그래머 관점에서의 Qualcomm SQ1 vs Apple m1 vs intel x86 벤치마크

2022년 7월 17일

서론 2019년에 ‘프로그래머의 관점에서 본 Surface Pro X 벤치마크‘라는 글을 작성했었다.이후로 2년 반 정도가 지났다. 여전히 Windows on ARM에 관심을 가지고 있지만 Surface Pro X를 비롯한 Windows on ARM의 하드웨어 생태계는 그다지 발전하지 않았다. Windows on ARM의 표준적인 칩인 퀄컴의 8cx, 7cx칩의 GPU드라이버는 여전히 불안정하다. Windows on ARM생태계가 정체되어있는 동안 애플에서 ARM기반의 자체 프로세서와 새로운 … More 프로그래머 관점에서의 Qualcomm SQ1 vs Apple m1 vs intel x86 벤치마크

yuchi's development

Game Development, Windows Development, Figure , Anime

[태그:] GPU