stack을 heap대신 stack에 올려서 얻은 성능 이득

제목을 말장난처럼 지어봤다. 다시 풀어서 쓰면 ‘stack(자료구조)를 heap대신 stack(stack memory per thread)에 올려서 얻은 성능 이득’ 이다. 64비트로 넘어오기 전에 32비트로만 개발하던 시절엔 stack자료구조가 필요한 경우 클래스나 함수형태의 stack 자료구조를 만들지 않았다. 그냥 함수 안에서 인라인 어셈블리로 push,pop명령어를 써넣었다. 그걸로 가변인자 함수도 만들고 그랬다. 64비트로 넘어오면서 인라인 어셈블리를 사용할 수 없게 됐다. 할수 없이 이후로는 … More stack을 heap대신 stack에 올려서 얻은 성능 이득

멀티코어지원을 안해서 게임이 느려…?

게임 관련 사이트나 하드웨어 사이트의 좇문가들은 멀티코어를 지원하지 않아서 게임 성능이 오르지 않는다고 주장한다. 실제로 개발사가 멀티코어를 제대로 지원하지 못하는 경우도 있다. 하지만 열심히 멀티코어를 활용하려고 노력한다해도 대부분의 경우 별로 안빨라진다. 그에 비해 버그는 100배쯤 는다. 그것도 잡기 힘든 멀티 스레드 버그가. 우선 게임에서 병렬처리할 요소라고 해봐야 픽셀단위, 버텍스 단위 억세스다. 즉 삼각형에 텍스처 입혀서 … More 멀티코어지원을 안해서 게임이 느려…?

재귀호출 vs 루프문

재귀호출을하나 루프로 바꾸나 요새 cpu에선 성능 차이 별로 안난다고 생각했었다. 틀렸다. 그렇지 않다. 재귀호출이 훨씬 느리다. 재귀호출을 해도 전체적으로 보면 크게 성능이 떨어지지 않는거지 루프문만큼 빠른것은 아니다. 예의 8x8x8복셀에서 한 면에서 출발해서 x,y,z축에 대해 반대편 면까지 뚫린 구멍이 있는지 탐색하는 코드가 있다. 어떤 복셀 오브젝트의 인접한 오브젝트에 의해 가려질 수 있는가를 체크하기 위한 코드이다. 나는 … More 재귀호출 vs 루프문

D3D12예제에서 Constant Buffer를 System Memory에 두는 이유.

D3D12 예제를 보면 Constant Buffer를 system memory에 만들어 사용하고 있다. (CPU write, GPU read). D3D11에선 Constant Buffer를 GPU메모리에 두느냐, 시스템 메모리에 두느냐에 따라 성능차이가 꽤 난다. 20-30%정도는 차이가 나는것 같다. D3D12에서 테스트해보면 대략 10%정도 성능 차이가 난다. 당연히 GPU메모리에 두는 쪽이 빠르다. 크다면 크고 작다면 작은 수치다. 그럼 왜 D3D12예제에선 시스템 메모리에 Constant Buffer를 잡았을까. … More D3D12예제에서 Constant Buffer를 System Memory에 두는 이유.

코룸외전

http://bbs.ruliweb.com/game/4263/board/read/4762882 코룸 외전. 이전에 코룸 1,2,3이 있었고 나름 국산 액션 RPG 시리즈로 한 획을 그은 게임 시리즈였다. 외전은 턴제 RPG로서 이름만 코룸…이라는 느낌의 그런 게임이었다. 1999년에 회사 입사하고 처음 참여했던 게임이다. 대단한 일을 한건 아니었고 코룸외전 안에 들어가는 미니 게임 4종을 만들고 캐릭터 함수 짜고 자잘한 디버깅들, 자잘한 잡무들을 했다. 그 시절만 해도 24비트/32비트 화면모드를 … More 코룸외전