프로그래머 관점에서의 Qualcomm SQ1 vs Apple m1 vs intel x86 벤치마크

서론 2019년에 ‘프로그래머의 관점에서 본 Surface Pro X 벤치마크‘라는 글을 작성했었다.이후로 2년 반 정도가 지났다. 여전히 Windows on ARM에 관심을 가지고 있지만 Surface Pro X를 비롯한 Windows on ARM의 하드웨어 생태계는 그다지 발전하지 않았다. Windows on ARM의 표준적인 칩인 퀄컴의 8cx, 7cx칩의 GPU드라이버는 여전히 불안정하다. Windows on ARM생태계가 정체되어있는 동안 애플에서 ARM기반의 자체 프로세서와 새로운 … More 프로그래머 관점에서의 Qualcomm SQ1 vs Apple m1 vs intel x86 벤치마크

VOXEL HORIZON – 스레드 개수에 따른 충돌처리 성능 비교

어제 충돌처리 멀티 스레드 관련 버그 수정하면서 내가 그 동안 성능 테스트는 했었는가 하는 의문이 생김. 했겠지. 오래 되어서 기억이 안나는거지. 하여간 그래서 다시 테스트 해봄. 캐릭터 1000마리 돌아다닐때 (캐릭터vs삼각형, 캐릭터x캐릭터) 스레드 개수에 따른 충돌처리 소모시간 비교. 하이퍼스레딩이 아무짝에 쓸모가 없다고 느낄 때가 많지만 이 경우 큰 성능향상은 아니지만 쓸모가 있다.

DDRAW-Surface /D3D-Dynamic Buffer 에서의 Write Combine Memory

20년도 더 전에 DDRAW시절부터 “그래픽카드(그땐 GPU란 말 자체가 없었다)에 쓰는건 생각보다 빠르지만 읽는건 엄청 느리다.”라고 알려져 있었다. ‘PCI버스로 읽어오는게 느리다.’라고만 알고 있었는데 생각해보면 같은 버스로 통신하는건데 쓰는건 빠르고 읽는건 느릴 이유가 있나?실제로 CUDA로 테스트 해보면 GPU로 보내는거나 받아오는거나 성능 차이가 크게 안난다. 따라서 ‘읽는건 느리고 쓰는건 빠르다’라고 하는 사실은 PCI 버스 통신과 무관하다. DOS시절에야 비디오카드 … More DDRAW-Surface /D3D-Dynamic Buffer 에서의 Write Combine Memory

재귀호출 vs 루프문

재귀호출을하나 루프로 바꾸나 요새 cpu에선 성능 차이 별로 안난다고 생각했었다. 틀렸다. 그렇지 않다. 재귀호출이 훨씬 느리다. 재귀호출을 해도 전체적으로 보면 크게 성능이 떨어지지 않는거지 루프문만큼 빠른것은 아니다. 예의 8x8x8복셀에서 한 면에서 출발해서 x,y,z축에 대해 반대편 면까지 뚫린 구멍이 있는지 탐색하는 코드가 있다. 어떤 복셀 오브젝트의 인접한 오브젝트에 의해 가려질 수 있는가를 체크하기 위한 코드이다. 나는 … More 재귀호출 vs 루프문