6core Xeon*2 + GTS250 CDUA 라이트맵 렌더링

서버의 멀티스레드 충돌처리 테스트 및 패킷 과부하 테스트를 위해 조립품으로 옆자리에 들여놓은 제온 머신이다. 겸사겸사 멀티스레딩 라이트맵 계산과 CUDA테스트도 할 겸 가격대 성능비 좋은 GTS250 1GB버젼을 하나 꽂았다. 이 조합의 경우는 CUDA를 사용할 경우 15%정도의 성능 향상이 있다. 과연 12코어 24스레드의 힘! 약간의 최적화를 해서 집의 쿼드머신에선 CUDA사용시 120%정도의 성능 향상을 얻었다. 오늘 엔진과 툴을 … More 6core Xeon*2 + GTS250 CDUA 라이트맵 렌더링

Project ε(프로젝트 엡실론) 2차 알파 후기

2차 테스트를 무사히 마쳤습니다. 30시간 동안 서버다운,점검 전혀 없이 깔끔하게 완료했습니다. 클라이언트 덤프가 꽤 쌓여있어서 분석하고 디버깅할걸 생각하면 좀 암담하긴 합니다만. 서버에서 힙 크래시 하는 버그가 있었는데 테스트 3일전에 발견해서 그 다음날 잡은게 꽤 드라마틱한 사건이었구요.(주님 감사합니다.진실로…) 금요일 오후에 139번 빌드를 최종적으로 릴리즈 하고 클라이언트에서 몇 가지 버그를 발견하여 주말 내내 노트북과 집 데스크탑을 이용한 … More Project ε(프로젝트 엡실론) 2차 알파 후기

CUDA로 구현한 라이트맵 테스트 및 결론

평일 잠을 줄이고 주말을 최대한 투자한 끝에 엔진의 라이트맵 빌드를 CUDA로 처리할 수 있는 기능을 추가했다. 얼마나 삽질을 했는지…휴 아무튼 결과는 다음과 같다. 크게 만족스러운 것은 아니다. 10배쯤은 빨라질걸로 기대했으니까. 그래픽 카드가 좋으면 좀 더 좋은 결과를 얻었을지도 모르겠지만… 혹은 내 CUDA코드가 메모리 뱅크 충돌이라든가 기타 등등의 퍼포먼스 이슈를 제대로 처리하지 못했기 때문일수도 있다. 테스트 … More CUDA로 구현한 라이트맵 테스트 및 결론

CUDA로 계산하는 라이트맵

토요일 + 일요일 + 월요일 새벽을 투자하여  CUDA로 라이트맵을 계산할 수 있도록 엔진을 뜯어고쳤다. 엄청난 시행착오 끝에 그림자까지 제대로 계산하도록 만들었다. 결과는…. CPU로 계산하는 쪽이 두 배 빨랐다. 이런 샹. Q6600의 코어4개를 풀로 사용하는 것이 9800GTX+의 128스트림프로세서를 사용하는것보다 빨랐다. CPU코드를 짜면서 코드 논리에서 최적화한 부분이 GPU코드에 반영되지 않은게 큰 이유이기도 하고, 메모리 전송이 지나치게 많은 까닭도 … More CUDA로 계산하는 라이트맵