GPU把所有資料都輸出到 render target, 可惜的是 RT放在顯示卡的RAM.
cpu無取存取, 用GetRenderTargetData()速度很慢, 又要lock,導致效能低落.
沒想到 intel寫了一篇 software rasterizer occlusion culling
直接用cpu算,以為要賣cpu的, 沒想到很多遊戲 真的用cpu算Occlusion culling.
要把我10幾年前寫的software engine 拿出來用, 真是不可思議.
software rasterizer主要3個步驟
1.投影轉換到 screen space
2.切割
3.Fill, 計算z值