查看完整版本 : 迎來全新sorting algorithm 第三版,2 thread

ncream 2017-11-15 04:46 PM

迎來全新sorting algorithm 第三版,2 thread

速度只提升30%左右,因為global variables 拖慢了速度,所以無50%咁多,不過sort 1億個數都快到813ms。

[attach]7569298[/attach]

版本:beta 第三版



N: 1億



thread: 2 thread



可以再加thread,但取多thread要更多記憶體,CPU資源好重要,所以去到兩thread就算數。

今次係一次好好經驗,煙師兄比左個好好玩既機會大家,在此要多謝佢。

效能方便,係下面比較。:lol

[url=https://www.sendspace.com/file/szhfdh]https://www.sendspace.com/file/szhfdh[/url]

[[i] 本帖最後由 ncream 於 2017-11-15 05:02 PM 編輯 [/i]]

ncream 2017-11-15 04:56 PM

效能方面,我地同煙師兄既GPU比較,為了公平起見,N由1億改為5千萬:



首先係core-i3


[attach]7569350[/attach]

[attach]7569351[/attach]


390ms。



睇下煙師兄先,首先佢用CPU host memory,即係同我地一樣::lol


[attach]7569353[/attach]



不過煙師兄重有絶招,就係用VRAM,嘩,勁快::smile_o13::smile_o13:


[attach]7569352[/attach]



sort 5千萬數用左199ms,勁快啊,皇者煙師兄::smile_38::smile_38::smile_38:


重有下面

[[i] 本帖最後由 ncream 於 2017-11-15 05:00 PM 編輯 [/i]]

ncream 2017-11-15 04:58 PM

我轉用i7測試:

[attach]7569358[/attach]


sort 5千萬個數:

[attach]7569359[/attach]

281ms,破左紀錄。:smile_38::smile_38::smile_38:

但同煙師兄相比,慢成50%。

[size=5][color=#ff0000]結論:煙師兄贏左。好勁啊,煙師兄。[/color][/size]
:smile_o15:

[[i] 本帖最後由 ncream 於 2017-11-15 05:00 PM 編輯 [/i]]

sswroom 2017-11-15 05:21 PM

[quote]原帖由 [i]ncream[/i] 於 2017-11-15 04:56 PM 發表 [url=http://computer.discuss.com.hk/redirect.php?goto=findpost&pid=470923430&ptid=27060184][img]http://computer.discuss.com.hk/images/common/back.gif[/img][/url]
效能方面,我地同煙師兄既GPU比較,為了公平起見,N由1億改為5千萬:



首先係core-i3


7569350

7569351


390ms。



睇下煙師兄先,首先佢用CPU host memory,即係同我地一樣::lol


75693 ... [/quote]兩者的比較完全是不公平.......
在不同的Processor比較, 應該是比Performance/watt (Efficiency), 不是比較Latency
還有, 煙民計算的時間, 很多時是只計算GPU內的運算時間, 不是去到Data可實際再應用的時間, 即是會短過實際應用的時間, 算是有點出術

ncream 2017-11-15 06:22 PM

[quote]原帖由 [i]sswroom[/i] 於 2017-11-15 05:21 PM 發表 [url=http://computer.discuss.com.hk/redirect.php?goto=findpost&pid=470924974&ptid=27060184][img]http://computer.discuss.com.hk/images/common/back.gif[/img][/url]
兩者的比較完全是不公平.......
在不同的Processor比較, 應該是比Performance/watt (Efficiency), 不是比較Latency
還有, 煙民計算的時間, 很多時是只計算GPU內的運算時間, 不是去到Data可實際再應用的時間, 即是會 ... [/quote]

咁又係,要同processor先公平。多謝ching指教。:smile_o15:

我公司個單野,你係行業版都知道多少。今日我老細足之忍唔住,打電話去個間公司吵佢地,我都勸過佢唔好,但勸唔到,佢粗口都出埋,對方係客戶服務主任,女士,老細不斷用女性器官問候對方,對方頂唔順即cut線,老細再打返去,變左留言信箱。

心諗,你都比左錢,件事當解決左,點解重要吵呢?唔搞你都變搞你啦。

老細重話去facebook唱衰間公司。

所以軟件應該要重寫,以後可能有d忙。但有source code可以第日有機會出自己version商業軟件。:smile_o13:

[[i] 本帖最後由 ncream 於 2017-11-15 06:23 PM 編輯 [/i]]

煙民母親生賤種 2017-11-15 08:36 PM

[quote]原帖由 [i]sswroom[/i] 於 2017-11-15 05:21 PM 發表 [url=http://computer.discuss.com.hk/redirect.php?goto=findpost&pid=470924974&ptid=27060184][img]http://computer.discuss.com.hk/images/common/back.gif[/img][/url]
兩者的比較完全是不公平.......
在不同的Processor比較, 應該是比Performance/watt (Efficiency), 不是比較Latency
還有, 煙民計算的時間, 很多時是只計算GPU內的運算時間, 不是去到Data可實際再應用的時間, 即是會 ... [/quote]
228 + 75 = 303

[attach]7570343[/attach]

煙民母親生賤種 2017-11-15 09:16 PM

[quote]原帖由 [i]ncream[/i] 於 2017-11-15 04:58 PM 發表 [url=http://computer.discuss.com.hk/redirect.php?goto=findpost&pid=470923589&ptid=27060184][img]http://computer.discuss.com.hk/images/common/back.gif[/img][/url]
我轉用i7測試:

7569358


sort 5千萬個數:

7569359

281ms,破左紀錄。:smile_38::smile_38::smile_38:

但同煙師兄相比,慢成50%。

結論:煙師兄贏左。好勁啊,煙師兄。
:smile_o15: [/quote]無 code 無得 check , 無咩意思。例如我可產生頭 1000 個亂數, 中間全部係 0。一定快。同埋你發唔發覺, 你果 D 數 interval 跳得好西利, 我頭 100 個 (sorted), 都係約數值 200 以內。如果你個 screen 果 d 都係頭 100 個, 但以經去到 6 千 ... :fst_011:

ncream 2017-11-16 05:18 PM

[quote]原帖由 [i]煙民母親生賤種[/i] 於 2017-11-15 09:16 PM 發表 [url=http://computer.discuss.com.hk/redirect.php?goto=findpost&pid=470938444&ptid=27060184][img]http://computer.discuss.com.hk/images/common/back.gif[/img][/url]
無 code 無得 check , 無咩意思。例如我可產生頭 1000 個亂數, 中間全部係 0。一定快。同埋你發唔發覺, 你果 D 數 interval 跳得好西利, 我頭 100 個 (sorted), 都係約數值 200 以內。如果你個 screen 果 d 都係頭 1 ... [/quote]

我用mt19937,random比你更random。唔會做假。

煙民母親生賤種 2017-11-16 10:08 PM

[quote]原帖由 [i]ncream[/i] 於 2017-11-16 05:18 PM 發表 [url=http://computer.discuss.com.hk/redirect.php?goto=findpost&pid=470983102&ptid=27060184][img]http://computer.discuss.com.hk/images/common/back.gif[/img][/url]


我用mt19937,random比你更random。唔會做假。 [/quote]唔係話你造假, 而係有些東西連自己都唔知出左問題。同埋你話 mt19937 比我用 srand 更 random, 但你每個數之間的值都相差很大, 即係話, 必定有很多個亂數的值是相同的。值相同, 可能速度會快很多。:fst_011:
頁: [1]
查看完整版本: 迎來全新sorting algorithm 第三版,2 thread