facebook twitter hatena line google mixi email
★お気に入り追加


  • 1
  •  
  • 2015/05/21(木) 01:53:58.15
C++やインラインアセンブラ、SSEなどによる高速化の手法
について語りましょう。

前スレ
【C++】高速化手法【SSE】
http://peace.2ch.net/test/read.cgi/tech/1130349336/

ここまで見た
  • 467
  •  
  • 2020/09/14(月) 07:57:55.59
もしスレッドプールが使われていないんだったら外側のyループで並列化するのがいいんだろうな。

ここまで見た
  • 468
  •  
  • 2020/09/14(月) 11:24:08.29
L1キャッシュヒット率が低すぎかな?
[1 thread]
233,710,687 cache-references:u (57.13%)
170,103,633 cache-misses:u # 72.784 % of all cache refs (57.15%)
107,023,099,494 L1-dcache-loads:u (57.12%)
172,491,811 L1-dcache-load-misses:u # 0.16% of all L1-dcache hits (57.14%)
29,286,128,938 L1-dcache-stores:u (57.11%)
<not supported> L1-dcache-store-misses:u
107,114,953,718 dTLB-loads:u (57.21%)
1,665,512 dTLB-load-misses:u # 0.00% of all dTLB cache hits (57.14%)

71.532926647 seconds time elapsed
68.955555000 seconds user
0.410194000 seconds sys

[3 thread]
2,821,811,091 cache-references:u (57.15%)
158,279,338 cache-misses:u # 5.609 % of all cache refs (57.13%)
107,538,202,753 L1-dcache-loads:u (57.13%)
1,355,563,439 L1-dcache-load-misses:u # 1.26% of all L1-dcache hits (57.16%)
29,423,932,980 L1-dcache-stores:u (57.15%)
<not supported> L1-dcache-store-misses:u
107,129,155,399 dTLB-loads:u (57.15%)
2,350,280 dTLB-load-misses:u # 0.00% of all dTLB cache hits (57.12%)

151.557505458 seconds time elapsed
253.433918000 seconds user
119.253409000 seconds sys

ここまで見た
  • 469
  •  
  • 2020/09/14(月) 12:11:30.32
実行時のコアの負荷どうなってるのかと
コンパイルオプションでopenmp有効にしてるの?
してるんだったらループ内の排他制御周りで時間食ってんじゃないの

ここまで見た
  • 470
  •  
  • 2020/09/14(月) 12:20:38.35
あとマルチスレッドにしてる部分で大量のメモリ確保とかファイルの読み書きとかしてないよね?

ここまで見た
  • 471
  •  
  • 2020/09/14(月) 12:23:55.08
スレッド数に応じてCPU使用率は上がってる
排他制御は不要だからしてない

ここまで見た
  • 472
  •  
  • 2020/09/14(月) 12:32:30.05
マルチスレッドにしてる部分は純粋な計算のみで結果を配列に書き込んでるだけ

ここまで見た
  • 473
  •  
  • 2020/09/14(月) 12:44:52.40
あとはxじゃなくてyのループをpararellにするぐらいしかないんじゃね
スレッド呼び出しの回数多くなってるでしょそれ
1行0.8秒もかかるならスレッドのコストあんま関係ないような気もするけど
俺に思いつくのはApplyresultがなにかしてんのかなってぐらい

ここまで見た
  • 474
  •  
  • 2020/09/14(月) 12:45:56.25
このあたりのomp_get_max_threads()とか二重ループのオーバーヘッドの話はどうなん?

http://www.sanko-shoko.net/note.php?id=9twp

ここまで見た
  • 475
  •  
  • 2020/09/14(月) 12:55:20.98
もともと外側ループに#pragma ompつけてたけどそれも遅かった(1スレッドに比べて)
Applyresultは画面に結果を表示させる(バッファ入れ替え)だけで
処理時間は0.01秒もかからない

ここまで見た
  • 476
  •  
  • 2020/09/14(月) 13:00:39.33
画面表示は別スレッドにすべきだと思うが
バッファ入れ替えのみで別スレッドで描画させてるなら多分問題ないけど
あとは暗黙のコピーでもどっか発生してるのかね
vsのopen mpだとデフォでスレッドプールしてるっぽいけどgccどうなんだろ

ここまで見た
  • 477
  •  
  • 2020/09/14(月) 13:04:20.42
あーコピーは有り得そうだなぁ

ここまで見た
  • 478
  •  
  • 2020/09/14(月) 13:41:47.43
ラムダ式にthisをキャプチャしても単なるポインタのコピーだけだよね
うーんもうあきらめようかな

ここまで見た
  • 479
  •  
  • 2020/09/14(月) 14:04:34.23
この話はどう?

https://www.softek.co.jp/SPG/Pgi/TIPS/public/general/multicore-para.html

ここまで見た
  • 480
  •  
  • 2020/09/14(月) 14:31:35.53
> 1スレッド:一番早い
> 2スレッド:最悪
> 3スレッド:2スレよりマシ
> 4スレッド:3スレよりマシだけど1スレより遅い。CPU使用率100%に張り付く。

これで結論は出てる。同期コストを見積もれない馬鹿は並列化すんなってこと。

ここまで見た
  • 481
  •  
  • 2020/09/14(月) 14:31:55.00
スレッドで動かすタスクの単位がデカすぎてキャッシュに乗りきらなかった可能性ですかね
ありえそう

ここまで見た
  • 482
  •  
  • 2020/09/14(月) 14:50:37.02
同期コストに目をつけるのが的外れってことはわかる

ここまで見た
  • 483
  •  
  • 2020/09/14(月) 15:07:54.11
まだその小学生の理科の実験みたいな分析を続けるのはいかがなものか。ここはム板である。
答えはコードに書いてある。夏休みの宿題じゃないから答えを見ていい。
結果とコードがあるから後はそれを理解する脳みそが足りてるかどうかだけ。

>>482
結論は出たな。キミにはこのスレはまだ早い。並列化=同期。基礎知識が全く足りてない。
コードを見てコストが読めない人が一体なにを最適化するのだ。
キミのやってることはPCパーツをとっかえひっかえしてベンチ走らす自作マニアと同じだ。

ここまで見た
  • 484
  •  
  • 2020/09/14(月) 15:24:00.24
よくしゃべる無能だな

ここまで見た
  • 485
  •  
  • 2020/09/14(月) 15:29:50.65
メモリ足りてないとかないよな

ここまで見た
  • 486
  •  
  • 2020/09/14(月) 15:32:26.78
同期コストもなにも共有するリソースないし
お前みたいな雑魚に話しかけてねえよ

ここまで見た
  • 487
  •  
  • 2020/09/14(月) 15:39:22.64
メモリは余裕ありますね
>>479
に載ってる内容で今週末くらいに確認してみます

ここまで見た
  • 488
  •  
  • 2020/09/14(月) 20:40:46.18
>>468、prefのここ、一桁も違う、2C/4Tってキャッシュサイズどれくらい?orCPUの型番なに?

1T:  233,710,687 cache-references:u (57.13%)
3T: 2,821,811,091 cache-references:u (57.15%)

1T:  172,491,811 L1-dcache-load-misses:u # 0.16% of all L1-dcache hits (57.14%)
3T: 1,355,563,439 L1-dcache-load-misses:u # 1.26% of all L1-dcache hits (57.16%)

ここまで見た
  • 489
  •  
  • 2020/09/14(月) 20:43:28.09
>>488、すまん、タイプミスです

× pref
〇 perf

ここまで見た
ここまで見た
  • 491
  •  
  • 2020/09/15(火) 07:39:41.08
ここは昔から機械語レベルの最適化スレなんだが、
そういう丸投げ系の上流の話はスレ分けたほうがよくないか。バイナリは見る気ないんだろ?

ここまで見た
  • 492
  •  
  • 2020/09/15(火) 13:44:37.95
同期コストとかまったく関係無かったねw

ここまで見た
  • 493
  •  
  • 2020/09/18(金) 14:56:14.26
       ,、‐ " ̄:::゙:丶、
    ,r::::l3゙::::::::/ハヽ:ヽ::::、:ヽ
    {::://:::::::// ヽ\ト、:::::::!
    ヾ l:::::::/ 丶   `ヾ ィ、:::|
     |;:r::|  O`  'O ゙ハ|   < ここ初心者がくるところじゃないから
      ヽハ :.:.    :.: レ
        ´\ r‐--‐、,ノ
 r、     r、/ヾ ̄下ヘ
 ヽヾ 三 |:l1、_ヽ/__ .ィヽ
  \>ヽ/ |` }    n_n| |
   ヘ lノ `'ソ     l゚ω゚| |
    /´  /      ̄|. |

ここまで見た
  • 494
  •  
  • 2020/09/25(金) 15:29:15.78
副業、大手も制度着々…コロナ禍、働き手は空き時間活用
https://www.itmedia.co.jp/business/articles/2009/07/news111.html
富士通「年収3500万円」の衝撃 ソニー、NECも戦々恐々の「グローバル採用競争」
https://www.itmedia.co.jp/business/articles/2008/21/news031.html
東大の起業ラッシュは本物か、大学発ベンチャー数日本一の実力
https://business.nikkei.com/atcl/NBD/19/special/00448/
AI研究の第一人者、東大・松尾研でも起業ラッシュ
https://business.nikkei.com/atcl/gen/19/00158/051900002/?i_cid=nbpnb_arc
失敗は認める、多数決はダメ。拡大する「社会起業家集団」の作り方
https://newswitch.jp/p/23033
新卒“即”起業せよ。社会起業家への最短距離に挑む若者たち
https://newswitch.jp/p/23020
人々の共感を得られないと潰される時代。
https://news.yahoo.co.jp/articles/37aef71415e8181ce8451e27feb3983bf1f6f9cd
ゼロから起業するよりも事業承継(小さな会社の買収)が圧倒的に有利である3つの理由
https://honsuki.jp/pickup/17323.html
「エース人材だって起業OK」、NECは挑戦者が集う場をつくる
https://business.nikkei.com/atcl/gen/19/00106/012900003/
NECなど「出向起業」 大企業人材、起業しやすく
https://www.nikkei.com/article/DGXMZO61733720Q0A720C2TJ1000/

ここまで見た
  • 495
  •  
  • 2020/09/25(金) 15:29:41.54
70億円調達のネットショップ作成サービスhey、「我の弱い人同士の組織力」武器にEC市場シェア拡大目指す
https://www.businessinsider.jp/post-219205
【劇団ノーミーツ1】役者も客も会わないオンライン演劇で7000人動員。制作チームは全員20代、半分は会社員
https://www.businessinsider.jp/post-219184
「ガーナのゴミ」がなぜ1点500万円の作品に変わるのか
https://www.businessinsider.jp/post-208314?itm_source=article_link&itm_campaign=/post-219184&itm_content=https://www.businessinsider.jp/post-208314
利用、無料。日本版衛星データプラットフォーム「Tellus」がすごい理由…“宇宙の視点”でビジネスはこう変わる
https://www.businessinsider.jp/post-219279
「起業ブーム」が新たなフェーズに 大学発ベンチャーへの想い
https://forbesjapan.com/articles/detail/35527
かつて学者がやっていたことを、今は起業家がやっている
https://diamond.jp/articles/-/232874
番号やアドレス不要の無料通話アプリRe-mo登場 ドワンゴが配信開始
https://japanese.engadget.com/ios-dwango-re-mo-072853620.html
10年間使い続けた WordPress を辞めた理由 a-blog cms を選んだユーザーのお話
https://webtan.impress.co.jp/u/2020/09/14/37485
「KFC創業者は65歳で起業した」遅咲き経営者4人の成功法則
https://president.jp/articles/-/38719

ここまで見た
  • 496
  •  
  • 2020/10/01(木) 16:30:20.85
なんだこの馬鹿議論は。

ここまで見た
  • 497
  •  
  • 2020/10/02(金) 14:52:54.88
>>496
そう思うなら思い当たる原因とか教えてあげたら?
一言言うだけだよ

ここまで見た
  • 498
  •  
  • 2020/10/02(金) 15:13:27.56
それすらできないと本当に馬鹿なのがどっちか疑われても仕方ない

ここまで見た
  • 499
  •  
  • 2020/10/02(金) 15:30:34.86
sage入れずに書いているのは1人だけ・・・

ここまで見た
  • 500
  •  
  • 2020/10/02(金) 16:17:08.57
こんな機能あったのか
すまんな5ch使ったの最近なんだ

ここまで見た
  • 501
  •  
  • 2020/10/02(金) 16:21:49.97
ID:PyqKwzZq
ID:5Y5z53c+
ID:R9hS5H3t

はいはい(笑)

ここまで見た
  • 502
  •  
  • 2020/10/02(金) 16:32:57.58
もしかしてここって底辺の集まり?

ここまで見た
  • 503
  •  
  • 2020/10/02(金) 17:33:14.36
えーえーそうでちゅよ(笑)

ここまで見た
  • 504
  •  
  • 2020/10/02(金) 18:21:05.73
>>497
何の切り分けもしてない頓珍漢な結果ではなく全コード出しなよ。ここム板だよ?
アセンブラわかりませんとか、自分で書いたC++コードがどういうバイナリ吐くか想像もできないとか、
最適化、高速化スレでは話にならないんだけど初心者プログラマ君。

ここまで見た
  • 505
  •  
  • 2020/10/02(金) 18:26:33.85
底辺が必死だなw

ここまで見た
  • 506
  •  
  • 2020/10/03(土) 09:40:53.11
餓鬼に餌を与えないでください

ここまで見た
  • 507
  •  
  • 2020/10/09(金) 19:32:19.84
>>490
コア内のキャッシュがコンフリクトしまくっていると予想
ハイパースレッディングをoffにして2スレッドにしたらいいと予想

ここまで見た
  • 508
  •  
  • 2020/10/09(金) 19:56:21.81
HTが何か分かってないレベルでマルチスレッドにしたら遅くなったとか入門者スレでやれよ。

ここまで見た
  • 509
  •  
  • 2020/10/10(土) 07:36:17.00
>>472
キャッシュライン コンフリクト ミス しまくるような
配列の数にしているんだろうね

ここまで見た
  • 510
  •  
  • 2020/11/25(水) 02:06:39.46
高級リムジンで極上のパーティーをして2017年締めます!!
https://www.youtube.com/watch?v=6xRuJ0QaGFM

リムジンでディズニーランドに入れるのか!?
https://www.youtube.com/watch?v=OOe28etzqmQ

友達をリムジンで迎えに行ったらどうなる!?
https://www.youtube.com/watch?v=ndBVOb7IYrM

リムジンに乗ってドライブスルーで注文してみた結果www
https://www.youtube.com/watch?v=ddq-zSU75dw

フェラーリ・ポルトフィーノで朝マック行ってみた!
https://www.youtube.com/watch?v=_YCOGbRBQh0

友達の全財産で勝手にアルファード買ってみた【ドッキリ】
https://www.youtube.com/watch?v=4Fv4o_Cp29M

友達の全財産で勝手に2代目のアルファード買ってみた【ドッキリ】
https://www.youtube.com/watch?v=wUUZW4G110w

友達のアルファード売って自分のベンツ買ってみた【ドッキリ】
https://www.youtube.com/watch?v=wjoReIn9NCE

車を買いました。『マセラティ レヴァンテS グランスポーツ』
https://www.youtube.com/watch?v=-MVHxZfrS5o


ここまで見た
  • 511
  •  
  • 2020/12/09(水) 21:38:54.77
oneAPI って無料なん?

ここまで見た
  • 512
  •  
  • 2020/12/21(月) 22:59:55.61
キヤノンが在宅勤務を制度化、現在2000人の対象者をどこま広げられるか
https://newswitch.jp/p/24855
スクエニ、在宅勤務を正式制度化--ハイブリッド体制で柔軟な働き方と業務管理を両立
https://japan.cnet.com/article/35162919/
在宅勤務で職場コミュニケーションが激減? 業務に関わる内容でも「0分〜30分未満」が6割【サイボウズ調べ】
https://webtan.impress.co.jp/n/2020/11/25/38235
AIG損保、管理部門を完全在宅勤務へ、来年度にも
https://mag.executive.itmedia.co.jp/executive/articles/2011/23/news032.html
ヤマハ発動機、在宅勤務を制度化 1月から導入
https://www.nikkei.com/article/DGXMZO66056090Q0A111C2L61000/
年200万円も可能「在宅副業する人」の稼ぎ事情 デジタル小商いで一儲け!在宅仕事の単価一覧
https://toyokeizai.net/articles/-/391961
「在宅勤務を標準へ」――1万5000人がテレワークする日立、セキュリティで見直したことは?
https://www.itmedia.co.jp/news/articles/2010/31/news022.html

ここまで見た
  • 513
  •  
  • 2022/04/21(木) 11:21:49.16
基本無料やぞ
というかvtune使わずに最適化なんぞ出来る訳が無い

ここまで見た
  • 514
  •  
  • 2022/04/21(木) 11:53:42.82
OPPAIに見えた

ここまで見た
  • 515
  •  
  • 2022/07/30(土) 16:25:46.55
低俗化せいこう

ここまで見た
  • 516
  •  
  • 2023/04/28(金) 18:09:07.95
クソ航空機に生活や仕事を妨害されたら‥アプリ『ADS-B Unfiltered Plane Tracker』で登録記号を確認.証拠としてスクショも残しつつ
https://jasearch.info/aircraft_hist.html
▲ここで検索して所有者(使用者)を特定したら.グク゛って電話番號を確認.この地球破壞私権侵害強盜殺人テロリス├にクレームを入れよう!
例えは゛,登録記号「JA119Y』は氣侯変動させて災害連発させて人を殺して私腹を肥やしてる「東京消防庁.03-3212-2111」だと分かる
最近スマホのパケづまりか゛酷いか゛航空無線の広大なプラチナ帯域によってネット帯域か゛不足してるのか゛原因、クソ航空関係者に年1○О兆円
課税するとともに帯域を明け渡させよう!言うまでもなく、四六時中猥褻か゛らみで逮捕されながら威カ業務妨害へリ飛は゛しまくって望遠カメラ
て゛女風呂のぞき見しながらグ儿ク゛ル騷音まき散らして住民ヰライラ犯罪惹起してる税金泥棒クソポリ公ヘリ、特に他県にまで大騷音まき散ら
してる警視庁『JA1?MP』など悪質た゛が、政府等に苦情を言うとともに.傷害や威力業務妨害として告訴して,私権侵害テ口を止めさせよう!

創価学會員は,何百万人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まで出てる世界最惡の殺人腐敗組織公明党を
池田センセ―がロをきけて容認するとか本氣で思ってるとしたら侮辱にもほどがあるそ゛!
hтΤΡs://i、imgur.сom/hnli1ga.jpeg

お絵かきランド
フリックゾンビ
ここまで見た

★お気に入り追加

このページを共有する
facebook twitter hatena line google mixi email
おすすめワード