katago-v1.14.0リリース
katago-v1.14.0がリリースされました。
https://github.com/lightvector/KataGo/releases/tag/v1.14.0
「b28」ニューラルネット等新機能の追加、エンジンの改良、メインエンジンのバグ修正、開発ツールの改善等
詳細はリリースページをご覧ください。
導入方法はこちらも見てください。
https://www.h-eba.jp/Lizzie/soft.html#gk5
これからKataGoをエンジンとしている多くのGUIがアップデートされるでしょう。
Eba 2023/12/28(Thu) 23:17 No.1560
katago-v1.14.0は一足早いお年玉か
前Ver.のkatago-v1.13.xは旧Ver.のv1.12.xに比べてぱっとしなかったが今回のv1.14.0は かなり早くなっているようです
いつもの「kata1の主なNW 最新版」でb18c384nbtと18b最新版をmv2000で100戦させているがv1.13.0opclでは
RTX2080機で検証すると約11時間かかる しかしv1.14.0opclで同じ検証をすると約8時間40分程で終了する 実に20%以上
早くなっているようです opclでの検証なのでTRTやCUDA(cudnn)のバージョンアップはほとんど関係ないと思われます
結論としてv1.14.0自体がグレードアップしているように感じます 引き続きCUDAやTRT及びCPUモード版も検証します
追記 hope366さんへRTX3070機でも同様の検証をします RTX2080機でのnumSearchThreadsは色々チェックして
最も高棋力だった18にRTX3070機は同様にチェックして20にしています
尚 v1.14.0のOpenCL版にはOpenCL.dllが付属していませんが無くても正常に動くようです
追記2 hope366さんへRTX3070機でも上記の検証をしましたが普段v1.13.0opclでは6時間程で終了していますが
v1.14.0opclでも6時間近くかかったので有意差はありませんでした 思い返せばRTX2080の基本性能からして
11時間は かかり過ぎると感じていたのでv1.14.0opclで本来の基本性能が引き出されたと思われます
v1.14.0版で引き出されたと言えば昨年11月頃からDATA用の内蔵HDDがクラッシュしてOS起動用のSSDまで起動
しなくなって放置していたGTX1070機を1年ぶりに問題のHDDを余り使用していなかったHDDと取替え更にSSDにWin10を
インストールし直して復活させたついでにGPUをRTX4060Ti(適当な中古が無かったのでネットで最安値の新品を購入)を
GTX1070と差し替えて使用しています 消費電力が少ないため処理速度はRTX3070より少し遅いかなと予想していたが
上記の検証をした結果3070より40分も早い5時間20分程で終了しました ただ TRT版やopcl版は問題が無かったのですが
何故かCUDA版が異常に遅くなりCPUモード版とあまり変わらない程でした 色々チェックしましたが原因不明のまま
現在に至っています しかし今回のv1.14.0のCUDA版は本来の早さが戻ってopcl版を寄せ付けない高棋力です
v1.13.0とv1.14.0のTRT版同士やCUDA版同士等の対戦結果は順次「情報掲示板」に掲載していきます
追記3 RTX4060Ti機でv1.13.0のCUDA版が異常に遅いと書きましたがv1.14.0のホルダーから*.dllファイルをv1.13.0のホルダーに
全てコピー(同一ファイルは上書き)して再度チェックしたら本来の早さが戻りました
いつもの「kata1の主なNW 最新版」でb18c384nbtと18b最新版をmv2000で100戦させているがv1.13.0opclでは
RTX2080機で検証すると約11時間かかる しかしv1.14.0opclで同じ検証をすると約8時間40分程で終了する 実に20%以上
早くなっているようです opclでの検証なのでTRTやCUDA(cudnn)のバージョンアップはほとんど関係ないと思われます
結論としてv1.14.0自体がグレードアップしているように感じます 引き続きCUDAやTRT及びCPUモード版も検証します
追記 hope366さんへRTX3070機でも同様の検証をします RTX2080機でのnumSearchThreadsは色々チェックして
最も高棋力だった18にRTX3070機は同様にチェックして20にしています
尚 v1.14.0のOpenCL版にはOpenCL.dllが付属していませんが無くても正常に動くようです
追記2 hope366さんへRTX3070機でも上記の検証をしましたが普段v1.13.0opclでは6時間程で終了していますが
v1.14.0opclでも6時間近くかかったので有意差はありませんでした 思い返せばRTX2080の基本性能からして
11時間は かかり過ぎると感じていたのでv1.14.0opclで本来の基本性能が引き出されたと思われます
v1.14.0版で引き出されたと言えば昨年11月頃からDATA用の内蔵HDDがクラッシュしてOS起動用のSSDまで起動
しなくなって放置していたGTX1070機を1年ぶりに問題のHDDを余り使用していなかったHDDと取替え更にSSDにWin10を
インストールし直して復活させたついでにGPUをRTX4060Ti(適当な中古が無かったのでネットで最安値の新品を購入)を
GTX1070と差し替えて使用しています 消費電力が少ないため処理速度はRTX3070より少し遅いかなと予想していたが
上記の検証をした結果3070より40分も早い5時間20分程で終了しました ただ TRT版やopcl版は問題が無かったのですが
何故かCUDA版が異常に遅くなりCPUモード版とあまり変わらない程でした 色々チェックしましたが原因不明のまま
現在に至っています しかし今回のv1.14.0のCUDA版は本来の早さが戻ってopcl版を寄せ付けない高棋力です
v1.13.0とv1.14.0のTRT版同士やCUDA版同士等の対戦結果は順次「情報掲示板」に掲載していきます
追記3 RTX4060Ti機でv1.13.0のCUDA版が異常に遅いと書きましたがv1.14.0のホルダーから*.dllファイルをv1.13.0のホルダーに
全てコピー(同一ファイルは上書き)して再度チェックしたら本来の早さが戻りました
odagaki0621 2023/12/29(Fri) 22:12 No.1563
Re: katago-v1.14.0リリース
私の環境では、1.13.0-opclと1.14.0-opclではほとんど速度の違いはありませんでした。
リリースページでもopcl版の速度に関しては特に書かれていません。
対局に要する時間は総手数に依存する部分が大きいので、速度の計測には向いていないと思います。(100局もやればかなり平均化されるとは思いますが・・)
また、odagakiさんの報告にはスレッド数の記載もありません。スレッド数によっても速度はかなり違ってきます。
速度の計測は基本通りベンチマークテストを行うのが良いと思います。
対局をさせるよりもはるかに短時間で計測できますし。
リリースページでもopcl版の速度に関しては特に書かれていません。
対局に要する時間は総手数に依存する部分が大きいので、速度の計測には向いていないと思います。(100局もやればかなり平均化されるとは思いますが・・)
また、odagakiさんの報告にはスレッド数の記載もありません。スレッド数によっても速度はかなり違ってきます。
速度の計測は基本通りベンチマークテストを行うのが良いと思います。
対局をさせるよりもはるかに短時間で計測できますし。
hope366 2023/12/29(Fri) 23:30 No.1564
Re: katago-v1.14.0リリース
以前から疑問に感じているのですが、速度を計測するときにodagakiさんは何故ベンチマークテストを用いないのでしょうか?
棋力を調べる場合は対局が適していますが、速度を計測する場合は対局は不適切だと思います。
理由としては前回述べた総手数の問題の他に、次の問題があります。
対局の際に同じことが起こるのかどうか分かりませんが、少なくとも分析の時は訪問数の増え方は毎回一定ではないです。
必然の手順が発生した場合は以前の分析をそのままあてはめるみたいな感じになるので、訪問数の増加の仕方が通常よりも桁違いに速いです。
つまり、仮に訪問数2000で同じ200手で終わる対局でも碁形によって所要時間が違ってくる可能性があります。
100局を消化するのに10時間前後かかるとのことですが、ベンチマークテストはわずか数分で終わります。
他の人も比較的お手軽にできることなので横の比較にも便利です。
是非ベンチマークテストをやってみてはどうでしょうか?
棋力を調べる場合は対局が適していますが、速度を計測する場合は対局は不適切だと思います。
理由としては前回述べた総手数の問題の他に、次の問題があります。
対局の際に同じことが起こるのかどうか分かりませんが、少なくとも分析の時は訪問数の増え方は毎回一定ではないです。
必然の手順が発生した場合は以前の分析をそのままあてはめるみたいな感じになるので、訪問数の増加の仕方が通常よりも桁違いに速いです。
つまり、仮に訪問数2000で同じ200手で終わる対局でも碁形によって所要時間が違ってくる可能性があります。
100局を消化するのに10時間前後かかるとのことですが、ベンチマークテストはわずか数分で終わります。
他の人も比較的お手軽にできることなので横の比較にも便利です。
是非ベンチマークテストをやってみてはどうでしょうか?
hope366 2023/12/30(Sat) 13:03 No.1565