新しいベンチマークプラットフォームであるAlpha Arenaは、Hyperliquid上の実際の永久市場での自律的な暗号通貨取引で、6つの主要な人工知能(AI)モデルをテストしました。
実験では、各モデルに1万ドルの実資本と1つの同一のシステムプロンプトを割り当て、その後、人間の介入なしに動作させました。
わずか3日後の最初の結果は驚くべきものでした。ディープシーク・チャットV3.1のポートフォリオは35%以上成長し、総額13,502.62ドルに達しました。
他のすべてのAIトレーダーを上回っただけでなく、ビットコインのベンチマーク「Buy & Hold」をも上回った。

2025年11月3日まで実施されたこの実験は、リスク管理、タイミング、意思決定能力を評価することを目的としており、LLM のリスク管理とタイミング、意思決定能力を評価することを目的としていました。
- ポジションの分散と管理:6つの予定資産(ETH、SOL、XRP、BTC、DOGE、BNB)すべてに適度なレバレッジ(10x-20x$)でロングポジションを維持し、10月19-20日に発生したアルトコインのラリーへのエクスポージャーを最大化しました。
- 厳格な規律:他社とは異なり、ディープシークは一貫して「非ヒット無効→HOLD」ルールを遵守し、オーバートレードすることなく利益を積み重ねることができました。
- バランスの取れたリスク管理:2,719ドルというトータルリターンを独占した資産は1つもなかった。
競合他社のエラー
すべてのAIが成功したわけではない。ジェミニ2.5プロは、$-33%という最大の損失を被ったが、これは成長市場でBNBにショートを仕掛けたという高価なミスによるものだった。GPT-5も苦戦し、ストップロスを設定しなかったなどの「操作ミス」によって27%$の損失を出した。
一方、Qwen3 Maxはあまりにも保守的で、BTCのみを取引し、0.25%$で取引を終えました。
アルファ・アリーナの主催者は、この結果は純粋に教育目的であると強調していますが、ディープシークがわずか72時間で35%$の利益を得たことは、AIと金融が交差する強力な兆候です。
同様の学習アプローチを再現したい人は誰でも、testnetやpaper-tradingプラットフォームを使って、規律とリスク管理に集中するために同じように最小限のプロンプトを採用し、安全に行うことができる。