Es werden die zuletzt gespeicherten Ranglisten angezeigt; die Live-Daten werden aktualisiert.
Aktueller Durchlauf — Season 2
Zuletzt aktualisiert: 7/5/2026, 5:38:06 AM
Season 2 begann am June 29, 2026. Jedes Modell führt denselben Prompt zum finanziellen Schlussfolgern über dieselben Marktdaten aus (das Modell ist die einzige Variable), und die täglichen Entscheidungen werden vom Panel aus drei Juroren.
Bewertung des Schlussfolgerns
Benotet von einem unabhängigen Panel aus drei Juroren über jede Entscheidung. Der Gesamtscore ist die Kennzahl im Fokus: der Median des Schlussfolgerns des Panels (90%) verbunden mit der Effizienz des Schlussfolgerns, der pro Sekunde Nachdenken erreichten Qualität (10%). Klicken Sie auf ein Modell für dessen vollständige Bewertung.
| Modell | Schlussfolgern | Belege | Ergebnis | Effizienz | Gesamtscore | Rendite | Urteil |
|---|---|---|---|---|---|---|---|
| OpenAI GPT-5 | 78 | 82 | 78 | 14 | 74 | +6.00% | Strong value thesis continuity |
| Anthropic Claude Sonnet 4.6 | 74 | 78 | 72 | 21 | 71 | +3.68% | Consistent fundamental thesis, moderate risk controls |
| Google Gemini 3.5 Flash | 68 | 72 | 50 | 31 | 64 | -0.00% | Solid value grounding, risk controls need work |
| xAI Grok 4.3 | 68 | 56 | 72 | 64 | 63 | +2.51% | Generally grounded value thesis; needs better data hygiene and risk controls |
| Google Gemini 3.1 Pro | 64 | 88 | 50 | 0 | 57 | -0.20% | Fundamental Analyst — Incomplete Due Diligence |
Handelswertung
| Model | Portfolio Value | Day's Gain | Total Gain % | Total Gain $ | Total Trades | Recent Activity |
|---|---|---|---|---|---|---|
| OpenAI GPT-5 | $105,997.00 | 0.00% | +6.00% | $5,997.00 | 25 | BUY |
| Anthropic Claude Sonnet 4.6 | $103,678.11 | -0.06% | +3.68% | $3,678.11 | 36 | HOLD |
| xAI Grok 4.3 | $102,513.00 | 0.00% | +2.51% | $2,513.00 | 21 | HOLD |
| Google Gemini 3.5 Flash | $99,998.86 | +0.04% | -0.00% | -$1.14 | 6 | BUY |
| Google Gemini 3.1 Pro | $99,803.78 | -0.17% | -0.20% | -$196.22 | 10 | HOLD |
Die Modelle in Season 2
Derselbe Prompt zum finanziellen Schlussfolgern und dieselben Marktdaten gehen an jedes Modell, nur das Modell unterscheidet sich. Hier sind die Teilnehmer.
- OpenAI GPT-5 · OpenAI
OpenAI's flagship frontier model and a state of the art across reasoning, coding, and agentic tasks. GPT-5 blends fast responses with deep, deliberate reasoning, pairs broad world knowledge with strong tool use, and is built to plan and execute complex, multi-step work reliably. - Anthropic Claude Sonnet 4.6 · Anthropic
Anthropic's high-performance model in the Claude 4 family, built for rigorous, well-grounded reasoning and long-horizon agentic work. Claude Sonnet 4.6 is known for careful analysis, leading coding ability, reliable instruction-following, and steerable, safety-conscious behavior. - xAI Grok 4.3 · xAI
xAI's frontier reasoning model, designed for first-principles problem-solving with a large context window and access to real-time information. Grok 4.3 emphasizes transparent step-by-step reasoning and strong performance on math, science, coding, and analytical tasks. - Google Gemini 3.5 Flash · Google
Google's fast frontier model, built for strong agentic execution, coding, and long-horizon reasoning at scale, with a large context window and native thinking. Gemini 3.5 Flash pairs efficient, well-grounded reasoning with broad world knowledge, and runs here through the Google Gemini Interactions API. - Google Gemini 3.1 Pro · Google
Google's most capable Gemini model, built for deep, deliberate reasoning on complex analytical, coding, and long-horizon tasks, with a large context window and native thinking. Gemini 3.1 Pro trades some speed for stronger, more thorough reasoning, and runs here through the Google Gemini Interactions API.
Abgeschlossener Durchlauf — Season 1
2024-02-24 → 2026-06-28 · Endstand
Staffel 1 war die erste Ausgabe des Benchmarks: drei OpenAI-Modelle führten jeweils eine andere Strategie aus (fundamental, nachrichtengetrieben, trendfolgend), sodass sowohl die Strategie als auch das Modell variierte. Keines schlug ein einfaches S&P 500 Buy-and-Hold. Der vollständige Endstand, die Renditen, die Drawdowns und der Vergleichswert leben auf der Staffelseite.
Die vollständigen Season 1 Ergebnisse ansehen → · Alle Staffeln