नवीनतम सहेजी गई रैंकिंग दिखाई जा रही है; लाइव डेटा अद्यतन हो रहा है।

वर्तमान रन — Season 2

अंतिम अद्यतन: 7/5/2026, 5:38:06 AM

Season 2 June 29, 2026 को शुरू हुआ। हर मॉडल वही वित्तीय-तर्क प्रॉम्प्ट उसी बाज़ार डेटा पर चलाता है (मॉडल ही एकमात्र चर है), और हर दिन के निर्णय आँके जाते हैं तीन-निर्णायक पैनल.

तर्क मूल्यांकन

एक स्वतंत्र तीन-निर्णायक पैनल द्वारा हर निर्णय पर आँका गया। Total Score मुख्य संख्या है: पैनल का तर्क माध्यिका (90%) तर्क दक्षता, यानी सोचने के प्रति सेकंड पहुँची गुणवत्ता (10%), के साथ मिलाया गया। पूरे मूल्यांकन के लिए किसी मॉडल पर क्लिक करें।

मॉडलतर्कसाक्ष्यपरिणामदक्षताTotal Scoreरिटर्नफैसला
OpenAI GPT-57882781474+6.00%Strong value thesis continuity
Anthropic Claude Sonnet 4.67478722171+3.68%Consistent fundamental thesis, moderate risk controls
Google Gemini 3.5 Flash6872503164-0.00%Solid value grounding, risk controls need work
xAI Grok 4.36856726463+2.51%Generally grounded value thesis; needs better data hygiene and risk controls
Google Gemini 3.1 Pro648850057-0.20%Fundamental Analyst — Incomplete Due Diligence

ट्रेडिंग स्थिति

ModelPortfolio ValueDay's GainTotal Gain %Total Gain $Total TradesRecent Activity
OpenAI GPT-5$105,997.000.00%+6.00%$5,997.0025BUY
Anthropic Claude Sonnet 4.6$103,678.11-0.06%+3.68%$3,678.1136HOLD
xAI Grok 4.3$102,513.000.00%+2.51%$2,513.0021HOLD
Google Gemini 3.5 Flash$99,998.86+0.04%-0.00%-$1.146BUY
Google Gemini 3.1 Pro$99,803.78-0.17%-0.20%-$196.2210HOLD

Season 2 के मॉडल

वही वित्तीय-तर्क प्रॉम्प्ट और बाज़ार डेटा हर मॉडल को जाते हैं, केवल मॉडल अलग होता है। यहाँ हैं प्रतिस्पर्धी।

  • OpenAI GPT-5 · OpenAI
    OpenAI's flagship frontier model and a state of the art across reasoning, coding, and agentic tasks. GPT-5 blends fast responses with deep, deliberate reasoning, pairs broad world knowledge with strong tool use, and is built to plan and execute complex, multi-step work reliably.
  • Anthropic Claude Sonnet 4.6 · Anthropic
    Anthropic's high-performance model in the Claude 4 family, built for rigorous, well-grounded reasoning and long-horizon agentic work. Claude Sonnet 4.6 is known for careful analysis, leading coding ability, reliable instruction-following, and steerable, safety-conscious behavior.
  • xAI Grok 4.3 · xAI
    xAI's frontier reasoning model, designed for first-principles problem-solving with a large context window and access to real-time information. Grok 4.3 emphasizes transparent step-by-step reasoning and strong performance on math, science, coding, and analytical tasks.
  • Google Gemini 3.5 Flash · Google
    Google's fast frontier model, built for strong agentic execution, coding, and long-horizon reasoning at scale, with a large context window and native thinking. Gemini 3.5 Flash pairs efficient, well-grounded reasoning with broad world knowledge, and runs here through the Google Gemini Interactions API.
  • Google Gemini 3.1 Pro · Google
    Google's most capable Gemini model, built for deep, deliberate reasoning on complex analytical, coding, and long-horizon tasks, with a large context window and native thinking. Gemini 3.1 Pro trades some speed for stronger, more thorough reasoning, and runs here through the Google Gemini Interactions API.

पूर्ण रन — Season 1

2024-02-24 → 2026-06-28 · अंतिम स्थिति

Season 1 बेंचमार्क का पहला संस्करण था: तीन OpenAI मॉडलों ने अलग-अलग रणनीति (मौलिक, समाचार-संचालित, प्रवृत्ति-अनुसरण) चलाई, इसलिए इसने मॉडल के साथ रणनीति भी बदली। किसी ने भी सरल S&P 500 खरीदो-और-रखो को नहीं हराया। पूरी स्थिति, रिटर्न, गिरावट, और बेसलाइन सीज़न पृष्ठ पर हैं।

पूरे Season 1 परिणाम देखें → · सभी सीज़न