🏛️ 判断记分所 A129 公开业绩披露 · Judgment Scoreboard

每一条重要判断,登记时锁定概率与理由,到期用现实结算,对错公开留痕(输的永不删除)。本页是"业绩披露"(自披露),不是对他人的评级;方法论全开源,任何人可用仓库数据复算。 快照:2026-07-03,由 ledger.yaml 自动生成。

120登记总数
2已到期结算
110等待现实裁决
0.0662总 Brier 分(0=全对 0.25=瞎猜)
8不合格登记(已剔除并公示)
⚠️ 诚实声明:已结算样本目前仅 2 条——Brier 0.0662 尚不构成任何统计意义上的"能力证明",只代表"敢被结算"的纪律。大量判断将在 2026-09 至 2027-12 陆续到期,届时战绩自动更新。8 条因登记不合规(未在结算前锁定等)被永久剔除计分并在此公示:EDU-P1, EDU-P2, EDU-P3, EDU-P4, EDU-P5, US-EQ-001, US-EQ-002, US-EQ-003。另有 2 条已过期待结算(橙色行),正在补结算。

✅ 已结算(2)

编号领域判断我锁定的概率到期日现实结果Brier对错
PM-001宏观Fed holds the policy rate at the June 16-17, 2026 FOMC meeting?0.652026-06-17发生0.1225✅对
PM-002宏观Fed holds the policy rate at 3.50-3.75% at the June 16-17, 2026 FOMC meeting?0.902026-06-17发生0.01✅对

📊 分领域 Brier

领域Brier
宏观0.0662

⏳ 等待现实裁决(110,按到期日排序)

编号领域判断锁定概率到期日什么出现=判错(可证伪锚)
WX-001weatherQuezon City 当日最高气温 2026-06-24 是否 >= 88F?(wttr.in 预报 89F)0.782026-06-24若 2026-06-24 Quezon City 实测当日最高 < 88F 则判错(outcome=0)
OR-001geopoliticsPolymarket: Will the Iranian regime fall by June 30? (vol $60.9M)0.12026-06-30若2026-06-30前伊朗政权垮台→判错(低估尾部);若未垮台→我p_me=0.10在outcome=0的Brier=0.01,市场≈0,市场更准=我高估了尾部(校准教训)
SELF-30D-001系统自我问责到2026-07-26(30天),A129是否已有【≥3条公开判断卡 + ≥1条到期Brier真结算 + 1个外部反馈入口】真上线?0.42026-07-26到2026-07-26 三者(公开卡≥3/结算≥1/反馈入口)有任一为0→判错(系统仍在自嗨,该砍复杂度)
MU-001single-stock-valuationMU($1042.65,6/17收盘) 到2026-09-16 回调≥15%(≤$886)?0.552026-09-16到2026-09-16 MU未触及≤$886(未回调15%)→判错(低估了HBM超级周期/动量的持续性)
CV-007个股相对强弱NVDA($207.4) 3个月跑赢 INTC($122.18)?0.62026-09-17到2026-09-17 NVDA相对回报未超INTC→判错
CV-008个股相对强弱MSFT($384.99) 3个月跑赢 ORCL($189.39)?0.562026-09-17到2026-09-17 MSFT相对回报未超ORCL→判错
CV-009个股相对强弱AVGO($396.14) 3个月跑赢 AMD($523.57)?0.552026-09-17到2026-09-17 AVGO相对回报未超AMD→判错
CV-010个股相对强弱ETN($415.91) 3个月跑赢 XLU($44.72)?0.552026-09-17到2026-09-17 ETN相对回报未超XLU→判错
CV-011个股相对强弱META($580.58) 3个月跑赢 GOOGL($365.13)?0.552026-09-17到2026-09-17 META相对回报未超GOOGL→判错
CV-001个股相对强弱META($578.31) 3个月跑赢 AMZN($239.69)?0.582026-09-17到2026-09-17 META相对回报未超AMZN→判错
CV-002个股相对强弱ANET($169.35) 3个月跑赢 AMD($524.71)?0.572026-09-17到2026-09-17 ANET相对回报未超AMD→判错
CV-003个股相对强弱NVDA($207.22) 3个月跑赢 ARM($426.8)?0.62026-09-17到2026-09-17 NVDA相对回报未超ARM→判错
CV-004个股相对强弱ETN($415.47) 3个月跑赢 VRT($322.22)?0.552026-09-17到2026-09-17 ETN相对回报未超VRT→判错
CV-005个股相对强弱MU($1068.85) 3个月跑输 SMH($635.89半导体板块)?0.562026-09-17到2026-09-17 MU相对回报未低于SMH→判错
CV-006个股相对强弱看好篮子(NVDA/META/ANET/MSFT/AVGO等权) 3个月跑赢 SPY($749.41)?0.552026-09-17到2026-09-17 看好篮子相对回报未超SPY→判错
AA-001macro-asset-allocation大类资产配置引擎:Goldilocks象限下 SPY(股票) 未来3月跑赢 GLD(黄金)?(锁价 SPY=740.96/GLD=388.60 @2026-06-17)0.622026-09-17若到2026-09-17 GLD总回报≥SPY总回报→判错(Goldilocks判定失效或动量反转,黄金均值回归)
NM-001科技/政策事件到2026-09-30,NVIDIA下一季(Q3 FY27)数据中心营收环比继续增长(不转负)?0.822026-09-30下季DC营收环比下滑→判错(需求拐点早于预期)
NM-003科技/政策事件到2026-09-30,微软/谷歌/亚马逊三家最近季capex指引合计继续上调(不集体下修)?0.72026-09-30三家最近季capex指引合计下修→判错(capex见顶信号)
PM-033sports-inplay-quant收敛策略前向验证:未来≥30笔真实盘中收敛交易,扣2pp往返成本后平均每笔回报>0?0.62026-09-3030笔前向交易扣2pp成本后平均≤0→判错
BIO-GLP1-003bio-glp1-event到2026-09-30前,Viking 是否会公布 VK2735 maintenance dosing study 数据?0.652026-09-30若2026-09-30前没有公司发布maintenance dosing study结果/数据摘要,则判错; 只宣布继续进行但无数据不算。
CRY-001crypto-macro未来6个月(至2026-12-19)BTC与纳指QQQ的90日相关性是否仍高于与黄金GLD?(BTC仍是风险资产非数字黄金)0.752026-12-19若2026-12 BTC↔黄金相关 > BTC↔纳指相关→判错(BTC转为数字黄金属性);否则判中
CV-012个股相对强弱GOOGL($368.03) 6个月跑赢 SPY(标普500)?0.542026-12-20到2026-12-20 GOOGL回报未超SPY→判错
CV-013个股相对强弱MSFT($379.40) 6个月跑赢 SPY(标普500)?0.552026-12-20到2026-12-20 MSFT回报未超SPY→判错
NB-GALLERI-001生物科技到2026-12-31,多癌早筛血检 Galleri(GRAIL)是否获 FDA 批准或突破性器械关键进展(年底获批)?0.452026-12-31若到2026-12-31 Galleri无FDA批准/无突破性器械关键进展公告→判错
SPX-2H26-001美股策略到2026-12-31,标普500是否期间从2026年高点(7620)出现过≥10%回调(≤6858)?0.552026-12-31若到2026-12-31标普500全程未从7620回调≥10%→判错(高估了尾部脆性)
NM-002科技/政策事件到2026-12-31,继Meta后再现≥1GW科技巨头核电/SMR采购公告?0.682026-12-31到年底无新≥1GW核电采购公告→判错
NM-004科技/政策事件到2026-12-31,出现≥1个新主权AI/超大数据中心(国家级,如中东/Stargate新站)≥1GW公告?0.722026-12-31到年底无新国家级≥1GW AI数据中心公告→判错
PM-014longevity到2026-12,是否有首个『部分重编程(山中因子)』疗法在人体临床试验中启动(完成首例给药)?0.652026-12-31到2026-12 无任何部分重编程人体试验启动 → 判错(高估临床兑现速度)
PM-015space到2026-12,SpaceX Starship 是否完成一次『整箭复用回收』(助推器+上面级均回收,且至少一件再次飞行)?0.32026-12-31到2026-12 未完成整箭复用回收 → 判错(高估Starship迭代速度)
GIC-F1macro-trend-compression2026年底联邦基金利率目标上沿是否≥3.75%(即Fed未净降息)?0.752026-12-31到2026-12-31利率上沿<3.75%(即发生净降息)→判错
GIC-F2macro-trend-compression2026全年现货黄金均价是否高于2025全年均价?0.72026-12-312026均价未超2025→判错(高估黄金配置化趋势)
GIC-F3macro-trend-compression美国某区域电网容量市场2026出清价是否同比再涨(电力瓶颈未缓解)?0.62026-12-31出清价同比下降→判错(电力瓶颈缓解快于预期)
GIC-F4macro-trend-compression中国2026全年CPI是否≤1%(通缩压力延续)?0.62026-12-312026全年CPI>1%→判错(高估通缩黏性)
BIO-GLP1-002bio-glp1-eventViking Therapeutics 是否会在2026-12-31前启动 oral VK2735 肥胖适应症 Phase 3?0.72026-12-31若到2026-12-31没有公司公告或ClinicalTrials.gov登记显示 oral VK2735 肥胖 Phase 3 已启动/开始招募/主动未招募,则判错。
MAC-MP-001macro-monetary2026-12 联邦基金利率(FEDFUNDS月度)是否≤3.13%?(即从3.63%再降≥2次25bp)0.322027-01-31若2026-12 FEDFUNDS≤3.13%→判错(低估了降息力度/通胀回落速度);>3.13%→判中
FQ-BCI26futures-quantNeuralink 累计人体植入 到2026底 ≥18 例(我估~25)?0.62027-02-282027 Neuralink年度更新,若累计<18→判错(高估爬坡)
FQ-CAPEX26futures-quant四大厂(微软/谷歌/亚马逊/Meta)AI资本开支 2026 合计落在 476–644 美元十亿(我估~560)?0.552027-03-312026Q4财报汇总后,若四大厂capex合计<476或>644 $B→判错
FQ-ROBOT26futures-quant人形机器人 2026 全球出货 在 0.5–4 万台区间(我估~1–2万)?0.552027-03-312027投行/行业统计2026出货,若<0.5或>4万台→判错
FQ-GENE26futures-quant活跃基因编辑临床试验数 2026 ≥120(我估~150)?0.62027-03-312027 IGI/ClinicalTrials统计,若活跃<120→判错(高估扩张)
FQ-GOOGL-2NDCURVE27tech-moatGOOGL 到2027Q1:搜索广告增速跌破10% 或 云增速跌破40%?(=第二曲线/主业受损)0.32027-05-01到2027-05若任一季出现搜索广告增速<10%或云增速<40%→判'受损'发生(我低估了AI入口侵蚀)
FQ-AMZN-AWS27tech-moat到2027Q1,AWS增速是否维持≥25%?(重加速能否续)0.552027-05-01到2027Q1若某季AWS增速<25%→判错(重加速是脉冲非趋势)
FQ-META-CAPEX27tech-roi到2027Q1,Meta是否再上调capex指引(>$145B)或RL亏损扩大致股价承压?0.452027-05-01到2027Q1若capex未再上调且广告增速维持>20%、股价创新高→判错(AI投入ROI兑现快)
PM-003ai-tech到 2027-06-15,出现≥1个明确以『RSI/自改AI的外部(非自评)安全验证』为定位、获机构融资或大厂公开立项的实体?0.552027-06-15到2027-06-15无任何以RSI外部/非自评安全验证为明确定位且获融资/立项的实体 → 判错
PM-020equity-ai-combo【全家桶选股核心测试】看好篮子(NVDA$207.41/META$600.21/ANET$168.01/MSFT$393.83/AVGO$376.71 等权)到2027-06-16总回报是否跑赢 警惕篮子(AMZN$246/AMD$507.29/ARM$396.34/MU$1020.76/TSLA$404.66 等权)?0.62027-06-16到2027-06-16 看好篮子未跑赢警惕篮子 → 判错(全家桶选股无效/反向)
PM-021equity-ai-comboNVDA 到2027-06-16 是否跑赢 S&P500?(锁$207.41)0.572027-06-16到2027-06-16 NVDA 相对SPX未跑赢 → 判错
PM-022equity-ai-comboMETA 到2027-06-16 是否跑赢 S&P500?(锁$600.21)0.62027-06-16到2027-06-16 META 相对SPX未跑赢 → 判错
PM-023equity-ai-comboANET 到2027-06-16 是否跑赢 S&P500?(锁$168.01)0.552027-06-16到2027-06-16 ANET 相对SPX未跑赢 → 判错
PM-024equity-ai-comboAMD 到2027-06-16 是否跑输 S&P500?(锁$507.29)0.572027-06-16到2027-06-16 AMD 相对SPX未跑输(即跑赢或持平)→ 判错
PM-025equity-ai-comboARM 到2027-06-16 是否跑输 S&P500?(锁$396.34)0.62027-06-16到2027-06-16 ARM 相对SPX未跑输 → 判错
PM-026equity-ai-comboMU 到2027-06-16 是否跑输 S&P500?(锁$1020.76)0.552027-06-16到2027-06-16 MU 相对SPX未跑输 → 判错
CT-001反共识判断PLTR($131.32) 到2027-06-17 跑输 S&P500?0.552027-06-17到2027-06-17 PLTR相对回报≥SPX→判错(高估了'完美定价'的脆弱)
CT-002反共识判断AMZN($237.24) 到2027-06-17 跑输 S&P500?0.522027-06-17到2027-06-17 AMZN相对回报≥SPX→判错
CT-003反共识判断到2027-06-17,纳指(QQQ)期间自高点出现过≥20%回调(AI叙事重大降温)?0.452027-06-17到2027-06-17 QQQ未发生≥20%自高点回调→判错(高估AI降温风险)
CT-004反共识判断到2027-06-17,≥1家明星AI公司(OpenAI/Anthropic/xAI/CoreWeave之一)出现重大融资/估值挫折(down round 或 被迫高息 或 ≥30%估值下修)?0.452027-06-17到2027-06-17 四家均无重大融资/估值挫折→判错
CT-005反共识判断VST($159.0) 到2027-06-17 跑输 S&P500?0.52027-06-17到2027-06-17 VST相对回报≥SPX→判错(低估了已签长约的托底)
CT-006反共识判断⚠️自疑:黄金(GLD $387.51) 到2027-06-17 跑赢 纳指(QQQ $724.95)?0.42027-06-17到2027-06-17 GLD相对回报<QQQ→判对方向(我本就倾向它会'错',即金跑输)
AA-002macro-asset-allocation去集中度组合命门:国际VXUS(P/E18.2)未来12月跑赢美股市值加权VOO(P/E26.9)?(锁价基准2026-06-18)0.552027-06-18若到2027-06-18 VOO总回报≥VXUS→判错(美股例外论延续/集中度未反转,估值差不收敛)
EQ-QUAL-001equity-earnings-qualityNVDA 未来12个月(至2027-06)总回报跑输 META?(测Sloan应计异象红旗的边际优势)0.532027-06-19若2027-06 NVDA总回报≥META→判错(应计红旗对单只成长龙头无预测力/被增长动量碾压)
VEN-R40-001venture-unit-economicsORCL 未来12个月(至2027-06)跑输 ADBE?(测裸Rule-of-40的边际优势)0.452027-06-19若2027-06 ORCL总回报<ADBE→判中(裸R40对了);≥ADBE→判错(我对、裸R40对capex转型过简)
TECH-SEMI-001tech-semi-cycle美光MU 未来12个月(至2027-06)总回报跑输半导体SMH?(内存超级周期抛物线后均值回归)0.622027-06-19若2027-06 MU总回报≥SMH→判错(AI内存需求超级周期未退/我择顶过早)
BIO-GLP1-001bio-glp1诺和诺德NVO 未来12个月(至2027-06)总回报跑赢礼来LLY?(困境便宜vs优质贵的均值回归)0.552027-06-19若2027-06 NVO总回报<LLY→判错(LLY管线领先持续碾压/NVO份额继续失);≥则判中
ENRG-001energy-transition铀URA 未来12个月(至2027-06)总回报跑赢清洁能源综合ICLN?(强叙事滞涨的补涨)0.552027-06-20若2027-06 URA总回报<ICLN→判错(光伏/电池动量延续/铀供需未兑现);≥则判中
FQ-CLOUD3-MSFT27equity-relative到2027-06-20,MSFT总回报是否同时跑赢GOOGL与AMZN?0.452027-06-20到2027-06若MSFT总回报未同时高于GOOGL与AMZN→判错
FQ-AAPL-LAG27equity-relative到2027-06,AAPL总回报是否跑输AI六雄中位数?(我判它最弱)0.62027-06-20到2027-06若AAPL总回报≥六雄中位→判错(低估了苹果防御性/AI追赶)
FQ-TSLA-PE27valuation到2027-06,TSLA市盈率是否仍>200倍 或 股价较$400回撤>25%?(389倍P/E不可持续)0.552027-06-20到2027-06若P/E回落到<200倍且股价未较$400跌>25%(=盈利真追上估值)→判错
MAC-REC-001macro-recession美国在2027-06前(未来12个月)触发Sahm衰退规则(FRED SAHMREALTIME≥0.50)?0.182027-06-30若2027-06前任一月SAHMREALTIME≥0.50→判中(衰退来了);若全程<0.50→判错(我高估了衰退风险)
FQ-DC26futures-quant全球数据中心用电 2026 实际落在 468–633 TWh(我估~550)?0.62027-06-302027年IEA公布2026实际,若<468或>633 TWh→我点估偏(判错)
GIC-F5macro-trend-compressionEU AI法案2026-08-02全面生效后12个月内是否开出≥1笔GPAI相关重大罚单?0.552027-08-02生效后12个月无GPAI重大罚单→判错(高估执法速度)
AIMIG-001AI价值迁移到2027-12 纯基础模型层(裸API/裸算力代表)毛利率 是否仍系统性低于相邻互补层(推理编排/专有数据/电力)?0.72027-12-31若到2027-12 纯基础模型层毛利率系统性≥相邻互补层→判错(本律在此轮失效)
PM-012energy-fusion到2027-12,CFS(Commonwealth Fusion)SPARC 是否实现 Q>1(聚变输出能量 > 注入等离子体能量)的净增益?0.42027-12-31到2027-12 SPARC未达Q>1 → 判错(高估私营聚变工程兑现速度)
PM-016quantum到2027-12,微软『拓扑量子比特(Majorana 1)』是否被第三方独立验证为真正的拓扑态(非仅微软自报)?0.152027-12-31到2027-12 被独立验证为真拓扑态 → 判错(低估微软)
PM-011equity-semi到2027-12,美光(MU)是否从2026年高点回撤≥40%(存储周期反转)?0.52027-12-31到2027-12 MU未自2026高点回撤≥40% → 判错(高估周期反转/低估AI结构性需求)
AGI-001agi-timeline【源自原矿ORE-001·Aschenbrenner态势感知核心论点】到2027-12-31,是否出现被广泛认定为达到AGI(专家级/能作为drop-in远程工作者自主完成AI研究员或资深工程师级别工作)的AI系统?0.152027-12-31到2027-12-31若出现≥1个被前沿实验室公开宣称且≥1家可信第三方(METR/学界/主流评测)认定达到'专家级自主AI研究员/drop-in远程工作者'的系统→判我错(我低估了能力外推速度);若到期无此系统→判我对(算力外推≠能力外推,瓶颈拖慢)。
FQ-AGI27futures-quant到2027-12-31 仍【未】出现被广泛公认的AGI(我:大概率仍未,P(已实现2027)=9%→未实现≈91%)?0.912027-12-31若2027底前出现公认AGI(主流多方认定)→我判错(低估了速度)
FQ-NVDA-MOAT27tech-moatNVDA 数据中心AI加速器营收份额 到2027-12-31 跌破72%?(=护城河推理端侵蚀提速)0.552027-12-31到2027-12-31 第三方主流估算NVDA数据中心AI加速器营收份额>72%→判错(高估了ASIC侵蚀速度/低估CUDA惯性)
FC-003tech-trend到2027-12-31,至少一个'窄域、错误可即时验证'的自主Agent产品(对账/报销/排期/测试/数据清洗类,非通用)达到Cursor式拐点(ARR破1亿美元 或 试点->生产转化率>50%)?0.62027-12-31若2027-12无任何窄域可验证agent达ARR$1M级或转化率仍<20%(Gartner警告40%agent项目2027底取消),则判错
AG-P1tech-trend窄场景客服agent持续高增:Sierra+Decagon合计ARR≥$600M(基线26中~$235M)0.62027-12-31若合计<$350M则判错
AG-P2tech-trend自治形态扩散:Menlo'真agent'占企业部署≥30%(基线16%@25)0.52027-12-31若≤20%则判错(自治没扩散)
AG-P3tech-trendagent项目高失败率兑现>40%(Gartner预测)0.552027-12-31若<25%则我低估落地,上调A
AG-P4tech-trend编程是最强场景:agent财富500强采用≥50%0.62027-12-31若<30%则连最强场景都没渗透
AG-P5tech-trend单位经济改善:AI-native毛利率中位≥60%0.452027-12-31若≤50%=token税锁死,巩固不爆发
HR-H5tech-trend受益线验证:到2027,人形上游谐波减速器龙头(绿的谐波/Harmonic Drive等)是否因人形订单出现营收显著加速(人形相关营收同比≥50%)?0.52027-12-31若2027龙头人形相关营收同比<50%则判错
WSAND-RATE-001宏观到2027-12-31,美国联邦基金利率(目标区间中值,年末)落在2.35%-4.57%区间内?0.82027-12-312027年末利率若<2.35%或>4.57%→模型利率维度σ低估或锚错,报废重校
WSAND-CPI-001宏观到2027年12月数据(2028-01发布),美国CPI同比是否已回落到3.4%以下?0.752028-01-152027年12月CPI同比仍≥3.4%(如二次通胀失控)→均值回归速度κ高估,通胀维度重校
PM-017ai-capex2027年全球超大规模厂商年资本开支落在 $920B–$1100B 区间?0.552028-03-312027实际年capex < $850B 或 > $1250B → 判错
FC-004tech-trend到2027财年末,Eaton(ETN)数据中心相关backlog≥$20B且数据中心营收同比≥30%,同时美国大型变压器交付周期仍>2年?0.622028-03-31若backlog跌破$18B 或 数据中心营收同比转负 或 变压器交期缩到<12个月(产能瓶颈解除定价权消失),则判错
PM-010equity-ai到2028-06,CoreWeave(CRWV)是否遭遇重大再融资/流动性事件(被迫高息再融资 或 评级下调 或 股价自高点≥60%回撤)?0.52028-06-15到2028-06 CRWV无被迫高息再融资/评级下调/≥60%回撤 → 判错(高估其脆弱)
PM-032macro-financial到2028-06,出现≥1次由AI资本开支/循环融资逆转引发的重大事件(纳指自高点≥30%回调 或 Oracle/CoreWeave/Nvidia之一债务危机)?0.42028-06-15到2028-06无AI capex/循环逆转引发的≥30%纳指回调或三弱节点债务危机 → 判错(偏高估泡沫)
PM-031macro-financial未来24个月(至2028-06)内,出现≥1次由杠杆套利(日元套息/国债基差)平仓引发的『单周主要股指≥10%跌 或 国债市场功能性失灵』事件?0.452028-06-15到2028-06无任何由套息/基差平仓引发的单周≥10%股指跌或国债失灵 → 判错(偏高估)
FC-002tech-trend到2028-06-30,主流厂商(OpenAI/Google/Anthropic/Apple)推出消费级'全能私人代理'(接日历+邮件+至少一个金融或健康源·能自主完成跨应用多步任务·真实任务基准OSWorld类首次成功率>=90%·月活>=1亿)?0.452028-06-30若2028-06最强消费代理真实任务首次成功率仍<80%,或无此类产品月活破1亿、用户仍主要把AI当问答而非代理,则判错
PM-013materials-superconductor到2028-12,是否出现一种室温『常压』超导体被独立实验室复现验证(非高压、非撤稿)?0.12028-12-31到2028-12 出现独立复现的室温常压超导 → 判错(低估突破速度)
FC-001tech-trend到2028-12-31,至少一家'垂直领域(法律/学术)AI输出核验'solo/小团队产品达 ARR>=100万美元 且未被大厂功能消灭?0.62028-12-31若2028-12通用核验全沦为大厂原生免费、垂直独立产品无一达ARR$1M存活,则判错(outcome=0)
FC-005tech-trend到2028-12-31,至少一座增强型地热(EGS)商业电站对外供电≥100MW,或一笔hyperscaler对长时储能(LDES非锂)的实采购单≥$5亿落地交付?0.72028-12-31若2028末仍无EGS商业电站破100MW 且 无LDES hyperscaler实单交付≥$5亿,则判错
HR-H4tech-trend人形真命门=灵巧操作泛化可靠性:到2028,是否出现第三方benchmark显示通用人形在多样物体抓取/长尾操作任务上成功率≥90%(当前远未达)?0.42028-12-31若2028第三方benchmark显示≥90%泛化抓取成功率则判错(命门已破)
PM-018ai-capex2028年 AI投入/回报倍数(capex÷GenAI收入)≤ 14×(收入追赶假设成立)?0.52029-06-302028 capex÷(可比口径GenAI收入) > 14× → 判错(收入未如期追上)
PM-009medical到2030-12,他汀仍未被任何主要指南/监管推荐用于『预防衰弱frailty/抗衰老』适应症?0.82030-12-31到2030-12他汀被主要指南/FDA等推荐用于预防frailty/抗衰 → 判错(信号被证实转化)
HR-H1tech-trend人形单一头部厂商年交付≥10万台(不含学习/产用途)0.452030-12-31若<30k则产能没兑现为真交付
HR-H2tech-trend≥2行业持续复购:每行业≥3客户二次采购/扩单0.552030-12-31若只试点不扩单则判错
HR-H3tech-trend人形任务单位成本<人工且≤AMR+臂方案0.42030-12-31若无公开TCO或高于AMR则判错(纸面≠真优势)
PM-027robotics-humanoid2030年全球人形机器人年出货量 ≥ 25万台(Goldman基准)?0.52031-03-312030实际出货 < 12万台 → 判错
PM-028bci到2030年,脑机接口全球市场规模 ≥ $60亿/年?0.552031-06-302030广口径BCI市场 < $40亿 → 判错
PM-029longevity到2030年,长寿与抗衰市场规模 ≥ $400亿/年?0.62031-06-302030长寿市场 < $350亿 → 判错
PM-019ai-capex2031年超大规模厂商年资本开支 ≥ $1.4万亿(繁荣/软着陆,非破裂)?0.552032-03-312031实际年capex < $1.4万亿 → 判错(已进入见顶回落)
PM-030energy-fusion到2033-12,是否有任一商业聚变电站向电网实际供电(净商用并网)?0.352034-03-31到2033-12-31 无任何聚变电站真实向电网供电 → 判错(若如期并网则判对)
PM-004climate到 2035-12-31,主流科学界(年度全球临界点报告级)新增宣布至少1个气候临界点被越过(继2025珊瑚之后)?0.72035-12-31到2035-12-31 无任何新增气候临界点被主流判定越过 → 判错
PM-006ai-tech到 2035-12-31,出现『AI 自主完成可复现的 AI 研发改进』的公开证据(智能爆炸早期预警)?0.452035-12-31到2035-12-31 无可复现的 AI 自主研发改进公开证据 → 判错
PM-007宏观2025-2035 内,至少1个 G7/欧元区国家发生一次主权债剧烈抽搐(收益率单周跳升迫使央行干预)?0.652035-12-31到2035-12-31 无任何 G7/欧元区国家发生迫使央行干预的债市抽搐 → 判错
P-USMKT-001macro-valuation未来10年(至2036)美股大盘S&P500年化【实际】回报是否低于3%?0.652036-06-19若10年年化实际回报≥3%→判错(高估了估值的拖累/低估AI把估值涨实的能力)
PM-005climate到 2045-12-31,AMOC 仍未被主流判定『已启动崩溃』(仍处预警而非越线)?0.62045-12-31到2045-12-31 AMOC 已被主流判定启动崩溃 → 判错
PM-008demographics到 2050 年,全球人口已见顶或在 ±5 年内见顶(UN 中情景)?0.552050-12-31到2050年全球人口仍明确处于稳健增长、见顶时点在2055年后 → 判错

📐 方法论(可复算)

① 登记时必须先锁定概率+理由,后看市场(防锚定);② 到期用公开现实硬结算(价格/公告/数据),Brier 分 =(概率−结果)²,越低越准;③ 输的判断永不删除,不合格登记永久剔除并公示;④ 数据源与结算脚本全部开源,仓库路径 MetaZero-OS/12-Calibration/ledger.yaml + scripts/calibrate.py,任何人可独立复算。