轩辕在意乡
24 posts









Updated my Grok Rate Limit Display Chrome extension. Added Grok Imagine support. Now you can easily track how many chat queries, and imagine video and image generations you have left and how long you have to wait for more. Download. chromewebstore.google.com/detail/grok-ra… or just search the chrome web store for "Grok Rate Limit Display" note: Waiting for google to approve ver 1.6.0 with imagine support




🔥兄弟们!这个哥们挺狠的! 居然一个人用43年网球数据+笔记本电脑,造出85%准确率的AI胜负预测器! 想象一下:有人把过去43年所有职业男子网球(ATP)比赛的数据一股脑塞进电脑,让机器学习模型来预测“谁会赢”。模型居然说:“我行!” 更牛的是,它在2025年澳大利亚网球公开赛(一个它训练时完全没见过的新赛事)上,正确猜中了116场比赛里的99场——包括最终冠军辛纳(Jannik Sinner)每一场胜利! 现场职业体育预测准确率高达85%! 而且整个项目只用了一台普通笔记本、免费公开数据和开源代码。 这个“独狼”AI项目的主人叫 @theGreenCoding(YouTube上叫 Green Code),我来用最通俗的语言,带大家从头到尾拆解它到底是怎么做到的——就像讲故事一样,零基础也能看懂! # 第一部分:43年数据 = 圣杯级宝藏 一切从数据开始。他找到了网球界的“圣杯”: 1985–2024年每一次ATP比赛的完整记录! 包括每一个破发点、双误、正手、反手、球员身高、年龄、排名、交手记录、比赛场地类型……甚至ATP官方追踪的每一个技术统计。 95,491场比赛,全部塞进一个文件夹。打开整个文件时,他的电脑差点崩溃,Excel直接投降。 但他没停下! 他还为每场比赛手动算了81个高级特征: - 两人历史交手战绩 - 年龄差、身高差 - 最近10场/25场/50场/100场胜率 - 一发得分率差、破发拯救率差…… 最厉害的是,他自己发明了一套自定义ELO积分系统(就是国际象棋里用的那种评分),后来证明这是最强的预测神器! 最终数据集:95,491行 × 81列,相当于把40年网球历史“浓缩”成一张超级详细的Excel表。 第二部分:先用“泰坦尼克号”理解决策树 在正式训练前,他先用最简单的方式搞懂算法——自己从零用Numpy写了一个决策树。 为了解释清楚,他拿出了经典的“泰坦尼克号”数据集: 决策树就像一本“选择你的冒险”游戏书。它会不停问“是/否”问题,把乘客分成“生还”或“遇难”。 比如第11号乘客Elizabeth小姐: 1. 票价 > 20英镑?→ 是 2. 头等舱?→ 是 → 预测:生还!(真实结果也是) 算法怎么知道先问哪个问题?它会试遍所有特征,挑出最能把两类人分开的那一个(比如头等舱)。 然后继续往下分,直到叶子节点“纯净”为止。 他用这个小玩具验证了思路,再用专业库(sklearn)跑真正的9.5万场网球数据。 第三部分:ELO差值——一眼就能看出输赢的“王牌特征” 他把所有81个特征画成散点图矩阵(pairplot),结果发现: 大部分特征都是“噪音”。 只有一个特征鹤立鸡群——ELO积分差值! 散点图里,ELO差大的比赛,胜负几乎是一条清晰的分界线。 其他特征完全比不了。这让他下定决心,把ELO系统做到极致。 第四部分:把国际象棋ELO搬到网球 ELO规则超级公平: 每个人初始1500分。 打败比你强的对手,得分多;输给比你弱的,扣分也多。 举个例子:2023温网决赛,阿尔卡拉斯(2063分)爆冷击败德约科维奇(2120分)。 按照公式,阿尔卡拉斯涨14分,德约扣14分。简单吧?但把这个公式跑43年数据后,威力惊人! 第五部分:Big Three的“数学霸权”可视化 他画出费德勒职业生涯每场比赛的ELO曲线: 早期爬坡 → 巅峰统治 → 后期波动,一目了然。 再把**所有**ATP球员的ELO曲线叠在一起…… 画面震撼了! 费德勒(绿)、纳达尔(蓝)、德约科维奇(红)三条线像三座高山,远远高出其他所有人! Big Three不是粉丝吹的,是数学铁证! 目前他的ELO榜:辛纳2176(第1)> 德约2096> 阿尔卡拉斯2003。 第六部分:场地才是天花板 网球最特殊的地方就是场地:红土慢、草地快、硬地居中。 他又给每个球员算了红土ELO、草地ELO、硬地ELO。 结果完美验证了大家都知道的事: 纳达尔在红土的ELO,是整个数据库里任何球员在任何场地的最高分! 14个法网冠军,112胜4负——ELO不看故事,只看胜负,却得出了完全一样的结论。 第七、八部分:算法升级——从74%到85%的逆袭 数据和ELO准备好后,他开始训练不同模型: - 单一决策树:74%(只比纯ELO的72%好一点) - 随机森林(94棵树投票):76% - XGBoost(随机森林的“激素版”):85%! XGBoost的牛逼之处在于:每一棵新树都专门去“纠正”前面树的错误,还加了防过拟合机制。 它告诉他:最重要的三个特征就是——ELO差、场地ELO差、总ELO。 (他还试了神经网络,只有83%,树模型完胜!) 第九部分:真实考验——2025澳网盲测 模型只用2024年12月以前的数据训练。 2025澳网全程完全没见过! 结果:116场有足够数据的比赛,猜对99场,准确率85.3%! 它甚至在开赛前就准确预测:辛纳会夺冠,并且每场都赢! 一个大学生,用笔记本、Python、公开数据,就做出了能提前预言大满贯冠军的AI! 代码已开源,任何人都能复现。



















