塔仔roll了又roll

270 posts

塔仔roll了又roll

@bony0002

All in Polymarket，发掘概率洼地，https://t.co/o10MxxH8aK

singapore Katılım Kasım 2016

655 Takip Edilen1.3K Takipçiler

Sabitlenmiş Tweet

塔仔roll了又roll@bony0002·26 Ara

x.com/i/article/2004…

ZXX

133.1K

塔仔roll了又roll@bony0002·23 Şub

@cqkten on travel, bad network so just market sell

English

cqk@cqkten·23 Şub

@bony0002 Why not limit sell?

English

塔仔roll了又roll@bony0002·23 Şub

claude 5.7 - 63.7，因为gemini 3.1出了就跑了外加一个之前gemini 第一的no，22 - 78.3

塔仔roll了又roll@bony0002

polymarket.com/event/deepseek… 配合polymarket.com/event/which-co… 压下一个大更新是ds v4和claude领先

中文

420

塔仔roll了又roll@bony0002·20 Oca

@0xLuckyPig 好的，我现在是每天看，但是很少发东西，看到肯定回的

中文

0xluckyPig ✨@0xLuckyPig·20 Oca

@bony0002 塔哥看看dm

日本語

塔仔roll了又roll@bony0002·20 Oca

polymarket.com/event/deepseek… 配合polymarket.com/event/which-co… 压下一个大更新是ds v4和claude领先

中文

861

塔仔roll了又roll@bony0002·15 Oca

Ralph Wiggum 插件真挺好用 ghuntley.com/ralph/

中文

357

塔仔roll了又roll@bony0002·10 Oca

@_TobiasLee @LotusDecoder 同意，上下文管理，合理的skills，定期回归产品，演进，bug文档，这些都很重要

中文

Lei Li@_TobiasLee·10 Oca

@LotusDecoder 上下文肯定要管理的不然再好的架构和预训练都顶不住啊

中文

3.8K

LotusDecoder@LotusDecoder·10 Oca

发现 Gemini-3-pro 和 glm-4.7 特别不适合做 agent，因为有效上下文太短。Gemini-3-pro 在40K，glm-4.7 在 35K。根据github评测项目作者在大海捞针测试，Gemini-3-pro 在41k时断崖式崩塌到 20%多。意味着超出边界后，问牛答马，搞不清对象，这在复杂任务，高信息密度情况下，几乎是灾难。然后我本地安排claude code测试了一次glm-4.7，发现ta在40K开始崩得更厉害，直接无法回复连贯有逻辑的文本。现在 claude code 开机经常 20K，opencode 开机 23K，也就是说留给难兄难弟们，保守只有15K用，这就决定了，他们跑不了多少轮会话和长任务，高信息密度任务。

中文

408

68.5K

塔仔roll了又roll@bony0002·10 Oca

@LotusDecoder @zhiyebanzhuan 确实

中文

157

LotusDecoder@LotusDecoder·10 Oca

@zhiyebanzhuan 谷歌把Gemini-3-pro 训崩了。 Gemini-3-flash 可能是另一种全新架构，不是pro的缩小版。

中文

3.7K

塔仔roll了又roll@bony0002·5 Oca

让LLM编写代码递归分解和调用自身，实现上下文规模扩大两个数量级，且保持性能稳定，代码能力大大提高。现有的大模型其实智商和知识底座绝对足够了，今年更多应该是针对不同的工作内容来优化方法论，工具调用和不断总结优化具体工作的最佳实施方式。日常写代码也有体会，不管是人工还是vibe coding第一遍出来的从产品文档到代码都有很多问题，我自己也是尽量做分解模块，每个小模块都走两三遍，然后逐级递归整合优化，产品文档和实施方案也都要多review几遍再开始真正实施，前期花的时间越多，写代码出现的问题越少，有问题时参考文档或者修改文档，保持一致性，免得最后写出来的东西都不知道是为啥了。

alex zhang@a1zhang

Much like the switch in 2025 from language models to reasoning models, we think 2026 will be all about the switch to Recursive Language Models (RLMs). It turns out that models can be far more powerful if you allow them to treat *their own prompts* as an object in an external environment, which they understand and manipulate by writing code that invokes LLMs! Our full paper on RLMs is now available—with much more expansive experiments compared to our initial blogpost from October 2025! arxiv.org/pdf/2512.24601

中文

586

塔仔roll了又roll@bony0002·4 Oca

准备去搞一套

中文

740

塔仔roll了又roll@bony0002·4 Oca

好饭不怕晚，分数凯利下注总体还是赚了一点点。当时买的时候看不上三月的那个一倍赔率，买少了😂😂😂polymarket.com/?via=4xN54aw

塔仔roll了又roll@bony0002

1. 六号左右入场，航母在摩洛哥停驻，大家觉得是准备打尼日利亚，Yes概率低估了 2. 川普没有向国会提交相关议案，yes概率降低，最多的时候亏一半 3. 十号二次入场，思路是通过grok查找公开信源OSINT，以及相关分析各种航船信息，飞机位置信息，目击信息等等的大v，确认大概率是航母还在朝加勒比海挺近，并且补给船在全速靠拢。 4. 过了一两天，概率有小变化，但是不明显，甚至航母已经到加勒比海附近了还是没变化，直到阿利伯克级靠近，消息发酵，补仓后还是略亏。 5. 今天终于涨起来了！！！grok第三次分析，一般航母打击群到位后七天内发生military engagement的概率是很高了，看看政府开门红是不是落在委内瑞拉。总结：grok是目前收集x上高质量推特最快和最及时的，对信息和规则的分析能力稍差一点问题不大，毕竟很多信息是已经过专业分析过滤。

中文

435

塔仔roll了又roll retweetledi

Dr.Hash“Wesley”@CryptoApprenti1·27 Ara

x.com/i/article/2004…

ZXX

153

84.9K

塔仔roll了又roll@bony0002·8 Ara

好久之前研究边缘对冲事件下的单子，居然涨了 polymarket.com/event/how-many…

中文

860

塔仔roll了又roll@bony0002·30 Kas

@MinseokMatthew poly的前端不够顺滑，下单的体验不够好，另外就是position和历史记录卡顿挺严重，跟交易所比还差很多，redemption那里更是卡

中文

Matthew Kim@MinseokMatthew·30 Kas

@bony0002 感谢你这么详细的解答。Polymarket 的易用性和友好的体验确实非常适合打造全球流动性。如果通过 Relayer 模式，让各类 Builder 能自己引入用户，并打造用户真正喜欢的个性化功能，你觉得他们会做出哪些功能？作为一个经常下注的用户，你觉得目前最可惜、最不够完善的地方是什么？

中文

塔仔roll了又roll@bony0002·23 Kas

x.com/i/article/1992…

ZXX

346

170.6K

塔仔roll了又roll@bony0002·30 Kas

成熟的体育博彩不是每个人都能接触到，也分hard/sharp 和soft/retail book，面向大众的基本都是后者，赔率反应慢，水位高且会限制高盈利玩家。大家用polymarket玩体育核心还是容易接触，能滚球，也至少比当地的retail book水位低，且入金方便，全球流动性也不错。 Parlay功能我估计没那么快。现在尚未支持的功能里，我最希望的是能尽快加速或者放开builder功能，通过relayer模式让builder们自己去拉用户，做用户喜欢的个性化功能，这可能是最快的。

中文

169

Matthew Kim@MinseokMatthew·30 Kas

文章写得太好了。既然已经有了成熟的体育博彩市场，大家之所以还在用 Polymarket，主要是因为对空投（Airdrop）的预期，还是因为全球流动性更好？或者是为了那种“庄家不会卷款跑路”的信任感（资金安全），亦或是仅仅因为可以用加密资产进行交易？你觉得 PM 很快就会支持串关（Parlay）功能吗？另外，在 PM 目前尚未支持的功能中，你觉得大家最想要的是什么？

中文

227

塔仔roll了又roll@bony0002·29 Kas

@094551YY 我现在甚至有点看好Avatar 3了

中文

0x亮晶晶(Box Office trader)@094551YY·29 Kas

@bony0002 对于散户票房的数据太滞后，Comscore的实时数据门槛又太高口碑来说，有些电影，中国比北美早半天上映，但中美文化差异化太多微弱的优势就是多个movies标的去找价格错配，真金白银修正赔率平搏利润票房最大的机会还是影视业的对赌合同，或许有一天会来pm套保

中文

塔仔roll了又roll@bony0002·28 Kas

Wicked: For Good今天美国本土票房估计收入1720万美元，使其本土累计票房达到约1.947亿美元。box office mojo上还没更新，但是基于Deadline、Variety和BroadwayWorld等行业报告，以及X上的一些讨论，应该是在这个数，不知道是不是作为数据源没更新导致我昨天买的wicked跌了40%。Zootopia 26号大规模上映（前一天有预映），以3950万美元的本土票房强势领先，创下了感恩节前夕最高开画纪录，两部续集在假期档期展开激烈竞争。今天专门看了zootopia 2，说实话个人感受比第一部差很多，数据上女性观众数量和小孩好评度也降低了，影院数量低于wicked一点点。wicked的持久力还是不错的，跟疯狂动物城2的票房大战还不好说谁会赢。现在理论赔率应该是持平或者wicked略胜一筹，而目前的今年domestic 票房第一Minecraft在这样的成绩面前确实不太稳当，最多占七成。所以买了点Minecraft no，补了点wicked，下周一大概就能知道结果。一点点，看看能不能赚回电影票钱。 polymarket.com/event/highest-…

中文

1.1K

塔仔roll了又roll@bony0002·29 Kas

@094551YY 散户确实难受，容易恐慌抛售。另外票房数据滞后导致靠ai炒币和ai做市的机器人慢了一大步哈哈哈。这个市场确实最大的机会还是最终得有对赌合同的相关方来实时套保

中文

塔仔roll了又roll@bony0002·29 Kas

@094551YY 这也高估了呀，小孩都不爱看了，别说大人，短期八十分合理，长期更低

中文

0x亮晶晶(Box Office trader)@094551YY·29 Kas

@bony0002 zootopia 2 烂番茄评分下降到92%了

中文

Keşfet

@cqkten @0xLuckyPig @_TobiasLee @LotusDecoder @zhiyebanzhuan @MinseokMatthew @elonmusk @BarackObama