塔仔roll了又roll

270 posts

塔仔roll了又roll

塔仔roll了又roll

@bony0002

All in Polymarket,发掘概率洼地,https://t.co/o10MxxH8aK

singapore Katılım Kasım 2016
655 Takip Edilen1.3K Takipçiler
cqk
cqk@cqkten·
@bony0002 Why not limit sell?
English
1
0
0
34
Lei Li
Lei Li@_TobiasLee·
@LotusDecoder 上下文肯定要管理的 不然再好的架构和预训练都顶不住啊
中文
2
0
3
3.8K
LotusDecoder
LotusDecoder@LotusDecoder·
发现 Gemini-3-pro 和 glm-4.7 特别不适合做 agent,因为 有效上下文 太短。Gemini-3-pro 在40K,glm-4.7 在 35K。 根据github评测项目作者在大海捞针测试,Gemini-3-pro 在41k时断崖式崩塌到 20%多。意味着超出边界后,问牛答马,搞不清对象,这在复杂任务,高信息密度情况下,几乎是灾难。 然后我本地安排claude code测试了一次glm-4.7,发现ta在40K开始崩得更厉害,直接无法回复连贯有逻辑的文本。 现在 claude code 开机经常 20K,opencode 开机 23K,也就是说留给 难兄难弟们 ,保守只有15K用,这就决定了,他们跑不了多少轮会话和长任务,高信息密度任务。
LotusDecoder tweet mediaLotusDecoder tweet mediaLotusDecoder tweet mediaLotusDecoder tweet media
中文
51
54
408
68.5K
LotusDecoder
LotusDecoder@LotusDecoder·
@zhiyebanzhuan 谷歌把Gemini-3-pro 训崩了。 Gemini-3-flash 可能是另一种全新架构,不是pro的缩小版。
中文
2
0
22
3.7K
塔仔roll了又roll
塔仔roll了又roll@bony0002·
让LLM编写代码递归分解和调用自身,实现上下文规模扩大两个数量级,且保持性能稳定,代码能力大大提高。现有的大模型其实智商和知识底座绝对足够了,今年更多应该是针对不同的工作内容来优化方法论,工具调用和不断总结优化具体工作的最佳实施方式。 日常写代码也有体会,不管是人工还是vibe coding第一遍出来的从产品文档到代码都有很多问题,我自己也是尽量做分解模块,每个小模块都走两三遍,然后逐级递归整合优化,产品文档和实施方案也都要多review几遍再开始真正实施,前期花的时间越多,写代码出现的问题越少,有问题时参考文档或者修改文档,保持一致性,免得最后写出来的东西都不知道是为啥了。
alex zhang@a1zhang

Much like the switch in 2025 from language models to reasoning models, we think 2026 will be all about the switch to Recursive Language Models (RLMs). It turns out that models can be far more powerful if you allow them to treat *their own prompts* as an object in an external environment, which they understand and manipulate by writing code that invokes LLMs! Our full paper on RLMs is now available—with much more expansive experiments compared to our initial blogpost from October 2025! arxiv.org/pdf/2512.24601

中文
0
0
1
586
塔仔roll了又roll
塔仔roll了又roll@bony0002·
@MinseokMatthew poly的前端不够顺滑,下单的体验不够好,另外就是position和历史记录卡顿挺严重,跟交易所比还差很多,redemption那里更是卡
中文
0
0
1
74
Matthew Kim
Matthew Kim@MinseokMatthew·
@bony0002 感谢你这么详细的解答。Polymarket 的易用性和友好的体验确实非常适合打造全球流动性。 如果通过 Relayer 模式,让各类 Builder 能自己引入用户,并打造用户真正喜欢的个性化功能,你觉得他们会做出哪些功能? 作为一个经常下注的用户,你觉得目前最可惜、最不够完善的地方是什么?
中文
1
0
0
40
塔仔roll了又roll
塔仔roll了又roll@bony0002·
成熟的体育博彩不是每个人都能接触到,也分hard/sharp 和soft/retail book,面向大众的基本都是后者,赔率反应慢,水位高且会限制高盈利玩家。大家用polymarket玩体育核心还是容易接触,能滚球,也至少比当地的retail book水位低,且入金方便,全球流动性也不错。 Parlay功能我估计没那么快。 现在尚未支持的功能里,我最希望的是能尽快加速或者放开builder功能,通过relayer模式让builder们自己去拉用户,做用户喜欢的个性化功能,这可能是最快的。
中文
1
0
1
169
Matthew Kim
Matthew Kim@MinseokMatthew·
文章写得太好了。 既然已经有了成熟的体育博彩市场,大家之所以还在用 Polymarket,主要是因为对空投(Airdrop)的预期,还是因为全球流动性更好?或者是为了那种“庄家不会卷款跑路”的信任感(资金安全),亦或是仅仅因为可以用加密资产进行交易? 你觉得 PM 很快就会支持串关(Parlay)功能吗? 另外,在 PM 目前尚未支持的功能中,你觉得大家最想要的是什么?
中文
1
0
1
227
0x亮晶晶(Box Office trader)
@bony0002 对于散户 票房的数据太滞后,Comscore的实时数据门槛又太高 口碑来说,有些电影,中国比北美早半天上映,但中美文化差异化太多 微弱的优势就是多个movies标的去找价格错配,真金白银修正赔率平搏利润 票房最大的机会还是影视业的对赌合同,或许有一天会来pm套保
中文
3
0
0
90
塔仔roll了又roll
塔仔roll了又roll@bony0002·
Wicked: For Good今天美国本土票房估计收入1720万美元,使其本土累计票房达到约1.947亿美元。box office mojo上还没更新,但是基于Deadline、Variety和BroadwayWorld等行业报告,以及X上的一些讨论,应该是在这个数,不知道是不是作为数据源没更新导致我昨天买的wicked跌了40%。Zootopia 26号大规模上映(前一天有预映),以3950万美元的本土票房强势领先,创下了感恩节前夕最高开画纪录,两部续集在假期档期展开激烈竞争。今天专门看了zootopia 2,说实话个人感受比第一部差很多,数据上女性观众数量和小孩好评度也降低了,影院数量低于wicked一点点。wicked的持久力还是不错的,跟疯狂动物城2的票房大战还不好说谁会赢。现在理论赔率应该是持平或者wicked略胜一筹,而目前的今年domestic 票房第一Minecraft在这样的成绩面前确实不太稳当,最多占七成。所以买了点Minecraft no,补了点wicked,下周一大概就能知道结果。一点点,看看能不能赚回电影票钱。 polymarket.com/event/highest-…
中文
2
0
4
1.1K
塔仔roll了又roll
塔仔roll了又roll@bony0002·
@094551YY 散户确实难受,容易恐慌抛售。另外票房数据滞后导致靠ai炒币和ai做市的机器人慢了一大步哈哈哈。这个市场确实最大的机会还是最终得有对赌合同的相关方来实时套保
中文
0
0
1
25
塔仔roll了又roll
塔仔roll了又roll@bony0002·
@094551YY 这也高估了呀,小孩都不爱看了,别说大人,短期八十分合理,长期更低
中文
0
0
0
25