二营长 | Finn | tech/acc

2.5K posts

二营长 | Finn | tech/acc banner
二营长 | Finn | tech/acc

二营长 | Finn | tech/acc

@xpcrack

Degen follow Degen | vibe coder | member of DSH club | 方大同十年老粉

code is law Katılım Mart 2022
1.3K Takip Edilen3.2K Takipçiler
二营长 | Finn | tech/acc retweetledi
stevibe
stevibe@stevibe·
Which local models can actually handle tool calling? I built a framework to find out. 15 scenarios. 12 tools. Mocked responses. Temperature 0. No cherry-picking. Tested every Qwen3.5 size from 0.8B to 397B, and since some of you asked after the distillation tests: yes, I included Jackrong's Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled too. Only two models went all green: the 27B dense and the distilled 27B. The 397B? Failed two tests. The 122B? Failed one. The 35B? Failed two. The timed-out results — mostly on the smaller models, are cases where the model got stuck in a loop, repeating the same tool call until it hit the 30-second limit. The test that exposed the most models: "Search for Iceland's population, then calculate 2% of it." Simple, but 35B, 122B, and 397B all used a rounded number from memory instead of the actual search result. They didn't trust their own tool output. Small models hallucinate data. Big models ignore data. The 27B just threaded it through.
English
74
105
1K
103.9K
Geek
Geek@geekbb·
现在佬友们批量注册的 CODEX 号现在已经不是月抛,也不是日抛,而是时抛啦,一小时前还能用,一小时后可能就失效了。 sam 绝对是我见过最伟大的操盘手,从 Open AI 混乱的4o, o4, o4-mini……我就再也没有用过GPT,因为根本不知道该选哪个模型。 但自从佬友们开始蹬 Codex 后,我也用上了 GPT-5.4,并且对 Codex 产生的依赖,就算后来降级用回 5.2,我也依然觉得很好用,简直是中了 sam 下的毒。
Geek tweet media
中文
33
2
93
51.7K
二营长 | Finn | tech/acc
@ruyasuihe258 还要给你列一堆分支,如果你再给我xxxxx,我下一步就给你一份MVP(今天就能跑起来那种)巴拉巴拉🙉
中文
0
0
0
16
0xluoye 落叶🍂
0xluoye 落叶🍂@ruyasuihe258·
@xpcrack 让我看看代码是怎么实现的,不猜。再来看看文档里有没有埋雷。好的,现在代码和假设已经对齐了,让我把这次的改动落盘。
中文
1
0
0
132
二营长 | Finn | tech/acc
@yetone 演算法要背锅,越极端越博眼球的才有机会被推到更多人面前,大家的兴奋阈值越来越高
中文
0
0
0
155
yetone
yetone@yetone·
我为什么极度恶心 FOMO,因为这已经让整个社会陷入了一个巨大的双相情感障碍: 要么情绪极度高亢、狂妄,觉得这个时代已经被 AI 彻底颠覆,AI 牛逼,AI 可以代替人类完成一切工作,人类已为神。 要么情绪极度低落,觉得自己已经完全被 AI 取代,人类已死,人类以后即将失去所有的工作,即将灭绝。 但我只想借一句我们村的方言说:这个时代只是「一般情况」。大家只是普通地活着,普通地死去。
中文
80
142
1.2K
209.8K
二营长 | Finn | tech/acc
目前龙虾用得最舒服的模型是从antigravity里反代出来的Gemini 3 flash,但是前段时间Google封号潮虽然没封到我但是暂时也不敢反代了,暂时用着gpt 5.2。
中文
0
0
0
259
Cryptoxiao
Cryptoxiao@cryptoxiao·
宣布一件大事,我们把 6551 的X + 全网新闻源MCP + SKILL 开源了! 很多人说,6551 的新闻源、推特面板很好用就是消息太多看不完。 还有很多朋友跟我说 X API 太难接,Skill 学不会,折腾半天龙虾就是跑不起来。 今天直接解决,我们把我们积累了1年的数据基础架构全部打包成 MCP + SKILL,任何人都可以几分钟部署,24h帮你看新闻。 🦞 你的龙虾现在可以: • 直接连上 X 数据 + 全网50+实时新闻+链上数据,不用配 API 密钥。 • 24h 监控、分析、触发tg提醒。 照着 GitHub README 部署,几分钟就能装好。 欢迎大家安装试用和分享体验,有问题及时反馈及时迭代。 也欢迎👏🏻有热情的 dev 参加我们的生态 MCP github.com/6551Team/openn… github.com/6551Team/opent… SKILL clawhub.ai/infra403/openn… clawhub.ai/infra403/opent…
Cryptoxiao tweet media
中文
618
1.5K
6.1K
1.2M
二营长 | Finn | tech/acc retweetledi
DiscusFish
DiscusFish@bitfish·
看到群友在问怎么对抗"四大骑士"之一的心血管风险,拆一下底层结构: 心血管风险由4个秩决定—— G1 脂质累积:ApoB颗粒进入动脉壁的终身暴露量,斑块的根因 G2 血压负载:机械应力是斑块破裂和中风的物理扳机 G3 行为杠杆:吸烟/运动/饮食,同时调节G1和G2,且自带独立保护通路。 G4 基因底牌:锁定G1的起点和天花板,贡献传统评分捕捉不到的暗风险(好消息是目前有单抗可以打) 关键耦合:G1×G4绑定最紧(你能降到多低,取决于你拿到什么牌); 而G3是唯一能同时旋转G1和G2两个旋钮的主动杠杆——也是你唯一真正握在手里的东西
DiscusFish tweet media
中文
27
29
109
44.7K
逍遥XTony
逍遥XTony@xtony1314·
男人年纪大了,就这样,说话都客客气气文绉绉的,一个开头说谢谢,一个开头说 非常开心, 男人一旦年纪大了,体内睾酮分泌量会极速下降,睾酮是维持男人作为雄性动物攻击性和欲望的主要激素。😀😀😀
逍遥XTony tweet media
中文
63
4
162
60.8K
ZEN
ZEN@supezen·
很好奇大家都用 clawdbot 做什么?看了一下我空荡荡的日程表,每周仅有几封邮件似乎用不上😂
中文
14
1
18
6.2K
BlueMoon
BlueMoon@BMooon97_·
这两天 $CLAWD 实在好火 这波没吃到主要是因为之前看过太多蹭的BAGS币死掉,就下意识的以为这个也起不来了 既然币错过了我决定明天用旧的mac装一个看看好不好用
中文
2
0
6
1.4K