momo

94 posts

momo

momo

@x0Er_go

01 | 研3 | 算法 | 啥都碎碎念 保持热爱 | 保持好奇 :-)

Beijing, China Katılım Kasım 2024
428 Takip Edilen8 Takipçiler
铁锤人
铁锤人@lxfater·
阿 Su是谁呀? 我难道已经不是程序员了吗?都不知道这号人物了。
中文
80
0
32
24.4K
momo
momo@x0Er_go·
@MaxForAI 笑死,吃瓜后还能刷到安利
中文
0
0
1
50
Max For AI
Max For AI@MaxForAI·
哦,补充一个利益相关点:之前歸藏推荐了一个非常好的健身房(2000一年,游泳篮球攀岩健身器材都有) 似乎由此看起来我算是利益相关里的受益方???
中文
2
0
10
2.7K
momo
momo@x0Er_go·
@op7418 确实 让我想起了沐神
中文
0
0
0
642
momo
momo@x0Er_go·
@MaxForAI 培养人才不应该是公司的一种社会责任吗,都这么搞未来不敢想象
中文
1
0
1
540
Max For AI
Max For AI@MaxForAI·
Anthropic已经不招聘技术专家以下程序员了👀 OpenAI的研究员Suvansh今天提到了一个传闻: Anthropic已经停止了招聘L6级别一下的人。 这件事如果是真的,其实个非常强烈的信号。 因为前段时间已经有一批原来CTO、CEO的人,去了Anthropic做Member of Technical Staff。 比如原Workday的CTO Peter Bailis,之前还是Google VP Engineering、Stanford CS教授、Sisu Data创始人。2026年3月/4月去了Anthropic,职位是Member of Technical Staff。 还有Mike Krieger是Instagram联合创始人、前CTO 2024年先以Anthropic CPO身份加入,2026年1月转去Anthropic Labs,title变成Member of Technical Staff,和Ben Mann一起带Labs,方向是Claude能力前沿上的实验产品。 特别是Niki Parmar,他是Transformer论文作者之一,前Adept AI联合创始人兼CTO,后来联合创办Essential AI。2025年初加入Anthropic,职位是Member of Technical Staff。 换句话说,Anthropic现在要的不是「便宜的Junior」,而是能直接站到模型、RL、Agent、infra火线上的老兵。 这就是现在CS就业最残酷的事情:初级工程师没有人需要了。 以前一个团队需要很多Junior写代码、补测试、接需求、做边角料。 现在这些事情,一个强工程师,带着一堆Claude Code、Codex、内部Agent,可能就能顶掉过去一个小组的产能。 所以问题来了:如果连Anthropic这种公司都觉得L6以下的人招进来性价比不高,那普通公司的Junior岗位还能剩多少? AI先干掉的,可能不是程序员这个的职业。 而是各个行业里最依赖「有人带、有任务拆、有重复劳动练级」的那一层。 也就是刚毕业的那些人。。。 祝我那些在读硕士/博士的朋友们好运🙏 哦对,L6相当于⬇️ 阿里:大概P7 腾讯:大概T3-3 字节:大概3-1 百度:大概T7 美团:大概L8 华为:大概17
Suvansh Sanjeev@SuvanshSanjeev

damn dario walking his walk — word is anthro stopped hiring below L6

中文
38
53
368
199.9K
momo
momo@x0Er_go·
@plantegg 感觉ysy是一个很有意思的人
中文
0
0
0
58
plantegg
plantegg@plantegg·
看完了张小珺对罗福利和姚舜宇两个人的采访,特别有感触,很有意思。 我感觉罗福利的逻辑完全不在线,看不出来是能够带领大模型往前发展的人才。 但姚舜宇一看就是个非常聪明的人,而且也非常务实。虽然他工作经验才两年,但我觉得他对大模型的理解比罗福利要强很多。 所以说,这是一个很奇怪、有意思的现象。 过几年再回来看看吧
中文
164
27
582
286K
momo
momo@x0Er_go·
最近开始学车了,这周连续四天去练车,其中有三天我选择了骑电驴往返驾校,虽然白天可能有些晒,但两小时通勤在路上,吹着凉风,远离北京高楼大厦,欣赏郊外的群绿和蓝天,感觉是一种难得的奢侈...
中文
0
0
0
146
momo
momo@x0Er_go·
@AltomareDonatha @howie_serious 官方原话:我们支持全球大多数认证的大学和学院。如果您的学校邮箱未被验证,请通过hello@typeless.com与我们联系。
中文
0
0
0
15
momo
momo@x0Er_go·
个人使用心得 - Notion:项目管理 - 看板 - Obsidian:知识管理 - 知识库
中文
0
0
0
25
实践哥MinLi
实践哥MinLi@MinLiBuilds·
有没有人跟我一样? Claude Code 5小时重置一次,并以当天第一次使用开始计算周期。 我会使用crontab每天早上7:01定时用Haiku发一句“早安”。 这样一来,每5小时重置被我锁定在7-12点,12-17,17-22。 上午游刃有余,下午午休后不急不忙,傍晚17点再重置一次
中文
61
77
867
191.7K
momo
momo@x0Er_go·
karpathy每次都能掀起一股热潮
中文
0
0
0
15
momo
momo@x0Er_go·
@fkysly 我网页只敢用 无痕模式
中文
0
0
0
82
马天翼
马天翼@fkysly·
Claude 今天送的 Extra Credits,大家如果容易封号的也小心点。 因为这玩意要打开网页领 目前看到两个兄弟已经刚领完就封了
中文
33
2
45
31.3K
momo
momo@x0Er_go·
挺有意思,苹果上一篇给我印象比较深的还是一篇评测大模型能力,通过替换一些逻辑无关的名词名称,部分模型直接降智,苹果“打假”这块真有点东西
Berryxia.AI@berryxia

兄弟们,原来蒸馏如此的见效快! 难怪大厂都热衷于此哈哈哈😂 Apple Research(苹果研究院)刚刚发布了一篇“超级简单却效果炸裂”的论文,标题直接叫《Embarrassingly Simple Self-Distillation Improves Code Generation》(尴尬的简单自蒸馏就能大幅提升代码生成能力)。 论文核心发现(Simple Self-Distillation,简称SSD): 你不需要: - 更好的教师模型 - 任何verifier(正确性验证器) - RL(强化学习) - 代码执行环境 - 外部标签或奖励模型 方法简单到离谱: 1. 用当前模型自己采样生成代码(带一定temperature和truncation,不用greedy解码) 2. 完全不过滤这些输出的正确性 3. 直接拿这些“原始”输出做标准SFT(监督微调) 就这么三步,模型就能大幅进步! 实测效果(震撼): - Qwen3-30B-Instruct:LiveCodeBench pass@1 从 42.4% → 55.3%(相对提升30%!) - 尤其在hard problems上提升最大:pass@5 从31.1% → 54.1% - 只需每个prompt采样1次就够 - 在Qwen和Llama系列的4B、8B、30B规模上全部有效(包括instruct和thinking变体) 论文最有洞见的解释: 很多coding模型其实已经把“正确能力”藏在权重里了,只是greedy decoding(贪婪解码)把它锁住了。 SSD通过在自己生成的数据上训练,上下文依赖地重塑token分布。 在需要精确的地方压制干扰项,在需要探索的分支处保留多样性,从而把模型的潜在能力真正释放出来。 总结一句话: “很多coding模型其实在用自己的权重‘欠发挥’。 用自己的输出再训一轮,就能把藏着的实力挖出来,而且完全不需要外部信号。”** 地址见评论区👇

中文
0
0
0
33
cvengineer
cvengineer@ttt36538104·
@YangGuangAI 第一件事登录美区app store,下载小火箭,连上vpn,第二件事用safari下载chrome,之后就没safari什么事了。
中文
14
1
40
9K
阳光
阳光@YangGuangAI·
问:拿到新Mac的第一件事先干什么?
阳光 tweet media
中文
220
11
217
83.5K
momo
momo@x0Er_go·
个人还是比较信仰知识管理的,在这个信息量过载的时代,想要成为通才,或者结合 ai + 知识系统 是个捷径
中文
0
0
0
8
momo
momo@x0Er_go·
最近刚好在探索 claude code + obsidian 管理知识系统
Andrej Karpathy@karpathy

LLM Knowledge Bases Something I'm finding very useful recently: using LLMs to build personal knowledge bases for various topics of research interest. In this way, a large fraction of my recent token throughput is going less into manipulating code, and more into manipulating knowledge (stored as markdown and images). The latest LLMs are quite good at it. So: Data ingest: I index source documents (articles, papers, repos, datasets, images, etc.) into a raw/ directory, then I use an LLM to incrementally "compile" a wiki, which is just a collection of .md files in a directory structure. The wiki includes summaries of all the data in raw/, backlinks, and then it categorizes data into concepts, writes articles for them, and links them all. To convert web articles into .md files I like to use the Obsidian Web Clipper extension, and then I also use a hotkey to download all the related images to local so that my LLM can easily reference them. IDE: I use Obsidian as the IDE "frontend" where I can view the raw data, the the compiled wiki, and the derived visualizations. Important to note that the LLM writes and maintains all of the data of the wiki, I rarely touch it directly. I've played with a few Obsidian plugins to render and view data in other ways (e.g. Marp for slides). Q&A: Where things get interesting is that once your wiki is big enough (e.g. mine on some recent research is ~100 articles and ~400K words), you can ask your LLM agent all kinds of complex questions against the wiki, and it will go off, research the answers, etc. I thought I had to reach for fancy RAG, but the LLM has been pretty good about auto-maintaining index files and brief summaries of all the documents and it reads all the important related data fairly easily at this ~small scale. Output: Instead of getting answers in text/terminal, I like to have it render markdown files for me, or slide shows (Marp format), or matplotlib images, all of which I then view again in Obsidian. You can imagine many other visual output formats depending on the query. Often, I end up "filing" the outputs back into the wiki to enhance it for further queries. So my own explorations and queries always "add up" in the knowledge base. Linting: I've run some LLM "health checks" over the wiki to e.g. find inconsistent data, impute missing data (with web searchers), find interesting connections for new article candidates, etc., to incrementally clean up the wiki and enhance its overall data integrity. The LLMs are quite good at suggesting further questions to ask and look into. Extra tools: I find myself developing additional tools to process the data, e.g. I vibe coded a small and naive search engine over the wiki, which I both use directly (in a web ui), but more often I want to hand it off to an LLM via CLI as a tool for larger queries. Further explorations: As the repo grows, the natural desire is to also think about synthetic data generation + finetuning to have your LLM "know" the data in its weights instead of just context windows. TLDR: raw data from a given number of sources is collected, then compiled by an LLM into a .md wiki, then operated on by various CLIs by the LLM to do Q&A and to incrementally enhance the wiki, and all of it viewable in Obsidian. You rarely ever write or edit the wiki manually, it's the domain of the LLM. I think there is room here for an incredible new product instead of a hacky collection of scripts.

中文
1
0
1
17
momo
momo@x0Er_go·
@zhangchitc 小红书每期都看,今天推特上也刷到了!!
中文
1
1
0
2.4K
ZhangChi
ZhangChi@zhangchitc·
我抖音、小红书、视频号发的关于Claude Code的视频下面,回复最多的内容都是询问如何在国内稳定的订阅Pro/Max而不被封。我个人的情况是之前在硅谷工作,有稳定的海外环境来订阅但是无法规模复制给其他人。所以国内的大家如果想订阅的话,我可以推荐几个比较靠谱的讲国内如何订阅Claude Code的博主: 1. 雪踏乌云 @Pluvio9yte : 封了近20个Claude账号后,我的一些经验: x.com/Pluvio9yte/sta… Clash Verge最简单配置IP链式代理教程: x.com/Pluvio9yte/sta… 2026 科学上网——住宅IP 完全指南: x.com/Pluvio9yte/sta… 海外手机卡大汇总:X上博主亲测推荐,低成本保号神器(验证码、账号绑定必备) x.com/Pluvio9yte/sta… Claude官方订阅+最省钱方案教程 x.com/Pluvio9yte/sta… 2. 劳伦斯 @LawrenceW_Zen 原汁原味的 Claude 官方极简订阅指南: x.com/LawrenceW_Zen/… 超简单!德芙般丝滑!一句提示词完成你的专属 VPS + 住宅 IP 配置: x.com/LawrenceW_Zen/…
ZhangChi tweet mediaZhangChi tweet media
中文
27
340
1.5K
179.9K