neeboo

283 posts

neeboo

neeboo

@ghostcorn

Null

Void Katılım Ağustos 2007
0 Takip Edilen2.5K Takipçiler
neeboo
neeboo@ghostcorn·
openai要准备发5.6了,因为5.5开始降智
中文
0
0
0
99
neeboo
neeboo@ghostcorn·
@DashHuang 卧槽和太牛逼了兄弟们是标准的流量勾子
中文
0
0
0
49
neeboo
neeboo@ghostcorn·
很他妈自豪的说我是人类兜底工程师
中文
0
0
2
71
neeboo
neeboo@ghostcorn·
@manateelazycat 老板,我帮你Cue,懒猫算力仓是啥?到哪里可以下单?
中文
1
0
0
46
Andy Stewart
Andy Stewart@manateelazycat·
很多人说 Hermes Agent 是噱头,我来告诉你为什么它比小龙虾更猛!!! 小龙虾最开始很好,但是自从创始人疯狂卡权限,小龙虾的体验就直线下降,而且最近一个月,小龙虾的升级都让万众恐惧了,升级不挂,那是不可能的,泪奔 但是你们知道 Hermes Agent 有多猛吗?我们内部的工程师把懒猫AI算力舱的文档丢给他,什么程序没写,就告诉Hermes Agent要生成美女图,这玩意就自动下载模型,写代码,生成美女图,关键是这个技能一旦它自己掌握以后,你下次问它,它就自动生成Skill,再也不会忘记了 小龙虾的体验是:一配置就挂、一堆Skill用户不会用,全民升级恐惧症,所有时间都浪费在折腾上了,万金Tokens换来时间全部浪费了 Hermes Agent体验是:输入AI Key,开始对话,丢给他任务自动进化,一旦进化好以后,技能就生成了,下次直接干活,关键你不用担心升级会挂,真的太幸福了 好了,给你们丢一张内部的图,想要最新AI Agent的朋友,评论区打1, 包教包会
Andy Stewart tweet media
Andy Stewart@manateelazycat

x.com/i/article/2041…

中文
41
106
681
211.1K
neeboo
neeboo@ghostcorn·
@idoubicc 模式都一样,做自己的就行了
中文
0
0
0
47
neeboo
neeboo@ghostcorn·
ts-> py->rs 相信我,这是终局,至于zig会不会,等它工具链起来再说
中文
0
0
2
134
Zainan Victor Zhou
Zainan Victor Zhou@ZainanZhou·
@fkysly 我原来也这么想,但是好像 Python 也可以了,你知道吗?
中文
1
0
0
211
neeboo
neeboo@ghostcorn·
大胆猜测,一个月后大家又会从md回到db去harness了
中文
0
0
0
108
neeboo
neeboo@ghostcorn·
@blackanger 有什么所谓,permissionless,是个人都可以喷代码
中文
0
0
1
22
AlexZ 🦀
AlexZ 🦀@blackanger·
有人质疑 memplace 是骗子项目。 公平地说,有几个地方确实容易引发怀疑: 1. 创始人身份反差 。 好莱坞演员做 AI 项目,天然引发"是不是营销噱头"的疑虑 2. README 的营销语调 。 "highest-scoring ever"、"beating every product" 这类表述偏激进 3. 100% 的标题效应 。虽然文档内部坦诚,但标题和推文只说 100%,不说 98.4% held-out 4. v3.0.0 但无公开 commit 历史 。项目发布时已经是 v3,看不到迭代过程 但从源码来看,这是一个真实的、有技术含量的项目。 30 个模块,约 5000 行 Python,每个模块职责单一,代码结构清晰。 Benchmark fact-checker agent 验证了 60+ 个源码引用,准确率极高(偏差在 1-2 行内)。 更关键的是:BENCHMARKS.md 的自我批评程度在开源项目中极为罕见: - 第 461 行自称 "This is teaching to the test" - 第 498 行自称 LoCoMo 100% 有 "structural issue" - 第 500 行自称 "The honest LoCoMo score is the top-10 result: 60.3%" - 把 96.6%、98.4%、100% 三个口径并列展示,标题就叫 "The Two Honest Numbers" 骗子不会在自己的文档里写 "this is teaching to the test"。 它的核心贡献,证明 verbatim + structure 可以在零 API 条件下达到 96.6%,是可复现的工程发现。 benchmark 文档的自我批评程度超过了绝大多数商业产品。 值得质疑的是营销口径(标题只说 100% 不说 98.4%),但这是"过度包装"而非"造假"。 代码是真的,benchmark runner 是可复现的,架构设计是有独创性的。
Aimar Haddadi@AdvicebyAimar

i can spot a grifter from miles away. so i digged into the code to figure out if this is legit or not. guess i was right. ben is a crypto founder who runs some weird bitcoin lending platform, i was pretty sure he knows absolutely nothing about ai and memory so i tracked down the repo myself since i was curious. his website says he likes to build ai powered products and train local ai models? sure man, 80% of your github repo's are bitcoin related stuff. only one ai related project came up you forked in 2024. mempalace has 10k github stars, more than 1k forks but only.. 7 commits ? apparently the best memory layer to date? no git author history, no account connected to whoever wrote the code of this codebase. it doesn't add up.. the account who pushed the original repo, named: aya-thekeeper, under aya-thekeeper/mempal got deleted right after the repo got published. you paid a random guy named lu to build this shit out for you. ( "Written by Lu (DTL) — March 24, 2026. For: Ben." ) - benchmark md file. lu wrote the code. lu wrote the benchmarks. lu is nowhere in the readme. or mentioned in the github history? the git history then got squashed to one commit and published under milla jovovich? seriously? a actress? you say she is a great friend of yours, she has been building this project with you. she does this at night. yet she has.. 7 commits and only 2 active days in her entire github history? you paid an actress and a random guy to promote a product you know absolutely nothing about.

中文
5
7
31
19.7K
AlexZ 🦀
AlexZ 🦀@blackanger·
生化危机女主米拉·乔沃维奇花了几个月的时间,与 Claude 一起创造了一款人工智能记忆系统。 跑分满分——击败了该领域所有同类产品,无论是免费的还是付费的。 github.com/milla-jovovich… 没想到我能在 GitHub 关注到这位女神。
AlexZ 🦀 tweet media
Jeremy Nguyen ✍🏼 🚢@JeremyNguyenPhD

Milla Jovovich (actress from The Fifth Element) created a world-beating Claude memory system with @bensig?! - 100% on LongMemEval — first perfect score ever recorded. Free and 100% open source. Github link in the quoted post from Ben. I'm keen to hear how it works for you.

中文
9
26
197
93.2K
neeboo
neeboo@ghostcorn·
Ok, it's rustify now github.com/neeboo/mempala…
Ben Sigman@bensig

Excited to announce a new open-source, free-to-use memory tool I have been developing with my good friend @MillaJovovich. The project is called MemPalace and it is an agentic memory tool that scored 100% on LongMemEval - the industry standard benchmark for memory… this is higher on than any other published results - free or paid - and it is available now on GitHub. You can check out Milla’s video about it on her Instagram. I’ll also put some links in the comments below - please try it out, critique it, fork it, contribute to it - and join our discord.

English
0
0
1
124
neeboo
neeboo@ghostcorn·
@wquguru 一起加入重写大军
日本語
0
0
0
15
WquGuru🦀
WquGuru🦀@wquguru·
OpenCLI作者最近怼天怼地怼空气,刚开始怼某些骗Star的项目还能理解,结果现在连Rust重写项目也开怼了。 人家明明是完整重写,性能大幅领先,还在README最前面醒目致谢原项目并且附上了链接,Apache 2.0协议基本已经遵守,只是初期细节没那么严谨,后来也已经补全。 结果没任何前期沟通,直接拉黑并且DMCA举报,这胸襟未免太狭窄了吧? 流量吃得满满的,人品和格局却拉了胯。 开源项目最怕的从来不是被fork、被重写,而是彻底没人用、没人讨论、没人继续迭代呀。
中文
45
7
295
61.7K
neeboo
neeboo@ghostcorn·
有时候AI太不爱走“捷径”,什么都要从头手撸,其实挺消耗的,应该多花时间research
陈成@chenchengpro

Addy Osmani(Google Chrome 工程负责人)开源了一套 Agent Skills,可能是目前最系统的 AI 编码代理技能库。 核心问题:AI 代理默认走捷径——跳规范、跳测试、跳安全审查。这套技能库把高级工程师的工程纪律编码成 19 个强制工作流,覆盖从创意到上线的完整生命周期: 定义阶段:idea-refine 用结构化的发散-收敛思维把模糊想法转化为具体提案,输出包含问题陈述、推荐方向、关键假设和 MVP 范围的一页纸文档。spec-driven-development 要求编码前先写规范,覆盖目标、命令、项目结构、代码风格、测试策略、边界条件六个区域,规范是活文档,决策变化时同步更新。 规划阶段:核心概念是垂直切片——不是先做完所有数据库再做 API 再做 UI,而是每个任务贯穿完整特性路径,DB+API+UI 一起交付。任务大小有硬指标:XS 1 文件、S 1-2 文件、M 3-5 文件、L 5-8 文件,超过 8 个文件必须拆分,没有例外。 构建阶段:增量实现循环——写代码 → 测试 → 验证 → 提交 → 下一块。每 100 行代码必须跑测试,每次增量后系统必须可构建且测试通过,用功能标志隐藏未完成的特性。上下文工程防止幻觉:定义五层上下文从持久到临时(规则文件 → 规范 → 源码 → 错误输出 → 对话历史),信息冲突时必须停下来,绝不猜测。前端工程明确反对"AI 默认美学"——禁止紫色靛青配色、过度渐变、全圆角这些一眼 AI 味的设计。 验证阶段:TDD 红绿重构循环,测试金字塔 80% 单元 / 15% 集成 / 5% E2E,引用 Google 的 Beyoncé 规则——"如果你喜欢它,就该给它写个测试"。通过 Chrome DevTools MCP 给代理装"眼睛"直接看浏览器,截图复现 → DOM 检查 → 诊断 → 修复 → 截图验证。调试有停止线规则:错误发生立即停止、保留证据、诊断根因、修复、写回归测试、端到端验证,六步必须依序完成。 审查阶段:五轴代码审查(正确性、可读性、架构、安全、性能),变更大小约束 100 行好、300 行可接受、~1000 行必须拆分。安全加固三层边界:总是做(参数化查询、HTTPS、密码哈希)、先问再做(新认证流、CORS、文件上传)、永不做(提交密钥、eval 用户数据、localStorage 存认证)。性能优化测量优先,无数据的优化等于猜测,Core Web Vitals 硬指标 LCP ≤ 2.5s、INP ≤ 200ms、CLS ≤ 0.1。 发布阶段:推荐 Trunk-based 开发,功能标志渐进发布 OFF → 团队启用 → Canary 5% → 25% → 50% → 100%,每个标志有 owner 和过期日期,完整发布后两周内清理。回滚阈值明确量化:错误率超基线 2 倍或 P95 延迟超 50% 立即回滚,不讨论。 最独到的设计:每个技能都有一张「反理性化表」——列出 AI 用来跳过步骤的常见借口("这个改动太小不需要测试"、"时间不够先跳过规范"),然后逐条反驳。这不是写给人看的,是写给 AI 看的,直接对抗大模型在推理中自我说服偷懒的倾向。 思想来源清晰可辨:Google《Software Engineering at Google》(Hyrum 定律、Beyoncé 规则、变更大小规范)、DORA 研究(Trunk-based 开发、Shift Left、小批量快速发布)、作者在 Chrome 团队的生产经验。 本质上,这是一套写给 AI 的工程手册。价值不在于告诉 AI 什么是好代码——大模型已经"知道"了——而在于强制它不走捷径,每个环节都做到位。 github.com/nicepkg/agent-…

中文
0
0
0
185