breezedeus

533 posts

breezedeus

@breezedeus

AI连续创业（未成功）者，不过依旧坚信善意的AI能生产幸福。

BJ Katılım Aralık 2010

379 Takip Edilen643 Takipçiler

breezedeus@breezedeus·7 Nis

具体做法见这个视频：b23.tv/pUWpTVa

中文

breezedeus@breezedeus·7 Nis

其实这事的核心是第一步的记录。把关注的信息以LLM友好形式存储起来，文本/文件，后续怎么使用现在有很多途径。这个思路我们利用飞书免费功能也可以搭建，比如我会给重要群创建一个AI记录员。利用多维表格的工作流，把某个群的所有聊天信息记录到指定多维表格。之后就可以打标，信息抽取、问答、汇总了

Andrej Karpathy@karpathy

Wow, this tweet went very viral! I wanted share a possibly slightly improved version of the tweet in an "idea file". The idea of the idea file is that in this era of LLM agents, there is less of a point/need of sharing the specific code/app, you just share the idea, then the other person's agent customizes & builds it for your specific needs. So here's the idea in a gist format: gist.github.com/karpathy/442a6… You can give this to your agent and it can build you your own LLM wiki and guide you on how to use it etc. It's intentionally kept a little bit abstract/vague because there are so many directions to take this in. And ofc, people can adjust the idea or contribute their own in the Discussion which is cool.

中文

363

breezedeus@breezedeus·3 Nis

比别人少焦虑一点，也许就能成为最后的赢家

中文

breezedeus@breezedeus·19 Mar

又是一篇好文，上一篇也很棒👍

Tw93@HiTw93

x.com/i/article/2034…

日本語

182

breezedeus@breezedeus·12 Mar

@noobnooc hallo，准备base哪呢？北京的话可以聊聊，我们正在招agent相关的全栈工程师～

中文

287

Nooc@noobnooc·12 Mar

独立开发吃不上饭了，出来找找工作机会： 18 年毕业在成都一家初创公司待了四年，主要做 web 前后端端开发（React/Node/Mongo栈），中间也涉及过一些 Electron/iOS/Android 开发。后面公司经营不下去，所有人都回家各找各妈了，于是想着试试能不能自己干。自己试着做了一些产品，然后发现其实自己干的难点在营销而不是开发。但人就是这样，不撞南墙不回头，尽管这样还是想自己一个人创造一些东西。于是就一直干到了现在。这中间一直是勒紧裤腰带在生活，只要吃的少，就不怕吃不饱。虽然金钱上的收入比较少，但因为时间地点比较自由，所以跑了很多地方，接触了很多不同的人，也看了一些书。这些对我自己的成长还是蛮大的，比如让我认清了自己究竟想要什么：就是想要钱。所以我就又出来找工作了。因为我最擅长的事是写代码，所以还是偏向于找写程序相关的工作，如果是和 AI 相关的那就更好了。而且写程序我还能带着我的助手们（Claude/Codex）一起工作。如果有其它有趣的工作，比如演短视频、教 AI 编程、活动策划啥的，如果合适，我也可以试试，但因为有些领域不是很熟悉，可能只能边学边做。总之，我的兴趣点在代码、影视、音乐、阅读、画画，在我兴趣点内的工作，也许我都可以尝试尝试。因为我喜欢晒太阳和呼吸清新的空气，所以地点偏向于深圳。如果工作吸引力大，在成都、杭州、上海等其它地方也是可以的。感谢你看完这么啰嗦的一大段话，如果你有兴趣让我和你一起工作，想知道我做过的事和是什么样的人的话，可以查看我的线上简历： nooc.me/zh/resume

中文

319

185.2K

breezedeus@breezedeus·9 Mar

灵魂要被证伪了😅

比特币橙子Trader@oragnes

🧠💥今天英语科技圈彻底炸锅。 @eonsys 公布了一个极具历史节点意义的 demo：他们用 12.5 万个真实神经元连线（Connectome），在虚拟世界里“复活”了一只果蝇。一条截然不同的智能路线正在成型。视频不是动画模拟👇 1️⃣ 到底发生了什么？研究人员把真实果蝇的大脑完整连接图，接入了基于 MuJoCo 物理引擎的虚拟躯体。结果，这只“数字果蝇”开始自主走路、整理身体（grooming）、甚至进食。形成了一个真正的闭环：感觉输入 -> 神经元网络放电 -> 动作输出。 2️⃣ 为什么这比大模型更让人震撼？过去几年，主流 AI 的核心路径是“拟合行为输出”（学它看起来像什么 / what it does），本质上是在拿海量数据训练一个像果蝇的策略网络。但这次的逻辑变了。研究者是从生物本体出发（重建它本身是什么 / what it is）。没有任何行为数据的强化学习训练。当真实的生物脑结构在代码中被精确跑起来之后，那些复杂的生物行为，就直接从神经连线里自然涌现出来了。 3️⃣ 它的终极意义脑仿真真正跨过门槛的一刻，“技术奇点”不再是深度学习的专属。它向我们证明了一件极其重要的事情：一旦神经结构足够完整，行为本身就是可计算、可复现、可嵌入身体的。

中文

breezedeus@breezedeus·1 Mar

我准备陆续把我常用的工具都搬到 p2t.breezedeus.com/tools 这里面 😁

中文

breezedeus@breezedeus·28 Şub

构建 Claude Code 的经验：像 Agent 一样思考一句话总结 Anthropic 团队分享了构建 Claude Code 过程中关于 Agent 工具设计的核心经验：工具设计应该匹配模型能力，而非盲目追求数量或复杂度。核心洞见 ✔ 工具设计的本质：构建 Agent 最难的部分是设计其行动空间（action space）。工具不是越多越好

Thariq@trq212

x.com/i/article/2027…

中文

239

breezedeus@breezedeus·28 Şub

AI should serve the people, not enslave them! github.com/breezedeus/CnO…

宝玉@dotey

Anthropic 和五角大楼这周彻底闹翻了。五角大楼要求 Claude 向军方开放所有合法用途，不设任何限制。 Anthropic 拒绝了，坚持 AI 不能用于大规模监控美国公民，也不能用于全自主致命武器。五角大楼给了最后通牒，限今天下午 5:01 前答复，否则取消 2 亿美元合同，还威胁动用《国防生产法》，把 Anthropic 列为供应链风险。 Dario Amodei 公开回应：我们在良心上无法答应他们的要求。 Trump 随后在 Truth Social 发帖，命令所有联邦机构立即停用 Anthropic 技术。 Sam Altman 今天也表态了。他给 OpenAI 全员发了内部备忘录：不管事情怎么走到这一步，这已经不只是 Anthropic 和五角大楼之间的问题了，这是整个行业的问题。我们一直认为 AI 不应被用于大规模监控或自主致命武器。这些是我们的主要红线。 OpenAI 和 Google 的员工也联合签署了声援 Anthropic 的公开信。 Ilya Sutskever 对此发了一条推文，大意如下： Anthropic 没有退让，这非常好。OpenAI 采取了类似立场，这很有分量。未来还会有更多这种性质的挑战，而且会更严峻。到那时候，相关领导者必须挺身而出，激烈的竞争对手必须放下分歧。很高兴看到今天这一幕。

English

155

breezedeus@breezedeus·21 Şub

P2T 网页版新版上线 p2t.breezedeus.com ，界面完全重新设计。支持在线编辑识别内容，所见即所得。支持把结果导出为 .doc/.md/.pdf 文件。支持使用API Key调用服务接口

中文

114

breezedeus@breezedeus·9 Şub

@frxiaobei 绝无此意哈，我猜咱们都是不喜欢被裹挟的人😅

中文

凡人小北@frxiaobei·9 Şub

@breezedeus 可能我抄的你的🤭

日本語

551

凡人小北@frxiaobei·9 Şub

DeepSeek 去年春节开了个坏头，结果今年一看，国内大模型全体开始卷春节。上一次这么打仗的是阿里和京东的 11.11、6.18，这味道太熟了。节日流量 + 红包补贴 + 心智抢占，互联网老三件套。

中文

144

33.9K

breezedeus@breezedeus·3 Şub

我现在每天跟 Openclaw 说的话，估计比跟人说的加起来都多。Openclaw可能会进一步提高单身率，降低出生率。

中文

110

breezedeus@breezedeus·29 Oca

直接识别印章和变形内容👍 。不知道幻觉严不严重😅

Adina Yakup@AdinaYakup

Baidu just released a new VLM : PaddleOCR-VL-1.5🔥 @PaddlePaddle huggingface.co/PaddlePaddle/P… ✨ 0.9B - Apache 2.0 ✨ 94.5% OmniDocBench v1.5 ✨ Multilingual OCR: strong on rare characters & ancient texts

中文

106

breezedeus@breezedeus·18 Oca

👍

Chao Huang@huang_chao4969

AI phones - large models or small models? We recently open-sourced OpenPhone📱— a 3B parameter mobile agent foundation model! After a year of trial and error, here's what we learned about AI phones ✨ Open-Sourced AI Phone Agents: github.com/HKUDS/OpenPhone 🤔 How do AI phones actually work? Simple: AI helps you operate your phone. But how does AI communicate with different apps? Option 1: API Calls 🔌 Ideally, we'd just call app APIs directly. Reality check — there are basically none! Big tech won't open their APIs because apps ARE their traffic moat. Building individual MCPs for each app? Engineering nightmare 💥 Option 2: GUI Interaction 🖱️ Since no APIs, let's do what humans do — look at screens and tap stuff. This approach is super generalizable, should work with any app. That's why most AI phones go the GUI Agent route now. GUI Agents are basically multi-modal models: - Input: screenshot + task description - Output: coordinates for next tap - Capability: screen understanding + task reasoning 📱 Three technical approaches for Phone Agents - Pure cloud ☁️ What most AI phones do currently — heavily rely on cloud-based large models. Performance is definitely better than small models, but privacy🔒 and cost💰 concerns are real. - Pure on-device models 📱 This is the direction OpenPhone is exploring. 3B parameters strikes a good balance — runs on phones, fast, private, and cost-effective. The trade-off is limited performance on complex tasks, given it's only 3B parameters. - Hybrid edge-cloud 🤝 Probably the most practical route. Simple stuff and anything privacy-sensitive stays on-device, complex reasoning hits the cloud. The trick is the routing strategy — when to make the switch? Interesting part is teaching the on-device model to recognize its own capability boundaries. 🔮 Some Random thoughts 1. GUI Agents still have plenty of issues: slow, error-prone, multi-app accuracy sucks. Rich MCP ecosystem would make life easier, but don't hold your breath. 2. Right now everyone's just collecting data, then SFT+RL to optimize models. Basically throwing data at the problem — hopefully we get smarter ways to do this. 3. AI phone ceiling isn't just tech — it's ecosystem. Future apps might go dual mode: APIs for agents, GUI for humans🚀 4. Computer-Use Agents are shifting toward coding — writing code instead of just clicking around💻, because code execution is way more accurate and efficient. Works great on desktop, mobile's still challenging. 5. Future Digital Agents might need to pack everything into one model: coding + multimodal + tool-use.

ART

breezedeus@breezedeus·16 Oca

这个项目有意思😄

Penny777 🦊@penny777

强烈推荐 Lenny @lennysan 的这个硅谷产品圈 Podcast 的原始音频文稿资料！！！含金量非常高，一共 320 份 .txt 的字幕原稿。里面收录了非常多 AI 领域的名人访谈。例如： ✨ 李飞飞 Dr. Fei-Fei Li - AI 教母下个赌注：空间智能 ✨ Alexander Embiricos - OpenAI 内部视角 ✨ Anton Osika - 欧洲增长最快的 AI 公司，实战策略（这几期链接我放在下方 threads 里面了）我拿自己本地的 AI 学习工具，分析了原稿内容，生成了详细的调研报告（包含判断信息真伪、补充相关资料等）。文件资料包里包含了： 1. 嘉宾内容分析报告（.md .pdf） 2. 采访稿中英文双语原稿（.md .pdf） Markdown 的版本可以配合 AI 使用，PDF 则比较方便阅读。GitHub 两个格式都有 😎（贴心如我） GitHub 链接：github.com/Penny777btc/le…

中文

144

breezedeus@breezedeus·16 Oca

千问这购物是实习生做的吗，怎么感觉连基本的多轮理解能力都没有

中文

135

breezedeus@breezedeus·14 Oca

美团也入局GUI Agent了

Adina Yakup@AdinaYakup

EvoCUA 🔥 multimodal agent that can actually operate a computer, released by @Meituan_LongCat huggingface.co/collections/me… ✨ 8B & 32B - Apache2.0 ✨ Multi-turn control of Chrome, Excel, PowerPoint, VSCode ✨ 32B reaches 56.7% on OSWorld

中文

breezedeus@breezedeus·11 Oca

我希望通过这个skill尽量处理掉这些问题。目前已经支持一般的网页，Github，x.com，微信公众号文章等，欢迎大家使用下提意见～

中文

breezedeus@breezedeus·11 Oca

花了6kw tokens ，做了一个基础的 doc-ai skill marketplace 。 github.com/breezedeus/doc… url to markdown 有很多工具，不过这些工具都有局限性，部分网页内容没法获取。比如国外的一般不支持微信公众号文章，国内的不支持 xdotcom 或其它墙外网页。

中文

155

Keşfet

@noobnooc @frxiaobei @elonmusk @BarackObama @taylorswift13 @cristiano @BillGates @NASA