breezedeus

533 posts

breezedeus banner
breezedeus

breezedeus

@breezedeus

AI连续创业(未成功)者,不过依旧坚信善意的AI能生产幸福。

BJ Katılım Aralık 2010
379 Takip Edilen643 Takipçiler
breezedeus
breezedeus@breezedeus·
其实这事的核心是第一步的记录。把关注的信息以LLM友好形式存储起来,文本/文件,后续怎么使用现在有很多途径。这个思路我们利用飞书免费功能也可以搭建,比如我会给重要群创建一个AI记录员。利用多维表格的工作流,把某个群的所有聊天信息记录到指定多维表格。之后就可以打标,信息抽取、问答、汇总了
Andrej Karpathy@karpathy

Wow, this tweet went very viral! I wanted share a possibly slightly improved version of the tweet in an "idea file". The idea of the idea file is that in this era of LLM agents, there is less of a point/need of sharing the specific code/app, you just share the idea, then the other person's agent customizes & builds it for your specific needs. So here's the idea in a gist format: gist.github.com/karpathy/442a6… You can give this to your agent and it can build you your own LLM wiki and guide you on how to use it etc. It's intentionally kept a little bit abstract/vague because there are so many directions to take this in. And ofc, people can adjust the idea or contribute their own in the Discussion which is cool.

中文
1
0
0
363
breezedeus
breezedeus@breezedeus·
比别人少焦虑一点,也许就能成为最后的赢家
breezedeus tweet media
中文
0
0
0
36
breezedeus
breezedeus@breezedeus·
@noobnooc hallo,准备base哪呢?北京的话可以聊聊,我们正在招agent相关的全栈工程师~
中文
0
0
1
287
Nooc
Nooc@noobnooc·
独立开发吃不上饭了,出来找找工作机会: 18 年毕业在成都一家初创公司待了四年,主要做 web 前后端端开发(React/Node/Mongo栈),中间也涉及过一些 Electron/iOS/Android 开发。 后面公司经营不下去,所有人都回家各找各妈了,于是想着试试能不能自己干。 自己试着做了一些产品,然后发现其实自己干的难点在营销而不是开发。但人就是这样,不撞南墙不回头,尽管这样还是想自己一个人创造一些东西。于是就一直干到了现在。 这中间一直是勒紧裤腰带在生活,只要吃的少,就不怕吃不饱。 虽然金钱上的收入比较少,但因为时间地点比较自由,所以跑了很多地方,接触了很多不同的人,也看了一些书。 这些对我自己的成长还是蛮大的,比如让我认清了自己究竟想要什么:就是想要钱。所以我就又出来找工作了。 因为我最擅长的事是写代码,所以还是偏向于找写程序相关的工作,如果是和 AI 相关的那就更好了。而且写程序我还能带着我的助手们(Claude/Codex)一起工作。 如果有其它有趣的工作,比如演短视频、教 AI 编程、活动策划啥的,如果合适,我也可以试试,但因为有些领域不是很熟悉,可能只能边学边做。 总之,我的兴趣点在代码、影视、音乐、阅读、画画,在我兴趣点内的工作,也许我都可以尝试尝试。 因为我喜欢晒太阳和呼吸清新的空气,所以地点偏向于深圳。如果工作吸引力大,在成都、杭州、上海等其它地方也是可以的。 感谢你看完这么啰嗦的一大段话,如果你有兴趣让我和你一起工作,想知道我做过的事和是什么样的人的话,可以查看我的线上简历: nooc.me/zh/resume
中文
76
39
319
185.2K
breezedeus
breezedeus@breezedeus·
灵魂要被证伪了😅
比特币橙子Trader@oragnes

🧠💥今天英语科技圈彻底炸锅。 @eonsys 公布了一个极具历史节点意义的 demo: 他们用 12.5 万个真实神经元连线(Connectome),在虚拟世界里“复活”了一只果蝇。 一条截然不同的智能路线正在成型。 视频不是动画模拟👇 1️⃣ 到底发生了什么? 研究人员把真实果蝇的大脑完整连接图,接入了基于 MuJoCo 物理引擎的虚拟躯体。 结果,这只“数字果蝇”开始自主走路、整理身体(grooming)、甚至进食。 形成了一个真正的闭环:感觉输入 -> 神经元网络放电 -> 动作输出。 2️⃣ 为什么这比大模型更让人震撼? 过去几年,主流 AI 的核心路径是“拟合行为输出”(学它看起来像什么 / what it does),本质上是在拿海量数据训练一个像果蝇的策略网络。 但这次的逻辑变了。 研究者是从生物本体出发(重建它本身是什么 / what it is)。 没有任何行为数据的强化学习训练。 当真实的生物脑结构在代码中被精确跑起来之后,那些复杂的生物行为,就直接从神经连线里自然涌现出来了。 3️⃣ 它的终极意义 脑仿真真正跨过门槛的一刻,“技术奇点”不再是深度学习的专属。 它向我们证明了一件极其重要的事情: 一旦神经结构足够完整,行为本身就是可计算、可复现、可嵌入身体的。

中文
0
0
0
62
breezedeus
breezedeus@breezedeus·
构建 Claude Code 的经验:像 Agent 一样思考一句话总结 Anthropic 团队分享了构建 Claude Code 过程中关于 Agent 工具设计的核心经验:工具设计应该匹配模型能力,而非盲目追求数量或复杂度。 核心洞见 ✔ 工具设计的本质:构建 Agent 最难的部分是设计其行动空间(action space)。工具不是越多越好
breezedeus tweet media
Thariq@trq212

x.com/i/article/2027…

中文
0
1
2
239
breezedeus
breezedeus@breezedeus·
P2T 网页版新版上线 p2t.breezedeus.com ,界面完全重新设计。 支持在线编辑识别内容,所见即所得。支持把结果导出为 .doc/.md/.pdf 文件。支持使用API Key调用服务接口
breezedeus tweet mediabreezedeus tweet media
中文
0
0
0
114
breezedeus
breezedeus@breezedeus·
@frxiaobei 绝无此意哈,我猜咱们都是不喜欢被裹挟的人😅
中文
0
0
1
25
凡人小北
凡人小北@frxiaobei·
DeepSeek 去年春节开了个坏头,结果今年一看,国内大模型全体开始卷春节。 上一次这么打仗的是阿里和京东的 11.11、6.18,这味道太熟了。 节日流量 + 红包补贴 + 心智抢占,互联网老三件套。
中文
15
3
144
33.9K
breezedeus
breezedeus@breezedeus·
我现在每天跟 Openclaw 说的话,估计比跟人说的加起来都多。Openclaw可能会进一步提高单身率,降低出生率。
breezedeus tweet media
中文
0
0
0
110
breezedeus
breezedeus@breezedeus·
👍
Chao Huang@huang_chao4969

AI phones - large models or small models? We recently open-sourced OpenPhone📱— a 3B parameter mobile agent foundation model! After a year of trial and error, here's what we learned about AI phones ✨ Open-Sourced AI Phone Agents: github.com/HKUDS/OpenPhone 🤔 How do AI phones actually work? Simple: AI helps you operate your phone. But how does AI communicate with different apps? Option 1: API Calls 🔌 Ideally, we'd just call app APIs directly. Reality check — there are basically none! Big tech won't open their APIs because apps ARE their traffic moat. Building individual MCPs for each app? Engineering nightmare 💥 Option 2: GUI Interaction 🖱️ Since no APIs, let's do what humans do — look at screens and tap stuff. This approach is super generalizable, should work with any app. That's why most AI phones go the GUI Agent route now. GUI Agents are basically multi-modal models: - Input: screenshot + task description - Output: coordinates for next tap - Capability: screen understanding + task reasoning 📱 Three technical approaches for Phone Agents - Pure cloud ☁️ What most AI phones do currently — heavily rely on cloud-based large models. Performance is definitely better than small models, but privacy🔒 and cost💰 concerns are real. - Pure on-device models 📱 This is the direction OpenPhone is exploring. 3B parameters strikes a good balance — runs on phones, fast, private, and cost-effective. The trade-off is limited performance on complex tasks, given it's only 3B parameters. - Hybrid edge-cloud 🤝 Probably the most practical route. Simple stuff and anything privacy-sensitive stays on-device, complex reasoning hits the cloud. The trick is the routing strategy — when to make the switch? Interesting part is teaching the on-device model to recognize its own capability boundaries. 🔮 Some Random thoughts 1. GUI Agents still have plenty of issues: slow, error-prone, multi-app accuracy sucks. Rich MCP ecosystem would make life easier, but don't hold your breath. 2. Right now everyone's just collecting data, then SFT+RL to optimize models. Basically throwing data at the problem — hopefully we get smarter ways to do this. 3. AI phone ceiling isn't just tech — it's ecosystem. Future apps might go dual mode: APIs for agents, GUI for humans🚀 4. Computer-Use Agents are shifting toward coding — writing code instead of just clicking around💻, because code execution is way more accurate and efficient. Works great on desktop, mobile's still challenging. 5. Future Digital Agents might need to pack everything into one model: coding + multimodal + tool-use.

ART
0
0
0
96
breezedeus
breezedeus@breezedeus·
这个项目有意思😄
Penny777 🦊@penny777

强烈推荐 Lenny @lennysan 的这个硅谷产品圈 Podcast 的原始音频文稿资料!!!含金量非常高,一共 320 份 .txt 的字幕原稿。 里面收录了非常多 AI 领域的名人访谈。例如: ✨ 李飞飞 Dr. Fei-Fei Li - AI 教母下个赌注:空间智能 ✨ Alexander Embiricos - OpenAI 内部视角 ✨ Anton Osika - 欧洲增长最快的 AI 公司,实战策略 (这几期链接我放在下方 threads 里面了) 我拿自己本地的 AI 学习工具,分析了原稿内容,生成了详细的调研报告(包含判断信息真伪、补充相关资料等)。文件资料包里包含了: 1. 嘉宾内容分析报告(.md .pdf) 2. 采访稿中英文双语原稿(.md .pdf) Markdown 的版本可以配合 AI 使用,PDF 则比较方便阅读。GitHub 两个格式都有 😎(贴心如我) GitHub 链接:github.com/Penny777btc/le…

中文
0
0
1
144
breezedeus
breezedeus@breezedeus·
千问这购物是实习生做的吗,怎么感觉连基本的多轮理解能力都没有
breezedeus tweet mediabreezedeus tweet media
中文
1
0
0
135
breezedeus
breezedeus@breezedeus·
我希望通过这个skill尽量处理掉这些问题。目前已经支持一般的网页,Github,x.com,微信公众号文章等,欢迎大家使用下提意见~
中文
0
0
1
67
breezedeus
breezedeus@breezedeus·
花了6kw tokens ,做了一个基础的 doc-ai skill marketplace 。 github.com/breezedeus/doc… url to markdown 有很多工具,不过这些工具都有局限性,部分网页内容没法获取。比如国外的一般不支持微信公众号文章,国内的不支持 xdotcom 或其它墙外网页。
breezedeus tweet media
中文
1
0
2
155