ghostInTrantor

666 posts

ghostInTrantor

ghostInTrantor

@ghostINTrantor

not a engineer nor researcher

Katılım Haziran 2011
765 Takip Edilen88 Takipçiler
ghostInTrantor
ghostInTrantor@ghostINTrantor·
用grok的感受是elon musk又赌对了一次 我虽然也很怀念twitter以前自由开放数据友好的时候 musk买twitter的时候我也觉得商业上来说不是一个好投资 但是AI来了之后数据太重要了 grok这么平庸的一个模型因为数据好就有不可替代性了
中文
0
0
0
34
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@maryarchived If this isn't possible, then human civilisation won't be established at the beginning
English
0
0
0
5
mary morgan
mary morgan@maryarchived·
lots of strange reactions to this game. let’s clear some things up: childless men do not have paternal instincts the way that childless women have maternal instincts (we observe this even in the way little girls play vs. little boys). men first experience paternal instincts once they have their own children - and typically, those paternal instincts are only ever felt for their own children, and no one else’s. men are not nurturers. men don’t gush over cute kids in public. men don’t have baby fever. if a man wants to possess a child for any reason other than it being a product of his own lineage, he is likely a predator. and you’d be taking the feminist/radical gender abolitionist position to protest any of the above points. this should explain why a “dad simulator” game marketed to mostly childless men gives people the creeps.
PRAGMATA@PRAGMATAgame

Your name is...Diana #PRAGMATAMoonBytes - Part 15

English
10.1K
176
2.8K
3.5M
ghostInTrantor
ghostInTrantor@ghostINTrantor·
podwise.ai/dashboard/epis… 标志着一种 AI native application 的产品的形态的定义现在出现了。但我觉得 CC 它是一个及格线,做得比CC差的,那就是属于上一个时代,未来只会比它更好 确实加上chat bot和soul的龙虾就比CC好了一个形态所以能火
中文
0
0
0
36
ghostInTrantor
ghostInTrantor@ghostINTrantor·
之前还嫌弃办公室的曲面屏不够elegant 现在多agent时代多一点长度就能多放一个teminal
中文
0
1
0
20
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@9hills 我一直很好奇这个remote control是吃饭睡觉都想盯着AI干活吗 让他跑着不就完了吗
中文
3
0
3
2.8K
九原客
九原客@9hills·
推荐新的 Agent iOS 远程控制的app - Paseo。 亮点: 1. 有 Desktop、Mobile、Web、CLI 多端 2. 可以通过 Relay 注册多台设备 3. 全部组件开源,允许在 Cloudflare 上自建 Relay Server 4. 允许远程控制 Terminal 替代了一直在用的 Happy Coder。
九原客 tweet media
中文
16
45
386
41.8K
Go学长
Go学长@arkuy99·
我已经很多年没听到过北极星这个名词了。。。 codex 是怎么做到的。。。
Go学长 tweet media
中文
24
2
87
35.8K
Frad
Frad@FradSer·
求推荐一个可以背十年并且能放 16寸 MacBook 的通勤包🙏
中文
60
4
99
72.1K
宝玉
宝玉@dotey·
Anthropic 今天发布了 Claude Managed Agents,一套托管式 Agent 构建和部署 API,现已开放公测。 核心卖点一句话说清楚:以前做一个生产级 Agent,光基础设施(沙箱、状态管理、权限、链路追踪)就要搭几个月,现在这些全交给 Anthropic 的云端搞定,开发者只管定义任务、工具和规则。官方说法是"从原型到上线,几天而不是几个月"。 具体提供三样东西:生产级沙箱执行环境,支持长时间运行的 Agent 会话(断线也不丢进度),以及多 Agent 协调能力(一个 Agent 可以拉起其他 Agent 并行干活,这部分还在研究预览阶段)。内部测试中,在结构化文件生成任务上,Managed Agents 的成功率比标准提示循环高了最多 10 个百分点。 已经有一批公司在用了。 Notion 让用户直接在工作区里把任务丢给 Claude,写代码、做 PPT、做网页都行,几十个任务可以并行跑。 Sentry 把自家的 bug 诊断工具 Seer 跟 Claude Agent 串起来,从定位根因到写补丁、提 PR 一条龙,整个集成几周就上线了。 Rakuten 在产品、销售、营销、财务、HR 各条线部署了专用 Agent,每个 Agent 一周内就能上线。 Asana 用它加速了 AI Teammates 功能的开发。Vibecode 则把它作为默认集成,让用户从 prompt 直接到部署完成的应用。 定价方面,token 费用按 Claude 平台标准收,另外每个活跃会话按每小时 0.08 美元计费。 对开发者来说,这是 Anthropic 正式入局"Agent 即服务"赛道。之前不管用 Claude 还是 GPT 做 Agent,基础设施都得自己搭或者找第三方。现在 Anthropic 自己把这层包了,逻辑很清楚:降低开发门槛、锁定开发者在 Claude 生态里。跟 OpenAI 最近推 Codex 的思路类似,都在从"卖模型"往"卖完整开发平台"走。
Claude@claudeai

Introducing Claude Managed Agents: everything you need to build and deploy agents at scale. It pairs an agent harness tuned for performance with production infrastructure, so you can go from prototype to launch in days. Now in public beta on the Claude Platform.

中文
40
78
547
165.5K
Leo Xiang
Leo Xiang@leeoxiang·
大家有在生产环境中使用 pi-mono 来替换 claude agent sdk 的么? claude agent sdk 做大规模部署挑战蛮多: 1、可观测; 2、大规模部署(每个进程部署一个沙箱,本地开发和云端部署环境不完全一致); 3、以及冷启动问题。 在考虑对线上的项目做这个替换。
中文
25
1
64
23.2K
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@BroLeon 医生当然不担心 这个行业从中世纪开始就在加高门槛保证阶级地位 哪是码农能比的
中文
0
0
1
99
土澳大狮兄BroLeon | 🔶BNB |
没想到这个随手写的帖子火了,我再根据大家的评论加一些当时跟医生聊的问题。 1、我问了他平时自己是否会使用AI辅助诊断,比如有些病症拿不准的时候会不会去问问Chatgpt😅😅 (问的时候做好被翻白眼的准备了) 他说不会,这是对自己职业素养和病人负责的选择,毕竟几十年来医疗这块大家对疑难病也都有一套成熟完整的诊疗体系了,实在拿不准就会转诊到专科去,如果因为相信了AI出了事且被证实那完蛋了。 2、问他自己是否生活中会用AI,怎么看AI开始取代大家的工作,有没有危机感? 他说自己偶尔会用Gemini,因为跟Google全家桶集成的不错,有时候收到长篇大论的邮件可以直接点总结,另外生活中一些琐事询问起来也挺方便。 他也会偶尔测试一下AI在自己专业领域的准确度,能感觉到AI在判断日常问诊类问题上的精确度在快速提升,是会有点紧迫感的。 我这次去找他讲了一下自己的问题,结果他给的意见与Claunde/ChatGPT 给的几乎完全一致(90%)。 3、问他担不担心以后自己的工作被AI取代? 他说也不太担心,因为很多时候遇到的情况还是需要医生上手诊断,或者通过与患者深入交流才能做出判断的,并不是单纯的知识积累。 而且医学是一个相对保守的行业,毕竟关系到人命,所以他不觉得AI能在短期内获得取代真人的权利,万一出现一个“幻觉”开错药了怎么办?AI公司要不要吃大官司? 而且医生很多时候还肩负着把关的角色,每一个处方都是要负责任的,他们会判断病人是不是真的需要这个药,还是有别的目的,这一点AI不好处理。 时间有限,我也没好意思问太多,总之他的态度就是在医疗领域可以接受AI协助降低工作负担,但位置一定是“工具”而已,他不担心被取代。 写完出门啦,以后在澳洲再看到啥好玩的AI应用再来说说。
土澳大狮兄BroLeon | 🔶BNB |@BroLeon

今天去诊所见我的GP(全科医生),突然发现他桌上有个巨大的专业麦克风,一时好奇问他难不成还在诊所搞直播?😅 他一头黑线的告诉我这是最近添置的AI工具,帮他节省了大量的工作时间。 我还真的很惊讶怎么落后的土澳已经AI直接进一线诊所了??立马追着问了半天。原来这东西的作用是AI自动记录患者的病历,而且能自动以当前主流的病历档案格式整理好。 了解医疗行业的小伙伴应该知道,医生的大部分工作量并不是给患者看病,而是写病历。不夸张的说,大概有60-70%的时间是花在这个上面,尤其是病情比较复杂的时候。 现在GP说他基本把Mac一开,患者走的时候病历就自动写好了,他只需要扫一眼稍微纠正一下就完事,效率大大的提高了。 我震惊的问难道现在澳洲诊所都普及这个了吗?他哼了一声说这都是私家诊所自己买的,公立医院可没有这待遇,但他觉得钱花的值。 一直以来我都觉得AI创业赚钱就应该是深入行业应用里去做定制化产品,上个月还在跟朋友聊Golf领域的应用,结果今天直接看到人都已经做好卖出去了,还是医疗这种有壁垒的行业,还反馈不错。。。。 突然觉得屁股有点烧,不能再划水等行情了,得动起来,不然就晚了😳😳😳

中文
7
1
18
8.6K
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@Jiaxi_Cui 这个非常反直觉 我自己的项目也是这么设计的发现还没有直接llm好
中文
0
0
1
256
Panda
Panda@Jiaxi_Cui·
NLP 的小分类模型已经可以退出历史舞台了 本来以为 Auto Mode 会用一个训练后的小参数模型嵌入客户端本地做分类的,原来都直接用的 Sonnet LLM Zero-shot + prompt + temperature 0 的分类效果已经非常牛逼了,但不知为何不用 Haiku
陈成@chenchengpro

逆向了 Claude Code 2.1.81 的源码,看看按下 Auto Mode 之后到底发生了什么。 核心发现:每个工具调用都要过一条四层决策流水线 —— 第一层:查已有权限规则,命中直接放行 第二层:模拟 acceptEdits 模式,低风险操作跳过分类器 第三层:只读工具白名单(Read/Grep/Glob 等)无条件放行 第四层:以上都不满足,才发一个独立 API 请求给 Sonnet 做安全分类 分类器的设计很有意思:temperature 为 0,强制调用唯一工具 classify_result,输出结构化的 { shouldBlock, reason }。system prompt 里定义了 25+ 种 BLOCK 规则(force push、数据泄露、凭证扫描、生产部署、创建无审批的 agent 循环……)和 7 种 ALLOW 例外。 还有个两阶段分类器:Stage 1 只用 256 tokens 快速判断,明显安全的直接放行;拿不准的才进 Stage 2 做 4096 tokens 深度分析。用延迟换安全。 熔断机制也值得一提:连续被拒 3 次或总计 20 次 → CLI 降级为手动确认,headless 模式直接 throw 终止 agent。分类器不可用时有 fail-closed / fail-open 两种策略,由 feature flag 控制。 本质上是用一个 AI 监督另一个 AI 的每一步操作。完整分析 ↓ blog.sorrycc.com/claude-code-au…

中文
13
6
96
23.3K
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@CMGS1988 不是因为scaling low到头了才开始搞这些的吗
中文
0
0
0
63
CMGS
CMGS@CMGS1988·
虽然但是,这头条 L4 有个暴论还是说对了,现在搞什么工程控制论马套编程本质上还是模型不够强大……有这点写 markdown 的时间活早干完了……
中文
7
0
17
6.4K
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@LuvLetter_moe 我有很多种dream setup的设想 每一种都有SD 完全不是垃圾曲面屏能比的
中文
0
0
0
122
Luv Letter
Luv Letter@LuvLetter_moe·
还有啊, 一堆人嘲讽 Studio Display 给性能更强的 CPU, 但没想过 3nm SoC 的好处之一其实是低功耗, 相比于类似DJI/insta 360用的安霸/高通方案, 苹果用自己的更便宜、效果更好, 要知道待机 5w 的功耗差距, 一年就是 44 度电, 5年就有 220, 也能占到价格的 1% 了. 更不用说这用的还是硅渣, 以及散热片都可以省点. 以及 Studio Display/XDR真正用过才知道的优点: 基本可以秒点亮, 入门的什么 4K 显示器基本都要数几下才亮, 做的差的十几秒都有.
中文
7
2
76
39.8K
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@dotey 再问就用违规上外网名义把人抓进去了物理消音了
中文
0
0
0
1.4K
ghostInTrantor
ghostInTrantor@ghostINTrantor·
#paradiseonhulu 不是我第一季是看鳏夫大战深层政府的探案剧 怎么突然变成末日生存秀和时间旅行科幻了
ghostInTrantor tweet media
中文
0
0
0
106
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@Jiaxi_Cui 这就是为什么以前都要抢的实习生名额被当成负资产踢来踢去 最后每人塞了一个toy project
中文
1
0
3
871
Panda
Panda@Jiaxi_Cui·
如果说在传统的深度学习时代,人才和普通人的作用比例是1000:1 那么LLM时代就是1:0,普通人一点作用都没有,甚至多数情况下是负作用
中文
10
3
82
22.3K
ghostInTrantor
ghostInTrantor@ghostINTrantor·
@mranti 这里面最有技术含量的是魔改显存的4090
中文
0
0
0
281
Michael Anti
Michael Anti@mranti·
著名游戏主播PewDiePie自己通过手搓本地大模型,在Qwen2.5的基础上,学习Deepseek和另外一个清华大学的论文,最终训练成功自己的模型,在基准测试中超过ChatGPT。他的机器用的也是从中国买的魔改4090显卡。这基本上给各国建立自己的模型上了示范课。 youtube.com/watch?v=aV4j5p…
YouTube video
YouTube
中文
52
334
1.6K
359.5K