Hawkingrei

2.7K posts

Hawkingrei banner
Hawkingrei

Hawkingrei

@suohawking

mono repo 爱好者|抖机灵 | Database Developer | SW-1518-1200-8238 | ADHD https://t.co/x1xMF1BYtc

Shanghai Katılım Ocak 2012
3.3K Takip Edilen3.4K Takipçiler
kabikabi
kabikabi@jakevin7·
最近感觉越活越年轻了。心态比以前时候还要更加愿意冒险,更加愿意做事了。 以前的观念里有一些很错误的想法,很典型的就是“攒够钱退休。”这种养老思想根深蒂固在很多人的心里。总是在20岁就开始担心以后养老&退休的事情。 但是却没有想过我们当下应该做什么有意义的事情,在我们60岁的时候回望以前的人生,我们做了哪些出彩、人生难以忘却的经历。
中文
7
1
115
10.3K
Hawkingrei retweetledi
kabikabi
kabikabi@jakevin7·
最近开发 Slocal 过程中,UI真是太折磨我了! 找到了一个非常好用的UI Skill,分享给大家,里面收纳了非常多很强的设计相关的skill。 ui-skills.com/skills/
中文
7
52
380
33.9K
Hawkingrei retweetledi
kabikabi
kabikabi@jakevin7·
AI 魅力时刻:还是熟悉的下意识偷懒。 不过真的很开心,群里真的有人在实践我之前做的 LLM Wiki 方案。 并且他也发现这个 wiki 需要慢慢的养的,把 wiki 养得越来越丰富
kabikabi tweet mediakabikabi tweet media
中文
3
1
14
5.8K
Hawkingrei retweetledi
kabikabi
kabikabi@jakevin7·
deepseek V4 论文里关于 'Agent 能力' 的训练部分值得深入阅读和学习。 另外不得不赞叹的是deepseek 的工程能力还是依旧的如此扎实。包括自己设计DSL&实现DSec sandbox等等。 里面有一个很巧思的地方,DeepSeek-V4 的 post train 由两个阶段组成:先独立训练多个domain-specific experts,再通过 ODP 合并成统一模型。 下面是 V4 在 agent 能力训练上的一些思路: 1. 在 pre-train 中就注入了大量的 agentic data 来强化 agentic 能力。论文明确提到,为增强代码能力,DeepSeek-V4 在 mid-training 阶段加入了 agentic data - 让 base model 见过更长的任务过程。 - 让模型熟悉代码、命令、环境反馈、文件修改等模式。 - 给后续 Agent SFT/RL 提供更好的初始化,而不是从纯聊天模型开始硬训工具调用。 2. 训练多个“领域专家”,后训练的第一阶段叫 Specialist Training。论文说,对数学、代码、Agent、指令跟随等目标领域,分别训练独立专家模型 3. hard-to-verify 任务用 Generative Reward Model,传统 RLHF 往往需要训练一个 scalar reward model。DeepSeek-V4 论文说,他们在后训练中不再依赖传统 scalar reward model,而是针对 hard-to-verify 任务构造 rubric-guided RL data,并使用 Generative Reward Model,GRM 来评估 policy trajectory 4. 工具调用协议重新设计为 DSML/XML,V4 引入了新的 tool-call schema,自己设计的DSL格式,减少 escaping failure 和 tool-call errors 5. Interleaved Thinking,保留工具场景下的完整思考轨迹。在 tool-calling 场景中,整个对话过程的 reasoning content 都完整保留,包括跨 user message 边界。 6. Reasoning Effort 分模式训练,Agent 任务不是都需要最大推理。简单工具选择用 Non-think 更快;软件工程、搜索、长文档任务则可以用 High/Max,在成本和成功率之间权衡。 7. Quick Instruction 降低 Agent 前置决策成本 8. 最终用 OPD (multi-teacher On-Policy Distillation)把多个专家合并成统一模型 9. DSec:production-grade 沙箱支撑,V4为 Agentic AI post-training 和 evaluation 建的生产级沙盒平台,它运行在 3FS 分布式文件系统上,可以管理数十万并发 sandbox instances 10. RL/OPD rollout 也专门为长 Agent 轨迹优化 11. 构造自己的 Agent benchmark 集,构造了一个内部 R&D coding benchmark:从 50+ 内部工程师收集约 200 个真实任务,涵盖 feature development、bug fixing、refactoring、diagnostics,技术栈包括 PyTorch、CUDA、Rust、C++ 等。经过过滤后保留 30 个任务作为评测集
kabikabi tweet mediakabikabi tweet media
中文
9
76
478
57.8K
Hawkingrei
Hawkingrei@suohawking·
@alswl 确实,AI 能发挥多大作用,和人的知识、能力有很大关系
中文
0
0
0
170
Jingchao
Jingchao@alswl·
最近非常受不了别人说你用 AI 就可以怎么怎么怎么。 我现在就想提个问题,把公司所有的代码所有的资产把,银行卡全部塞在 Claude Code 里面,你每天帮我生成一个比特币。 你行么?
中文
1
0
4
922
Hawkingrei retweetledi
Wey Gu 古思为
Wey Gu 古思为@wey_gu·
和 Nowledge Labs 的基础设施一样,我叫它 Infraless 哈哈,只用 PaaS 不用用任何需要维护的资源
DIŸgöd ☀️@DIYgod

终于把 @folo_is@_RSSHub 服务器完全搬到 Cloudflare 全家桶了 能用的基本都用上了,Workers、Containers、Durable Objects、Queues、Browser Run、Email Sending、Email Routing、Workers AI、R2、Hyperdrive、Workers KV、Analytics Engine、Image Transformations...

中文
3
2
18
5.4K
Hawkingrei retweetledi
Jingchao
Jingchao@alswl·
最近在找语音输入工具,翻了一圈开源项目,我始终不相信商业公司会保管好用户数据。 终于找到一个产品感在线的👇✨ github.com/hehehai/voxt by @riverhohai 这是我目前用过最顺手的开源语音输入工具。 🎙️ 按住说 → 松开自动粘贴 ⚡ 实时转写 + 自动润色(去语气词 / 加标点) 👉 有审美的语音输入工具 我直接配合 🎤 DJI Mic Mini 用,基本可以一路说完一段完整表达。继续口喷代码,哦不,口喷 specs 😄 #AI #VoiceInput #Productivity
Jingchao tweet mediaJingchao tweet media
中文
2
3
18
4.1K
Jingchao
Jingchao@alswl·
@QingQ77 现在玩法是不是应该想要什么直接生成了?
中文
1
0
1
267
Geek Lite
Geek Lite@QingQ77·
这是一个基于 Python 和 Flask 的 CMS,用来搭网站后台,处理内容发布、媒体管理、主题定制和基础安全功能。 github.com/flexaflow/flex… 核心能力包括页面和文章管理、TinyMCE 编辑器、媒体库、主题系统,以及 2FA 这类基础安全功能。它支持 SQLite、MySQL 和 PostgreSQL,也给了本地启动和初始化方式。整体看下来,它更像一个通用 CMS 骨架,方便后续自己继续扩展。
Geek Lite tweet media
中文
1
0
2
5K
Hawkingrei
Hawkingrei@suohawking·
😅我打了一段字,又删除了。自己知识不足,就多学习,而不是让人和你对齐
中文
0
0
3
275
Hawkingrei
Hawkingrei@suohawking·
😅这班上得人累,还心累
中文
1
0
1
347
象牙山刘能
象牙山刘能@disksing·
00后女朋友太有屌丝气质了,不管去哪里都拎一瓶大水😅
象牙山刘能 tweet media
中文
34
0
193
52.2K
Jingchao
Jingchao@alswl·
使用 Claude Code Team 或者其他 AI 协调工具需要角色。 比如 TL / Dev / QA / UI / Ops。 在我看来,最简化需要 3 种:协调者、实施者、防御者。
中文
1
0
9
1.2K
Dinah
Dinah@dinah_zhang·
@_4ever00 快给真人介绍个🥺
中文
1
0
1
182
Hawkingrei
Hawkingrei@suohawking·
现在这个时代,就是要多 build,有 idea 就立马动手写,万一成功了呢
Hawkingrei tweet media
中文
1
0
9
3.4K