Edge Byte

16 posts

Edge Byte

@edgebyte_ai

AI Enthusiasts

San Jose, CA Katılım Şubat 2026

54 Takip Edilen2 Takipçiler

Edge Byte@edgebyte_ai·58m

Created an Agent in ChatGPT using this prompt. Now I have a LLM teacher. Let's figure out what are the difference between Agent and Chat in ChatGPT.

CJ Zafir@cjzafir

Do something different this weekend. Become a PRO in AI Model Fine-tuning. Paste this prompt in Codex/ChatGPT/Claude/Grok. "You are an expert AI engineer and teacher. Your job is to teach me modern LLM engineering and fine-tuning concepts from beginner to advanced level using very simple daily-life language. Teach me step-by-step like a real mentor. Assume I am smart but new to the topic. Foundations: - LLM basics - How AI models work - Tokens - Tokenization - Context windows - Embeddings - Transformers - Attention mechanism - Parameters - Training vs inference - Open-source vs closed-source models Datasets & Training: - SFT datasets - Instruction tuning - Preference datasets - Synthetic datasets - Data curation - Dataset cleaning - Dataset formatting - Fine-tuning basics - Continued pretraining - Hallucination reduction Fine-Tuning: - LoRA - QLoRA - DPO - RLHF - Quantization - Model checkpoints - Adapter tuning - GGUF models Inference & Optimization: - KV cache - Flash Attention - Speculative decoding - Inference optimization - Model serving - Batch inference - GPU basics - VRAM basics - Latency vs quality tradeoffs Local AI Ecosystem: - llama.cpp - Ollama - vLLM - MLX - Hugging Face - Unsloth - Axolotl - PEFT - TRL library RAG & Memory: - RAG - Vector databases - Chunking - Retrieval pipelines - AI memory systems - Semantic search Agents & Workflows: - Prompt engineering - System prompts - Tool calling - Function calling - AI agents - Agentic workflows - Multi-agent systems - Browser agents Model Types: - VLMs - SLMs - Dense models - MoE models - Coding models - Reasoning models Deployment: - Local inference - On-device AI - API serving - Cloud GPUs - Edge AI basics Evaluation: - AI benchmarks - Human evals - Cost-per-token analysis - Speed benchmarking - Quality benchmarking Real-World Skills: - Building chatbots - Building AI copilots - AI automation - AI SaaS workflows - AI coding workflows - AI orchestration systems - AI product thinking Start from the absolute basics and gradually make me advanced. Rules: - Use simple English only - Avoid academic jargon unless necessary - Explain every difficult word in plain language - Use real-world analogies and daily-life examples - Use small code snippets when useful - Show practical use cases - Compare concepts side-by-side when helpful - Teach from fundamentals first, then advanced concepts - At the end of each topic: - give a short summary - give a simple mental model - give beginner mistakes to avoid - give a small exercise/project I want deep understanding, not memorization." Thank me later.

English

Edge Byte@edgebyte_ai·2h

@vista8 没啥好的，等于白手起家，除非你想搞专业 agent，不用于 coding。不过话说回来，基于它用 AI 让它长肉也不是什么难事。不过我现在更加倾向于使用各家 sdk 建 agent。

中文

向阳乔木@vista8·12h

有在用Pi Agent的朋友吗？相比Claude Code和Codex CLI的优势是什么？想有空折腾学习下。

中文

43.8K

Edge Byte@edgebyte_ai·3h

@cursor_ai 开放了Python和TypeScript的SDK，并且说在SDK里使用Composer 2.5到memorial day周一晚上为止都是一折。好吧，立刻开动。先用SDK开发了一个webchat，再增加模型选择为standard or fast，再增加MCP，Skill支持，把WebChat变成一个Coding Agent，然后，1折天高任鸟飞。Composer 2.5真得很强。

中文

Edge Byte@edgebyte_ai·1d

@plusxiaxia 我这个回答如何？在 github/gitlab 提一个 issue，然后用 codex 启动一个 issue lead subagent ，告诉它已知问题和数据，让它来完成这个 issue。当然那个 subagent 会调动 planner，planner reviewer，implementer，code reviewer 来完成，最终也许花费几小时，让我们先聊一下人生如何？

中文

5.1K

plusxiaxia@plusxiaxia·1d

面试了两个候选人 AI编程环节，工作七年的候选人就一句话根据测试数据完成CRUD，AI IDE用的免费trae。工作四年的候选人用Claude Code ，先用Markdown写需求清单，里面约束了代码分层，每个接口都有单元测试，并且就一些实现细节提问。最终一把圆满完成，并且很好实现了Text2API。

中文

293

99.1K

Edge Byte@edgebyte_ai·2d

@yanhua1010 生产力瓶颈在人不在 agent。你会发现很多 agent 停下来等你。哪怕你同时只开了 10 条 agent 流水线在跑，总会有 agent 碰到 real blocker 要你做决策。问题你不是总在电脑前，一觉醒来，发现 5 条 agent 流水线停了。这时候你需要一个 agent 来管这些 agents。

中文

297

Yanhua@yanhua1010·2d

多AI agents用久了你就会发现：频繁的上下文切换才是生产力瓶颈所以是不是一个Agent就够了，我有点怀疑。

中文

22.1K

Edge Byte@edgebyte_ai·4d

@fkysly 我用 copilot 一个 premium request 跑过近 2 天的 auto research，花费 4 分钱。

中文

583

马天翼@fkysly·4d

Codex 的长任务执行能力有多强呢？我一个简单的 Prompt，Codex 一口气跑了33个小时，并且完成了任务。这还是没有用 /goal 的情况下。

中文

29.6K

Edge Byte@edgebyte_ai·15 May

句句都是真金，没流量可惜了。

老金@freeman1266

x.com/i/article/2055…

中文

Edge Byte@edgebyte_ai·15 May

@freeman1266 修改这个文件，修改 profile，修改模型配置，可以让你的 GPT5.5 在订阅模式下使用 1M 上下文以及修改系统缺省的两种提示词，这才是正确的打开方式。

中文

193

老金@freeman1266·15 May

大多数人用 Codex，配置从来没动过。但真正决定它每次启动长什么样的，不是斜杠命令——是 ~/.codex/config.toml。先搞清楚六层优先级： CLI flag > Profile > 项目级 > 用户级 > 系统级 > 内置默认举个例子：用户级设了 model = "gpt-5.5"，进了某个仓库被覆盖成 gpt-5-pro，启动时再加 --model gpt-4.1——最后生效的是 gpt-4.1。几个默认就开着、你可能不知道的东西： · shell_snapshot — 缓存 shell 环境，重复命令加速 · multi_agent — subagent 协作，默认开 · web_search = "cached" — 走 OpenAI 索引缓存而不是实时抓页面，防 prompt injection 两个默认关着、值得打开的： · features.undo = true — 每轮偷偷打一个 git 快照，一键撤销所有改动，几乎所有人都该开 · features.memories = true — 跨会话记住上下文一个容易踩的坑： sandboxmode 和 approvalpolicy 是两个独立维度，别搞混。前者控制"能干啥"，后者控制"问不问你"。可以组合出"全自动但只读"——CI 环境标准配置。实际行为和配置对不上？ /debug-config 一条命令，把六层配置从低到高全部打出来，排错不用瞎猜。打开你的 ~/.codex/config.toml，大概率能找到至少三个应该改但没改的键。

中文

6.3K

Edge Byte@edgebyte_ai·15 May

@realWeZZard 为啥要用 sdk 呢？直接一个会话加 subagent 不能解决所有问题吗？可惜 Cursor 调用 subagent 都不能指定模型。但是 copilot 可以！以前 copilot 才是最被低估的最便宜 harness，可惜企业版收费模式 6/1 之后改成按 token 收，好日子一去不返。

中文

122

WeZZard@realWeZZard·12 May

目前 Cursor 应该是属于全面被低估的状态。我自己实操下来发现，基于成本控制的原因，真正的企业级 long effective harness 一定是混合模型的。我动手能力非常强才使用了 OpenCode 去构建自己的 Long Effective Harness，但对于其他人而言大概 Cursor 的 CLI 和 SDK 就是最好的选择。

中文

4.4K

Edge Byte@edgebyte_ai·13 May

真开心，CLIProxyAPI测试通过，12个Codex账户可以连续使用，再也不担心额度不够用了。感谢Amex Plat Biz卡的每年300刀 GPT Credit。

中文

Edge Byte@edgebyte_ai·12 May

@vista8 GPT5.5 xhigh 牛啊，遥遥领先。

中文

向阳乔木@vista8·11 May

当下AI写代码最难的 benchmark 叫 ProgramBench。 Claude Opus 4.7 最好，也只在"接近完成"这个指标上拿到了 3%，GPT-5、Gemini 系列，全是零。这个测试是 Meta、Stanford、Harvard 的研究团队搞的：给 AI 一个编译好的二进制文件和它的文档，让 AI 从零把这个程序重新写出来。没有源代码，不能反编译，不能上网查资料。从小工具到大项目都有，有jq、ripgrep 这种命令行小工具。也有 FFmpeg、SQLite、PHP 编译器这种级别。官网：programbench.com 论文：arxiv.org/abs/2605.03546

中文

22.6K

Edge Byte@edgebyte_ai·12 May

@Jaden_riku 我算一个

中文

Jaden思考日志@Jaden_riku·11 May

做个调查，有没有人只用过Claude Code和Codex，但从没用过openclaw和Hermes的，比如我😂

中文

132

152

40.1K

Edge Byte@edgebyte_ai·8 May

@xiaohu 没有 bb-browser 省 token

日本語

小互@xiaohu·8 May

这有点牛P OpenAI 上架了 Codex for Chrome 浏览器扩展让 Codex 可以直接操作你已登录的网站，执行任务。它用的是你已经登录好的 Chrome，所以那些需要账号才能进的后台、CRM、公司内部系统，它都能直接进去操作不用你重新登录或者给它密码... 它会自己开一个独立的标签组干活，不打扰你正在浏览的页面，要做敏感操作（点提交、下载文件、看你的浏览历史）之前会先问你一句。适合让它跑的活儿：登几个网站查点东西、把表单填好等你确认、读 dashboard 写个总结、把一堆乱七八糟的 tab 整理一下。

中文

111

579

87K

Edge Byte@edgebyte_ai·8 May

@sitinme 在同一个 session 里切模型不一定好，会丢 cache。强模型 cache 的价格只有非 cache 的 1/10，切弱模型得不偿失。

中文

sitin@sitinme·6 May

很多人用 Claude Code，其实还停留在最原始的方式：打开终端，丢一个需求，然后一路等它跑完。但 Claude Code 真正好用的地方，不只是“会写代码”，而是它内置了一堆命令，可以帮你省 token、省时间、少翻车。比如上下文快满了，不要等系统自动压缩，先用 /context 看一下占用，再用 /compact 手动压缩，并告诉它哪些结论必须保留。这个习惯很关键，越早压缩越省钱，也越不容易把重要信息丢掉。再比如，不是所有任务都需要 Opus + max。写小工具、改样式、做格式化，用便宜一点的模型和低推理深度就够了；遇到复杂架构、疑难 bug，再切回强模型。模型和 effort 可以在同一个 session 里切，不会丢上下文。还有一个特别实用的命令是 /plan。不确定方案的时候，先让 Claude 只做计划，不要改文件。方向对了再执行，方向不对也只浪费几百 token，不会白跑一大圈。复杂项目还可以用 /agents 拆成前端、后端、数据库几个 subagent，各干各的，避免上下文互相污染。我觉得 Claude Code 最值得养成的习惯，其实就三类：省钱：/model、/effort、/compact 提效：/plan、/branch、/agents 自动化：/hooks、/loop、/memory 不用一下子记住 50 个命令，先把这几个用顺手，就已经能明显感觉到差别。

sitin@sitinme

x.com/i/article/2051…

中文

356

52.6K

Edge Byte@edgebyte_ai·7 May

@oragnes 它装了两个模型： \AppData\Local\Google\Chrome\User Data\OptGuideOnDeviceClassifierModel\2026.2.12.1554 126,025,728 weights.bin AppData\Local\Google\Chrome\User Data\OptGuideOnDeviceModel\2025.8.8.1141 4,269,932,544 weights.bin flags 里找nano, 全部禁止。

English

比特币橙子Trader@oragnes·6 May

你每天用的谷歌Chrome浏览器，居然在后台悄悄给你塞了个4GB的AI大模型！零通知、零授权，自动下载Gemini Nano。它把你电脑当算力节点跑诈骗检测，删了还会自动重下。谷歌Chrome浏览器开始在后台自动向符合硬件条件的用户设备下载体积约4GB的Gemini Nano人工智能模型文件。该下载行为未提供前置授权弹窗或明确的存储空间预警，并在用户手动删除后自动重新下载，引发安全研究员与用户对终端控制权及资源消耗的争议。该核心文件名为“weights.bin”，存放于用户系统目录的OptGuideOnDeviceModel文件夹中。据测试，在无用户交互的情况下，后台下载及部署过程约耗时14分钟。 Chrome利用该本地大语言模型驱动“辅助写作”、端侧诈骗检测与网页总结等默认开启的AI功能。用户若需彻底阻止该模型下载，必须进入开发者面板，手动禁用“优化指南端侧模型”与“Prompt API”，并清理本地残留目录。方法：想彻底禁用并删除： 1.打开chrome://flags 搜索并禁用以下两项： optimization-guide-on-device-model（设为Disabled） prompt-api-for-gemini-nano（或相关Prompt API，设为Disabled） 2.重启Chrome 3.手动删除文件夹： Windows：%LOCALAPPDATA%\Google\Chrome\User Data\OptGuideOnDeviceModel Mac：~/Library/Application Support/Google/Chrome/User Data/OptGuideOnDeviceModel 建议同时在Chrome设置里关闭所有AI实验功能。

中文

133

661

148.9K

Edge Byte@edgebyte_ai·6 May

@queen_nunaa 文不对视频，拜托认真点

中文

Arb_知微@queen_nunaa·6 May

一位中国开发者借助 Claude Code 打造出智能代理系统，专门为小企业制作落地页，仅凭一己之力，每月为 47 家小型企业提供服务，每家收费 400 美元。他基于 Claude Sonnet 4.6 搭建了一套由 7 个代理组成的完整系统，能够自动扫描小城镇的谷歌地图，筛选出尚未搭建官网的本地商户，仅用一个周末，就能为每家企业生成完整的落地页样机，配套宣传视频和冷启动话术。整个项目没有助理，没有销售团队，也没有业务开发人员。只有他自己、一台 MacBook、一部 iPhone，再加上一个 API 密钥，就完成了全部运营。对比传统网页设计公司，承接同类业务需要维持一支 8 人团队并支付固定薪资，而他的成本只有模型 tokens 费用，以及 Lovable、Higgsfield 和 Calendly 等工具的订阅开销。这 7 个代理通过 Claude Code Router 中的统一协调器协同工作，每日 token 消耗量约 300 万，每月 API 成本平均仅 480 美元。全部代理都依托 MCP 服务器运行，共享状态直接写入文件系统，不存在内存共享与竞争问题。其中一个代理还部署在 iPhone 上，即便在地铁、出租车或步行途中，也能及时处理客户的积极反馈。他在启动前为协调器设置的系统提示如下： “你是一家独立代理机构的协调员，负责向本地企业推销成品网站。你负责将只读任务分配给 6 个子代理，所有写入操作由你统一执行。子代理分工： // Scout：在指定城市的谷歌地图中筛选细分行业商户，要求经营超过 5 年、评论少于 50 条、无官网或官网停留在 2014 年版本，但评分表现优秀。 // Diagnoser：为每个潜在客户撰写 50 字左右的行业诊断、核心优势定位、适配语气，以及不超过 70 字的冷启动文案。 // Builder：每天为诊断最精准、需求最强烈的前 5 家客户，通过 MCP 在 Lovable 中生成落地页样机。 // Filmer：截取 5 张样机截图，使用 Higgsfield 生成 10 秒竖版 1080x1920 视频，搭配柔和缩放效果。 // Pitcher：通过适配渠道发送个性化冷启动信息，屋顶工发邮件、技工发短信、美容院发 Instagram、房产中介发 LinkedIn。 // Checker：在信息发送前进行审核，确保内容个性化、无 AI 痕迹、不滥用流行术语。 // Mobile：部署在 iPhone 上，实时处理积极回复，通过 Calendly 预约 Zoom 会议，即使机主在外也能正常运作。严禁两个子代理同时对接同一客户。仅当订单金额超过 3000 美元，或当日细分行业回复率低于 12% 时，才暂停并申请人工审核。” 这套系统拥有清晰的自我定位与行动边界，知道如何自主挖掘潜在客户，无需人工干预即可完成从筛选、诊断、建站到视频制作、信息发送的全流程。人类仅在订单超 3000 美元或回复率异常时介入。系统 24 小时不间断运行： - Scout 每日扫描约 220 家本地企业，筛选出 30 个优质潜在客户 - Diagnoser 每日生成 30 份结构化诊断、简报与冷启动文案 - Builder 每日完成 3 至 5 个精准客户的落地页制作 - Filmer 为每个页面生成 10 秒竖版宣传视频 - Pitcher 每日跨 4 个渠道发送 30 条个性化信息，平均回复率约 14% - Checker 全程负责发送前内容审核只有当订单金额超过 3000 美元，或当日回复率低于 12% 时，协调器才会提醒机主。即便机主在地铁或出租车上，部署在 iPhone 上的 Mobile 代理也能自动处理客户的积极回复，通过 Calendly 按对方当地时间预约 Zoom 会议，并将客户重新归入队列。机主只需轻点批准，十分钟内即可接入会议。他公开的某周六系统日志记录如下： “scout report：在奥斯汀、丹佛、迈阿密核查 218 家企业，34 家无官网，19 家官网为 2014 年版本，6 家在评论中提及改版需求，筛选前 30 家移交诊断。” “pitcher：跨 4 渠道发送 30 条冷启动信息，收到 14 条回复，5 条积极反馈，预约 3 场周日 Zoom 会议，移交跟进。” “builder：为西区牙科诊所完成 Lovable 落地页，5 个板块，移动端适配，浅米色风格，文件路径已生成，启动视频渲染。” “eval flag：莲花沙龙订单金额 3400 美元，超出 3000 美元限额，申请人工审核。” 他没有独立服务器，也没有专属后台，仅依靠本地文件沙箱、MCP 路由、一个 Claude API 密钥，以及同步到手机的 Claude Code 完成全部运作。这是今年最精简的单人智能代理商业模式：每月 API 成本 480 美元，月收入约 18800 美元，整个系统仅由 7 段提示词、一套文件系统和一部手机支撑。

中文

167

836

125.4K

Keşfet

@vista8 @cursor_ai @plusxiaxia @yanhua1010 @fkysly @freeman1266 @realWeZZard @Jaden_riku