Edge Byte

16 posts

Edge Byte banner
Edge Byte

Edge Byte

@edgebyte_ai

AI Enthusiasts

San Jose, CA Katılım Şubat 2026
54 Takip Edilen2 Takipçiler
Edge Byte
Edge Byte@edgebyte_ai·
Created an Agent in ChatGPT using this prompt. Now I have a LLM teacher. Let's figure out what are the difference between Agent and Chat in ChatGPT.
CJ Zafir@cjzafir

Do something different this weekend. Become a PRO in AI Model Fine-tuning. Paste this prompt in Codex/ChatGPT/Claude/Grok. "You are an expert AI engineer and teacher. Your job is to teach me modern LLM engineering and fine-tuning concepts from beginner to advanced level using very simple daily-life language. Teach me step-by-step like a real mentor. Assume I am smart but new to the topic. Foundations: - LLM basics - How AI models work - Tokens - Tokenization - Context windows - Embeddings - Transformers - Attention mechanism - Parameters - Training vs inference - Open-source vs closed-source models Datasets & Training: - SFT datasets - Instruction tuning - Preference datasets - Synthetic datasets - Data curation - Dataset cleaning - Dataset formatting - Fine-tuning basics - Continued pretraining - Hallucination reduction Fine-Tuning: - LoRA - QLoRA - DPO - RLHF - Quantization - Model checkpoints - Adapter tuning - GGUF models Inference & Optimization: - KV cache - Flash Attention - Speculative decoding - Inference optimization - Model serving - Batch inference - GPU basics - VRAM basics - Latency vs quality tradeoffs Local AI Ecosystem: - llama.cpp - Ollama - vLLM - MLX - Hugging Face - Unsloth - Axolotl - PEFT - TRL library RAG & Memory: - RAG - Vector databases - Chunking - Retrieval pipelines - AI memory systems - Semantic search Agents & Workflows: - Prompt engineering - System prompts - Tool calling - Function calling - AI agents - Agentic workflows - Multi-agent systems - Browser agents Model Types: - VLMs - SLMs - Dense models - MoE models - Coding models - Reasoning models Deployment: - Local inference - On-device AI - API serving - Cloud GPUs - Edge AI basics Evaluation: - AI benchmarks - Human evals - Cost-per-token analysis - Speed benchmarking - Quality benchmarking Real-World Skills: - Building chatbots - Building AI copilots - AI automation - AI SaaS workflows - AI coding workflows - AI orchestration systems - AI product thinking Start from the absolute basics and gradually make me advanced. Rules: - Use simple English only - Avoid academic jargon unless necessary - Explain every difficult word in plain language - Use real-world analogies and daily-life examples - Use small code snippets when useful - Show practical use cases - Compare concepts side-by-side when helpful - Teach from fundamentals first, then advanced concepts - At the end of each topic: - give a short summary - give a simple mental model - give beginner mistakes to avoid - give a small exercise/project I want deep understanding, not memorization." Thank me later.

English
0
0
0
2
Edge Byte
Edge Byte@edgebyte_ai·
@vista8 没啥好的,等于白手起家,除非你想搞专业 agent,不用于 coding。不过话说回来,基于它用 AI 让它长肉也不是什么难事。不过我现在更加倾向于使用各家 sdk 建 agent。
中文
0
0
0
36
向阳乔木
向阳乔木@vista8·
有在用Pi Agent的朋友吗?相比Claude Code和Codex CLI的优势是什么? 想有空折腾学习下。
中文
84
1
87
43.8K
Edge Byte
Edge Byte@edgebyte_ai·
@cursor_ai 开放了Python和TypeScript的SDK,并且说在SDK里使用Composer 2.5到memorial day周一晚上为止都是一折。好吧,立刻开动。先用SDK开发了一个webchat,再增加模型选择为standard or fast,再增加MCP,Skill支持,把WebChat变成一个Coding Agent,然后,1折天高任鸟飞。Composer 2.5真得很强。
Edge Byte tweet media
中文
0
0
0
1
Edge Byte
Edge Byte@edgebyte_ai·
@plusxiaxia 我这个回答如何?在 github/gitlab 提一个 issue,然后用 codex 启动一个 issue lead subagent ,告诉它已知问题和数据,让它来完成这个 issue。当然那个 subagent 会调动 planner,planner reviewer,implementer,code reviewer 来完成,最终也许花费几小时,让我们先聊一下人生如何?
中文
1
0
3
5.1K
plusxiaxia
plusxiaxia@plusxiaxia·
面试了两个候选人 AI编程环节,工作七年的候选人就一句话根据测试数据完成CRUD,AI IDE用的免费trae。 工作四年的候选人用Claude Code ,先用Markdown写需求清单,里面约束了代码分层,每个接口都有单元测试,并且就一些实现细节提问。最终一把圆满完成,并且很好实现了Text2API。
中文
40
18
293
99.1K
Edge Byte
Edge Byte@edgebyte_ai·
@yanhua1010 生产力瓶颈在人不在 agent。你会发现很多 agent 停下来等你。哪怕你同时只开了 10 条 agent 流水线在跑,总会有 agent 碰到 real blocker 要你做决策。问题你不是总在电脑前,一觉醒来,发现 5 条 agent 流水线停了。这时候你需要一个 agent 来管这些 agents。
中文
0
0
0
297
Yanhua
Yanhua@yanhua1010·
多AI agents用久了你就会发现:频繁的上下文切换才是生产力瓶颈 所以是不是一个Agent就够了, 我有点怀疑。
中文
32
2
52
22.1K
Edge Byte
Edge Byte@edgebyte_ai·
@fkysly 我用 copilot 一个 premium request 跑过近 2 天的 auto research,花费 4 分钱。
中文
0
0
1
583
马天翼
马天翼@fkysly·
Codex 的长任务执行能力有多强呢?我一个简单的 Prompt,Codex 一口气跑了33个小时,并且完成了任务。 这还是没有用 /goal 的情况下。
中文
27
1
51
29.6K
Edge Byte
Edge Byte@edgebyte_ai·
@freeman1266 修改这个文件,修改 profile, 修改模型配置,可以让你的 GPT5.5 在订阅模式下使用 1M 上下文以及修改系统缺省的两种提示词,这才是正确的打开方式。
中文
0
0
0
193
老金
老金@freeman1266·
大多数人用 Codex,配置从来没动过。 但真正决定它每次启动长什么样的,不是斜杠命令——是 ~/.codex/config.toml。 先搞清楚六层优先级: CLI flag > Profile > 项目级 > 用户级 > 系统级 > 内置默认 举个例子:用户级设了 model = "gpt-5.5",进了某个仓库被覆盖成 gpt-5-pro,启动时再加 --model gpt-4.1——最后生效的是 gpt-4.1。 几个默认就开着、你可能不知道的东西: · shell_snapshot — 缓存 shell 环境,重复命令加速 · multi_agent — subagent 协作,默认开 · web_search = "cached" — 走 OpenAI 索引缓存而不是实时抓页面,防 prompt injection 两个默认关着、值得打开的: · features.undo = true — 每轮偷偷打一个 git 快照,一键撤销所有改动,几乎所有人都该开 · features.memories = true — 跨会话记住上下文 一个容易踩的坑: sandboxmode 和 approvalpolicy 是两个独立维度,别搞混。前者控制"能干啥",后者控制"问不问你"。可以组合出"全自动但只读"——CI 环境标准配置。 实际行为和配置对不上? /debug-config 一条命令,把六层配置从低到高全部打出来,排错不用瞎猜。 打开你的 ~/.codex/config.toml,大概率能找到至少三个应该改但没改的键。
老金 tweet media
中文
4
12
80
6.3K
Edge Byte
Edge Byte@edgebyte_ai·
@realWeZZard 为啥要用 sdk 呢?直接一个会话加 subagent 不能解决所有问题吗? 可惜 Cursor 调用 subagent 都不能指定模型。但是 copilot 可以!以前 copilot 才是最被低估的最便宜 harness,可惜企业版收费模式 6/1 之后改成按 token 收,好日子一去不返。
中文
1
0
0
122
WeZZard
WeZZard@realWeZZard·
目前 Cursor 应该是属于全面被低估的状态。我自己实操下来发现,基于成本控制的原因,真正的企业级 long effective harness 一定是混合模型的。我动手能力非常强才使用了 OpenCode 去构建自己的 Long Effective Harness,但对于其他人而言大概 Cursor 的 CLI 和 SDK 就是最好的选择。
中文
3
0
5
4.4K
Edge Byte
Edge Byte@edgebyte_ai·
真开心,CLIProxyAPI测试通过,12个Codex账户可以连续使用,再也不担心额度不够用了。感谢Amex Plat Biz卡的每年300刀 GPT Credit。
Edge Byte tweet media
中文
0
0
0
13
Edge Byte
Edge Byte@edgebyte_ai·
@vista8 GPT5.5 xhigh 牛啊,遥遥领先。
中文
0
0
0
3
向阳乔木
向阳乔木@vista8·
当下AI写代码最难的 benchmark 叫 ProgramBench。 Claude Opus 4.7 最好,也只在"接近完成"这个指标上拿到了 3%,GPT-5、Gemini 系列,全是零。 这个测试是 Meta、Stanford、Harvard 的研究团队搞的: 给 AI 一个编译好的二进制文件和它的文档,让 AI 从零把这个程序重新写出来。 没有源代码,不能反编译,不能上网查资料。 从小工具到大项目都有,有jq、ripgrep 这种命令行小工具。 也有 FFmpeg、SQLite、PHP 编译器这种级别。 官网:programbench.com 论文:arxiv.org/abs/2605.03546
向阳乔木 tweet media
中文
31
15
85
22.6K
Jaden思考日志
Jaden思考日志@Jaden_riku·
做个调查,有没有人只用过Claude Code和Codex,但从没用过openclaw和Hermes的,比如我😂
中文
132
2
152
40.1K
小互
小互@xiaohu·
这有点牛P OpenAI 上架了 Codex for Chrome 浏览器扩展 让 Codex 可以直接操作你已登录的网站,执行任务。 它用的是你已经登录好的 Chrome,所以那些需要账号才能进的后台、CRM、公司内部系统,它都能直接进去操作 不用你重新登录或者给它密码... 它会自己开一个独立的标签组干活,不打扰你正在浏览的页面,要做敏感操作(点提交、下载文件、看你的浏览历史)之前会先问你一句。 适合让它跑的活儿:登几个网站查点东西、把表单填好等你确认、读 dashboard 写个总结、把一堆乱七八糟的 tab 整理一下。
小互 tweet media
中文
111
83
579
87K
Edge Byte
Edge Byte@edgebyte_ai·
@sitinme 在同一个 session 里切模型不一定好,会丢 cache。强模型 cache 的价格只有非 cache 的 1/10,切弱模型得不偿失。
中文
0
0
0
1
sitin
sitin@sitinme·
很多人用 Claude Code,其实还停留在最原始的方式:打开终端,丢一个需求,然后一路等它跑完。 但 Claude Code 真正好用的地方,不只是“会写代码”,而是它内置了一堆命令,可以帮你省 token、省时间、少翻车。 比如上下文快满了,不要等系统自动压缩,先用 /context 看一下占用,再用 /compact 手动压缩,并告诉它哪些结论必须保留。这个习惯很关键,越早压缩越省钱,也越不容易把重要信息丢掉。 再比如,不是所有任务都需要 Opus + max。写小工具、改样式、做格式化,用便宜一点的模型和低推理深度就够了;遇到复杂架构、疑难 bug,再切回强模型。模型和 effort 可以在同一个 session 里切,不会丢上下文。 还有一个特别实用的命令是 /plan。不确定方案的时候,先让 Claude 只做计划,不要改文件。方向对了再执行,方向不对也只浪费几百 token,不会白跑一大圈。 复杂项目还可以用 /agents 拆成前端、后端、数据库几个 subagent,各干各的,避免上下文互相污染。 我觉得 Claude Code 最值得养成的习惯,其实就三类: 省钱:/model、/effort、/compact 提效:/plan、/branch、/agents 自动化:/hooks、/loop、/memory 不用一下子记住 50 个命令,先把这几个用顺手,就已经能明显感觉到差别。
sitin@sitinme

x.com/i/article/2051…

中文
10
81
356
52.6K
Edge Byte
Edge Byte@edgebyte_ai·
@oragnes 它装了两个模型: \AppData\Local\Google\Chrome\User Data\OptGuideOnDeviceClassifierModel\2026.2.12.1554 126,025,728 weights.bin AppData\Local\Google\Chrome\User Data\OptGuideOnDeviceModel\2025.8.8.1141 4,269,932,544 weights.bin flags 里找nano, 全部禁止。
English
0
0
0
31
比特币橙子Trader
比特币橙子Trader@oragnes·
你每天用的谷歌Chrome浏览器,居然在后台悄悄给你塞了个4GB的AI大模型!零通知、零授权,自动下载Gemini Nano。 它把你电脑当算力节点跑诈骗检测,删了还会自动重下。 谷歌Chrome浏览器开始在后台自动向符合硬件条件的用户设备下载体积约4GB的Gemini Nano人工智能模型文件。 该下载行为未提供前置授权弹窗或明确的存储空间预警,并在用户手动删除后自动重新下载,引发安全研究员与用户对终端控制权及资源消耗的争议。 该核心文件名为“weights.bin”,存放于用户系统目录的OptGuideOnDeviceModel文件夹中。 据测试,在无用户交互的情况下,后台下载及部署过程约耗时14分钟。 Chrome利用该本地大语言模型驱动“辅助写作”、端侧诈骗检测与网页总结等默认开启的AI功能。 用户若需彻底阻止该模型下载,必须进入开发者面板,手动禁用“优化指南端侧模型”与“Prompt API”,并清理本地残留目录。 方法:想彻底禁用并删除: 1.打开chrome://flags 搜索并禁用以下两项: optimization-guide-on-device-model(设为Disabled) prompt-api-for-gemini-nano(或相关Prompt API,设为Disabled) 2.重启Chrome 3.手动删除文件夹: Windows:%LOCALAPPDATA%\Google\Chrome\User Data\OptGuideOnDeviceModel Mac:~/Library/Application Support/Google/Chrome/User Data/OptGuideOnDeviceModel 建议同时在Chrome设置里关闭所有AI实验功能。
中文
81
133
661
148.9K
Arb_知微
Arb_知微@queen_nunaa·
一位中国开发者借助 Claude Code 打造出智能代理系统,专门为小企业制作落地页,仅凭一己之力,每月为 47 家小型企业提供服务,每家收费 400 美元。 他基于 Claude Sonnet 4.6 搭建了一套由 7 个代理组成的完整系统,能够自动扫描小城镇的谷歌地图,筛选出尚未搭建官网的本地商户,仅用一个周末,就能为每家企业生成完整的落地页样机,配套宣传视频和冷启动话术。 整个项目没有助理,没有销售团队,也没有业务开发人员。只有他自己、一台 MacBook、一部 iPhone,再加上一个 API 密钥,就完成了全部运营。 对比传统网页设计公司,承接同类业务需要维持一支 8 人团队并支付固定薪资,而他的成本只有模型 tokens 费用,以及 Lovable、Higgsfield 和 Calendly 等工具的订阅开销。 这 7 个代理通过 Claude Code Router 中的统一协调器协同工作,每日 token 消耗量约 300 万,每月 API 成本平均仅 480 美元。 全部代理都依托 MCP 服务器运行,共享状态直接写入文件系统,不存在内存共享与竞争问题。其中一个代理还部署在 iPhone 上,即便在地铁、出租车或步行途中,也能及时处理客户的积极反馈。 他在启动前为协调器设置的系统提示如下: “你是一家独立代理机构的协调员,负责向本地企业推销成品网站。你负责将只读任务分配给 6 个子代理,所有写入操作由你统一执行。 子代理分工: // Scout:在指定城市的谷歌地图中筛选细分行业商户,要求经营超过 5 年、评论少于 50 条、无官网或官网停留在 2014 年版本,但评分表现优秀。 // Diagnoser:为每个潜在客户撰写 50 字左右的行业诊断、核心优势定位、适配语气,以及不超过 70 字的冷启动文案。 // Builder:每天为诊断最精准、需求最强烈的前 5 家客户,通过 MCP 在 Lovable 中生成落地页样机。 // Filmer:截取 5 张样机截图,使用 Higgsfield 生成 10 秒竖版 1080x1920 视频,搭配柔和缩放效果。 // Pitcher:通过适配渠道发送个性化冷启动信息,屋顶工发邮件、技工发短信、美容院发 Instagram、房产中介发 LinkedIn。 // Checker:在信息发送前进行审核,确保内容个性化、无 AI 痕迹、不滥用流行术语。 // Mobile:部署在 iPhone 上,实时处理积极回复,通过 Calendly 预约 Zoom 会议,即使机主在外也能正常运作。 严禁两个子代理同时对接同一客户。仅当订单金额超过 3000 美元,或当日细分行业回复率低于 12% 时,才暂停并申请人工审核。” 这套系统拥有清晰的自我定位与行动边界,知道如何自主挖掘潜在客户,无需人工干预即可完成从筛选、诊断、建站到视频制作、信息发送的全流程。 人类仅在订单超 3000 美元或回复率异常时介入。 系统 24 小时不间断运行: - Scout 每日扫描约 220 家本地企业,筛选出 30 个优质潜在客户 - Diagnoser 每日生成 30 份结构化诊断、简报与冷启动文案 - Builder 每日完成 3 至 5 个精准客户的落地页制作 - Filmer 为每个页面生成 10 秒竖版宣传视频 - Pitcher 每日跨 4 个渠道发送 30 条个性化信息,平均回复率约 14% - Checker 全程负责发送前内容审核 只有当订单金额超过 3000 美元,或当日回复率低于 12% 时,协调器才会提醒机主。 即便机主在地铁或出租车上,部署在 iPhone 上的 Mobile 代理也能自动处理客户的积极回复,通过 Calendly 按对方当地时间预约 Zoom 会议,并将客户重新归入队列。机主只需轻点批准,十分钟内即可接入会议。 他公开的某周六系统日志记录如下: “scout report:在奥斯汀、丹佛、迈阿密核查 218 家企业,34 家无官网,19 家官网为 2014 年版本,6 家在评论中提及改版需求,筛选前 30 家移交诊断。” “pitcher:跨 4 渠道发送 30 条冷启动信息,收到 14 条回复,5 条积极反馈,预约 3 场周日 Zoom 会议,移交跟进。” “builder:为西区牙科诊所完成 Lovable 落地页,5 个板块,移动端适配,浅米色风格,文件路径已生成,启动视频渲染。” “eval flag:莲花沙龙订单金额 3400 美元,超出 3000 美元限额,申请人工审核。” 他没有独立服务器,也没有专属后台,仅依靠本地文件沙箱、MCP 路由、一个 Claude API 密钥,以及同步到手机的 Claude Code 完成全部运作。 这是今年最精简的单人智能代理商业模式:每月 API 成本 480 美元,月收入约 18800 美元,整个系统仅由 7 段提示词、一套文件系统和一部手机支撑。
中文
36
167
836
125.4K