CC Jiang

830 posts

CC Jiang banner
CC Jiang

CC Jiang

@iheycc

Rag builder, Agent builder. Share my practice. Built https://t.co/7ZNdEsCY4A. Sunlight simulation https://t.co/Wp0aWphJqF

Bay Area Katılım Temmuz 2009
1.1K Takip Edilen2.2K Takipçiler
Sabitlenmiş Tweet
CC Jiang
CC Jiang@iheycc·
MinerU--开源的最佳 PDF Text、Image、Table、LaTex 公式的提取工具。来自上海人工智能实验室。近期star 数爆涨。 今天仔细研究了一番,项目用到了 OCR、layout、Table 提取、LaTex 提取这些模型。AGPL-3.0 协议 ihey.cc/hacker/opendat… 一张 PDF 页面的图片,可以分割文本、图片、表格、标题、图标描述这些元素 OCR + 提取图片/表格,直接生成 markdow/json 格式,保持正确的图文混排顺序 MinerU 用到了 YOLO、PyMuPDF 这些项目,由于它们的开源协议 AGPL-3.0 具有传染性,因此 MinerU 也是 AGPL-3.0 协议 在线体验 huggingface.co/spaces/opendat… 项目地址 github.com/opendatalab/Mi…
CC Jiang tweet mediaCC Jiang tweet mediaCC Jiang tweet mediaCC Jiang tweet media
中文
5
75
298
22.8K
CC Jiang
CC Jiang@iheycc·
@turingou 不知道能否独立使用,如果不能脱离云端,约等于把自己的 macmini 控制权交给 perplexity
中文
0
1
8
4.8K
CC Jiang
CC Jiang@iheycc·
@turingou kimi, minimax, zhipu 都有云端agent平台,deepseek也在招人中
CC Jiang tweet media
中文
0
0
5
818
郭宇 guoyu.eth
郭宇 guoyu.eth@turingou·
云端 sandbox 并发是超级智能出现在 AI DC 前最后几块短板,而这个短板也快被解决了。
中文
7
5
76
35.1K
CC Jiang
CC Jiang@iheycc·
@unixzii @yetone 之前看 smolagent 框架,是要求工作完成最终输出时也调用 final_answer 工具,框架层就非常简单了,直接判断 tool call 的值就知道模型状态。这个思路非常好,还可以支持 user_comfirm 这种需要用户输入的模型输出 github.com/huggingface/sm…
中文
0
0
4
118
Cyandev
Cyandev@unixzii·
@yetone 对,但这套执行协议主要还是看模型本身的素质和对指令遵循的能力。Prompt 里告诉它你有要做的事情就直接调工具,不调了就说明是结束。
中文
2
0
7
1.2K
CC Jiang
CC Jiang@iheycc·
真想说 openclaw 的 web 页面是 s*t 一般啊,UI 布局交互实习生的水平,还是没用 AI 辅助的实习生。人在设置配置、分析会话记录,难用至极
CC Jiang tweet mediaCC Jiang tweet media
中文
1
0
1
927
CC Jiang
CC Jiang@iheycc·
@mntruell If I regret of undo a change, I have to ask model to re-apply. Opencode support redo which is clever
English
0
0
0
73
Michael Truell
Michael Truell@mntruell·
Cursor seeks to be the best and most powerful way to code with AI. What are the ways in which we could be better?
English
740
46
1.4K
256K
CC Jiang
CC Jiang@iheycc·
惊喜的发现 Google @antigravity 还有逆天的能力🔥 之前用Cursor+Claude 生成 landing page,满满的 AI 味儿。于是想用 gemini 来打磨一下,直接切到 antigravity 想要它替换 icon 和图片。没想到它居然内置了 Gemini Image 工具 generate_image,直接生成了icon和hero图片啊啊!Gemini 降维打击啊
CC Jiang tweet mediaCC Jiang tweet mediaCC Jiang tweet mediaCC Jiang tweet media
中文
0
0
2
223
CC Jiang
CC Jiang@iheycc·
@bcherny "- Shift+enter for newlines" great feature
English
0
0
1
499
Boris Cherny
Boris Cherny@bcherny·
Claude Code 2.1.0 is officially out! claude update to get it We shipped: - Shift+enter for newlines, w/ zero setup - Add hooks directly to agents & skills frontmatter - Skills: forked context, hot reload, custom agent support, invoke with / - Agents no longer stop when you deny a tool use - Configure the model to respond in your language (eg. Japanese, Spanish) - Wildcard support for tool permissions: eg. Bash(*-h*) - /teleport your session to claude.ai/code - Overall: 1096 commits github.com/anthropics/cla… If you haven't tried Claude Code yet: code.claude.com/docs/en/setup Lmk what you think!
Boris Cherny tweet media
English
691
782
10.5K
897.5K
CC Jiang
CC Jiang@iheycc·
@JefferyTatsuya skill 不是文件系统目录吗?每个集成 skill 的 Agent 都要走沙盒模式,不能走传统 restapi ?需要 mock 一番目录操作的命令吗?
中文
1
0
1
1.2K
Jeffery Kaneda 金田達也
Jeffery Kaneda 金田達也@JefferyTatsuya·
以后Agent其实就10个以内: -> Claude、ChatGPT/codex、Gemini、豆包、 Qwen 差不多了 但Skill有多少?千万级吧 推特上有很多创业高手,要想想 -> 千万级的市场价值多大? -> 要不要投入进去? 现在有好几项事情是缺的: -> Skill Market -> Skill Editor -> Skill的图形交互 把门槛做低,每个人都可以用这些来提升他们的工作,那市场规模是多大? 这个机会是不是值得投入?
中文
7
7
59
24K
CC Jiang
CC Jiang@iheycc·
@zhang_benita 读AI论文,还是一个太小众的事情了。特别是今年Agent大火。做Agent应用的人力需求大,这些人并不需要都去研究论文的
中文
0
0
0
1K
张小珺 Xiaojun Zhang
张小珺 Xiaojun Zhang@zhang_benita·
一个月前,青池找到我,说他用了一年多的时间一篇一篇地啃完了200多篇AI论文,从开始全然不得要领,到后来逐渐入门——而他希望将他的论文探索之旅开源给大家。就这样,我们有了今天这集特别的节目。 他从200多篇论文中精选了36篇经典,4小时讲解,带你穿越AI变迁史。🤓🤓 (所有论文链接都在PPT中,shownotes末尾链接取用) xiaoyuzhoufm.com/episode/68ff9d…
中文
20
192
913
283K
CC Jiang
CC Jiang@iheycc·
@JefferyTatsuya 图片直接向量化,视觉token再向量化,这是不同的,模型需要重新训练
中文
0
0
2
1.4K
Jeffery Kaneda 金田達也
Jeffery Kaneda 金田達也@JefferyTatsuya·
突然想到,DeepSeek-OCR可能彻底颠覆基于向量召回的文档检索RAG。 它只要把文档视觉token向量化,提供距离计算。那就根本不需要去parse文档了,全部截屏为图片,存成token即可! 那样的话,图片检索也好,文档检索也好也要被快速的颠覆掉了!
中文
13
12
125
30.4K
小鱼·币币机 | Croath
说说我买房亏 300 万的故事。 最近极端行情,BTC/ETH/SOL 这些主流币也都上下颠簸,不少朋友都亏得不想说话。趁着行情一般,分享一下我买房亏钱的故事,大家看个开心就行。 2017 年我忽然就萌生了买房的想法,现在回想起来为什么要买房,也不为什么,到年纪了,看见都开始买房子,就也想买,完全不理性。很多时候人生的选择就是这样的,就忽然想买个属于自己的居所,有个稳定的生活,没什么太深的考虑。 在北京看了一圈房子之后,定下一套「老破小」,东四环五环中间,62 平米,二楼,局促的两居室,改成了一室一厅+一个窄窄的工作间,我刚入币圈时候的很多工作就是在这里完成的。 房子 442 万,首付 170 多万,加上税费、电器置办花销、稍微改一下老旧的卫生间,一共需要 200 万左右,但我手里只有 20 多万。家里资助了一些,又问老朋友们借了 100 多万,然后去两家消费贷借了一些就凑够了。注意,此时杠杆已经来到了 10 倍。 然后贷款 272 万,杠杆来到 20 倍。每个月还 16000 房贷,和 5000 多消费贷,一共 21000。和朋友借的钱没有约定什么时间还,在我的认知里没有约定什么时候还的钱就是当年农历过年前还的意思。当时月收入 60000 多到手 40000 多,足以还贷和生活,但是还不够还朋友的钱,刚入币圈在 EOS 上还亏了一大笔,只能做一些副业来填补。 开始倒卖化妆品、写脚本抢苹果手机,也帮各种项目做 advisor 写中英文白皮书一共写了 14 份,不到一年时间还上了问朋友借的 100 多万,后来也一次性还了消费贷。 不过也留下了健康问题,有一段时间每天睡眠时间 4 小时左右,有一次晕倒在大街上被路人救起,后来还完钱恢复作息之后身体就好转了,但是也开始患上焦虑症。 都还上这些之后,每个月房贷只剩 16000,但是我好像得了一场大病一样,没有心力去做太消耗的工作,就接不了什么活干了。这时候杠杆虽然降下来了,但是因为去上海创业做实体店(我已经退股,做电车改装改色还可以关注一下小特叔叔),收入也降低到 20000,算上房贷和上海租房+日常吃饭开销其实已经入不敷出。 此时焦虑症就更严重,但不是因为收入引起的,是短时间过量摄入咖啡心悸引发的 panic disorder(我知道币圈好几个 OG 都有这个毛病)。为了免得焦虑睡不着觉,就不再关注房价。这时候房子已经租出去了,房租只有 5000。房子本身每月净亏 11000。 2024 年当我再次关注北京房价的时候,发现房子已经跌得不像样了。当初 427 万买的房子,类似户型的挂牌价都只有 300 万了。我还纠结了一个多月卖还是不卖,最终还是选择卖,纠结的这两个月里,房价又急速下降。当时最触动我的是,夏天正热的时候我去链家门店去找中介,门店里全是电风扇,已经不开空调了,这时候我就知道市场极度冷清。 在和中介沟通过我想快速出售避免再度下跌的需求后,中介给出了更让我心凉的建议:挂牌 290,心理价位 260 即可成交,不等大家反应过来先跑。听到这个消息的我是很崩溃的,房价现在都不值我贷款的钱了。通过交叉验证之后我发现中介没有骗我,我在 app 上咨询类似户型的中介,他们都给出了 270 左右的心里最低价位。于是我以 290 定价和 260 最低心理价位在中介挂牌。 这个过程中中介一直在联络我,想让我把挂牌价降低到 260,心理价位降低到 240,好第一个跑。开始我没太积极回应,我想这可能是中介的话术吧,为了促成成交牺牲我的利益。而且还有一个心理因素在作祟,我想我都预期亏这么多了,就不要在我身上吸血了吧。 过了一个月一共也就五六个人看房,而且都没什么意向,我链接中介说:如果你能帮我 270 以上卖出去,我就私下给你 10 万红包,请你以此为动力多多推荐我的房子给客户。中介听了之后也没有很激动。 又过了一个月,还是没什么人看房,我回国再次拜访了一次中介,我说 10 万红包很多呀,你怎么没动力帮我推呢?中介一番话再次把我心情打入谷底:不是我不给你推,我已经努力给你推了,但是客户可选择的太多了,我的推荐不起什么作用。说着他打开 app,仅仅是他的店负责的范围以及周边 5km 内,就有 80 多套和我类似户型、类似大小的房子都在出售。我沉默之后接受了他之前的建议,把价格调整到 260 万,心理价位 240 万。 又过了一两个月,房子成交了,最终成交价 237 万。相比当初 442 万购买价格,亏了 205 万。而持有房子的几年间,我还了 150 万的房贷,这 170 万里只有 50 万本金,100 万是利息。所以总亏空是 205 万 + 100 万利息 = 305 万。 总贷款 272 万,还了 50 万本金,还有 222 万本金没还。 最终 237 万减掉 222 万,还剩 15 万,除去中介费和拆解还款等,还有来回处理的旅费等,最终落入我口袋还有 5 万不到。 八年时间,我的 26 到 34 岁,北京 442 万的房子,20 倍杠杆,亏损 305 万,最终到手 5 万。 后悔吗,不后悔,我从不后悔,只往前看。 最近我又看了看房价,还是继续阴跌,小区挂牌又下降了,看了这个决定还是做对了的,往后再涨到天上去,都和我无关了,每个月 16000 的负债我不想再背了。 现在的我,一身轻松,重新出发。
小鱼·币币机 | Croath tweet media小鱼·币币机 | Croath tweet media小鱼·币币机 | Croath tweet media小鱼·币币机 | Croath tweet media
中文
197
102
663
251.9K
CC Jiang
CC Jiang@iheycc·
@shao__meng 刚看完玩偶姐姐的长文,觉得meng大佬可以琢磨琢磨把这件事转换成流量🤭
中文
0
0
3
3.8K
meng shao
meng shao@shao__meng·
工作16年后,终于还是领到了第一笔「失业保险金」😂 是的,失业,被裁员,中年,男性,程序员。。好像掉进了一个俗套的危机
meng shao tweet media
中文
114
8
323
163.8K
CC Jiang
CC Jiang@iheycc·
@dotey context, not control。张一鸣的远见和理念还值得吹
中文
0
0
2
576
宝玉
宝玉@dotey·
来自 Vercel 老板:现在大家逐渐意识到:给 AI 模型提供越清晰、越丰富的背景信息(context),它的表现就越出色。 其实,这个道理和管理一个企业、带领一个团队是一模一样的——要想组织运转得更顺畅,核心秘诀就在于最大限度地提升信息透明度,让所有成员都能掌握更多、更丰富的背景和上下文。 在企业中,工程师和设计师并不只是简单地敲代码或画图的「工具人」。他们的真正使命是:帮企业解决具体的业务问题。 在 Vercel,我们的团队发现:尽可能地保持公开透明、提倡“公开建设(build in public)”的文化,能极大提升员工的自主性(也就是大家常说的“agency”,一种掌控感😄)。团队成员在工作中拥有了更多的自由度和自主权,做起事来也更加高效、更加有成就感。 也正是因为这种高度透明的环境,我们经常会看到一些激动人心的故事。比如:我们曾经有一位实习生,主动发现并提出了一个技术改进方案。这一方案直接提升了我们基础设施的效率,为客户节省了数百万美元的成本(具体案例可以看原推链接:Vercel 博客 - 实习生如何优化 CDN,节省巨额开支)。
Guillermo Rauch@rauchg

It's now well understood that the better the context, the better the performance of AI models. But it's the same lesson as scaling human organizations. Maximize and enrich context. Engineers and designers are not code & pixels pushers. They solve business problems. At Vercel we've found that maximizing transparency and a 'build in public' ethos increases autonomy (agency 😁) and makes work more fulfilling and impactful. This is incidentally how we end up with stories of interns engineering infrastructure improvements that save millions upon millions of dollars for our customers: vercel.com/blog/cdn-reque…

中文
21
42
256
128.5K
CC Jiang
CC Jiang@iheycc·
最近 hacker news 上一个关于 Vibe engineering 的讨论非常火热,帖子 700+ 评论,对LLM 辅助编程的效率和可靠性,对软件开发流程变革的得与失,对开发者职业发展的忧虑,都有深入的辩论。读完后还能感受到不同群里的真实感受和情绪,值得仔细看看 帖子的原文是作者介绍 Vibe engineering 的经验,表达了 Vibe code 可以显著的提升生产力,并且通过 Vibe Code 方式生成了数十个小工具,挂在个人网站上(这个思路不错)。 评论中的主要讨论点是: - 是效率重要,还是可靠性重要? 认为“效率重要”的人,通常是那些善于构建流程、具备系统架构经验的资深开发者。他们善于利用工具突破个人生产力的天花板,将精力集中于更高层次的设计和规划。 而认为“可靠性重要”的人,则包含了众多被AI的“不靠谱”挫败过的实践者。代表了那些**将代码的可靠性、简洁性和可维护性置于首位**的 “工匠型开发者”。 - 谈到像技术管理者那样管理 LLM/Agent 时 拥抱工作流变革的人享受从 “码农到指挥家的角色转变”。 而对立面的开发者则认为 “高强度的上下文切换”,导致 “精神疲惫”、“审查疲劳”、“实际编码和设计能力的退化”。 - 在开发者职业发展方面 资深开发者认为,AI接管的是“编码”的执行部分,而`需求分析、系统架构、技术选型和复杂问题解决`等“工程”核心价值反而被凸显。 而反方包含了大量将编程视为“手艺”的人,害怕的是`职业认同感的丧失`。 但都认可初级开发者的成长会更加严峻。
CC Jiang tweet media
中文
2
0
1
140
CC Jiang
CC Jiang@iheycc·
相比于 x,hn 和 reddit 的重点是评论,经常可以看到深入的讨论(辩论),仔细读下来往往能收获意想不到的认知。现在刷 hn 和 reddit 比 x 更多了 hn 和 reddit 评论多带来的一个问题就是刷起来太费时,这时候非常需要一个摘要工具,我也做了一个。实际使用几个月感受下来,AI 摘要也只是快速形成大纲、抓住重点,但会丢失这些人的真实背景故事和情绪感受。 如果能花时间过一遍原文评论,就可以感受更深、找到共鸣。结合个人的经验和关注点差异,也许还能灵光乍现发现产品机会 chromewebstore.google.com/detail/plify-a…
中文
0
0
0
58
CC Jiang
CC Jiang@iheycc·
@iamcheyan 这个活有人在国内尝试过,AI 技术可能是最不重要的了,重要的是:怎么找到合适的老人、怎么与老人多次访谈和沟通,卖给谁怎么卖如何收回成本
中文
0
0
2
331
徹言
徹言@iamcheyan·
找工作的这段时间,一直在研究日本的出版体系。 想看看能不能,在日本创业。 做个人的出版品牌。 方向是: 给日本的老人定制,作人物传记,记录TA一生的故事。 0 2019年,参与了演员于月仙(谢大脚)个人传记的制作。 两年后,她回老家赤峰参加活动时,出了车祸离世。 那本书,成了她人生的全部记录。 从那以后,我常常在想—— 如果一个人的一生,能被好好记录下来, 那是不是,就不会被时间彻底带走? 后来大狗熊老师也说,他父亲有写过些东西,想看看能不能出版。 我建议他在淘宝上找快印店,印个小册子。 但严格来说,自己印书在中国国内,算非法出版物。 1 不过在日本做出版,比在中国简单太多了。 没有书号制度的束缚, 只要申请ISBN,就能独立出版、印刷、销售。 这意味着,个人也能成为出版社。 只要有自己觉得好的内容,就能出书。 书的售价也贵,控制好印量,这个事就能做。 2 我查了下。 日本早在1980年代就有“自分史(じぶんし)”概念, NHK、地方自治体、公民馆都鼓励老人写自己的故事。 但问题是: 那些机构做得太死板了。 流程复杂、价格高、设计落后、毫无温度。 他们仍停留在昭和时代的版式和思路。 没啥效率,也很难赚到钱。 3 但这是个老龄化严重的社会。 有着巨大的潜在需求。 日本65岁以上人口占比超过29%, 几乎每三个日本人里,就有一个是老人。 他们的一生经历了战后、泡沫、灾害与变迁, 却常常没机会把这些记下来。 估计很多人会说: 想写,但不知道从哪里开始。 他们都有故事,却没有人记录。 所以如果帮他们做了,没准他们自己就把成本负担了。 如果还有子嗣,那应该还能再卖一批书。 情感痛点更现实 很多子女在城市工作, 和父母聚少离多,甚至有愧疚感。 如果能为父母做一本书。 一本记录他们人生的纪念册, 那是一种带有温度的赎罪。 情感补偿,是最稳定的市场。 4 以前这种想法只能是想想,毕竟「采访+人工转录」是个力气活。 产量也上不去。 但现在有了AI,可行性就高很多。 我的想法是这样: 采访(AI辅助提问) → 录音 → Whisper转录 → GPT改写成优美的日语 → 设计排版(A5/B5格式) → 印刷几本 → 家人分享或留念 整个流程,我一个人就能完成。 当然真要去采访的话,肯定得找一个元日本人去才行。 一方面是他日语够好。 另一方面,是本地族群有天然的信任感。 5 潜在客户画像 60~80岁,喜欢聊天,有退休金的老人 40~60岁,希望为父母留纪念的子女 学校、社区、护理机构,估计也会想为一群人做集体传记。 你说过的话,会变成一本书。 未来甚至可以发展成AI采访+排版服务, 让每个人的故事,都能轻易地被保存下来。 不光是书本身,衍生出来的有声和影视版权也是可以卖钱的。 6 我知道点子可能会被抄。 但没关系。 说出来就不怕被抄。 点子不值钱,执行力和对好内容的判断力才值钱。 只要有人在做,这件事就有意义。 看看未来几年,有没有可能一边学日语。 一边工作,一边把这个事情做起来。
徹言 tweet media
徹言@iamcheyan

@lcayu @BabatoDon 那如果我在日本搞出版,写书的话,就需要了吧?

中文
104
27
373
92.2K