Mathew Shen
773 posts


再熬几个月吧,不行就辞职打包回国吧。我发现人生其实无所谓什么成功失败,活着、开心最重要。


SentrySearch:用自然语言搜索视频内容的开源工具 在几个小时的行车记录仪视频里找到"一辆红色卡车闯了停牌"那个画面,SentrySearch 能让你像搜文字一样搜视频,输入描述,直接导出对应片段。 这个开源命令行工具的原理并不复杂:把视频切成带重叠的片段,用 Google Gemini Embedding API 或本地的 Qwen3-VL 模型把每个片段编码成向量,存进本地向量数据库 ChromaDB。搜索时,文字查询被编码到同一个向量空间里做匹配,命中的片段自动从原文件中裁剪出来。 关键在于,整个过程没有转录、没有逐帧生成文字描述,视频像素直接和文字查询在向量层面比较。这是 Gemini Embedding 2 和 Qwen3-VL-Embedding 这类多模态嵌入模型带来的能力,让对海量视频的语义搜索变得可行。 想用云端 API,一小时视频的索引成本大约 2.84 美元。想完全离线也行,装上本地 Qwen3-VL 模型就不需要任何 API 密钥,24GB 以上显存或内存的 Mac 和 NVIDIA GPU 都能跑。它还专门做了特斯拉行车记录仪的适配,能在裁剪出来的片段上叠加车速、GPS 位置和时间信息。 还有 Skill 可以用:clawhub.ai/ssrajadh/natur… 项目地址:github.com/ssrajadh/sentr…

(感觉以后可以众包修复 ai 没能很好解决的问题,因为岗位没那么多了,闲着也是闲着😢

pi-mono 作者新的博客值得一读。值得读的原因很多。其一是这篇文章明显是作者自己真实的体验,没有其他立场(这很重要);其二是这篇文章用了5个shit和9个fuck,可以切身感受下老哥的心态:)








