Usaki

4 posts

Usaki banner
Usaki

Usaki

@Zeadust

Katılım Ekim 2023
205 Takip Edilen0 Takipçiler
Usaki
Usaki@Zeadust·
@IndieDevHailey 都不是开源项目,怎么算得上基建。爬虫工具从来都不缺,缺的是能应对大陆网站的变态反爬策略的爬虫。
中文
1
0
1
510
开发者Hailey
开发者Hailey@IndieDevHailey·
发现一个被低估的 AI 基建:XCrawl XCrawl是一个网页抓取和数据采集的API,它让 Agent 拥有了真正意义上的"上网能力"。 它提供几个核心能力: - Scrape:抓单个页面 - Crawl:批量跑整个站点 - Map:摸清网站结构 - Search:拿搜索结果 从单页到整站,从搜索到整理,一步打通。 用下来最直接的感受: - 不给一堆原始HTML,直接输出Markdown、JSON、摘要、链接 - 基本不用二次清洗,拿来就能用 - 动态页面(JS渲染)也能处理 - 地区、语言、结构化提取都支持 - 成功率稳定 如果你在用OpenClaw,会发现很多Agent卡住不是因为模型不行,而是数据不好用。 XCrawl正好解决这块——让Agent自己搜、抓、读,继续执行下去。OpenClaw负责决策,XCrawl负责把信息接进来。 能落地的场景: - 电商选品、竞品整理 - 招聘、社交、新闻信息汇总 - SEO关键词跟踪 - 自动整理资料、生成报告 原本需要人工收集的数据,现在跑个流程就行。 它遵循公开网页+合规采集的原则,自带规则约束。 这不是更强的爬虫,而是把"获取数据"变成可以直接接进Agent的能力。 做Agent或自动化,XCrawl 是一个趁手的工具。
中文
9
51
203
18.7K
黄赟
黄赟@huangyun_122·
我隐约觉得,Claude Code 出编程方案,写入 plans.txt, 接下来每一个子任务,交给 Codex 去处理,做完打钩,是最优解 你们觉得呢?
中文
58
11
183
57.7K
Usaki
Usaki@Zeadust·
@abskoop 小红书扫码登录秒被封🤣
中文
0
0
0
184
ahhhhfs
ahhhhfs@abskoop·
用 BrowserWing 抓取小红书/知乎内容只需一句话!再也不用写爬虫了🐍 🧠 BrowserWing:让 AI 轻松自动执行网页任务,不再写复杂代码 🧩 脚本录制 + 回放 + 可视化编辑,网页自动化不再靠手搓流程 👉ahhhhfs.com/78471/ #开源 #BrowserWing #AIAgent
中文
9
77
327
34.3K