M007

113 posts

M007 banner
M007

M007

@M3744918

United States Katılım Eylül 2013
615 Takip Edilen34 Takipçiler
M007
M007@M3744918·
@python_xxt 反过来想想是不是只有有钱人家的孩子能过面试…
中文
0
0
146
13.7K
Robinson · 鲁棒逊
Robinson · 鲁棒逊@python_xxt·
头疼 为什么我招人容易招到有钱人家的孩子… 招了几个人 一个刚毕业没两年,开着宝马来上班 一个支付宝是黑色的 一个日常穿 鸟家的衣服 头疼……
中文
172
20
848
608.5K
M007 retweetledi
AIGCLINK
AIGCLINK@aigclink·
一个可视化的爬虫平台:Kspider 以流程图的方式配置爬虫,无需代码即可实现爬虫流程 Kspider提供了常用功能,也可自定义扩展 支持 xpath 和 css 选择器 支持选择器提取、正则提取、json 提取等 支持 Cookie 自动管理 支持抓取由 js 动态渲染的页面 支持代理 支持多数据源 内置常用的字符串、日期、文件、加解密等函数 支持结果保存至多目的地(数据库、csv 文件等) 支持插件扩展(自定义执行器,自定义函数等) 支持任务日志 支持爬虫可视化调试 支持同步、异步执行 支持插件扩展 支持自定义 JS 脚本引擎 支持产物下载 github:github.com/kkangert/kspid… #爬虫 #Kspider
AIGCLINK tweet media
AIGCLINK@aigclink

6款可用于LLMs的爬虫工具/方案: 最近爬虫工具很多,整理了一个工具集合 1、Crawl4AI Crawl4AI可将语义标记的数据块提取成 JSON 格式,提供干净的 HTML 和 Markdown 文件,用于 RAG(检索增强生成)、微调以及 AI 聊天机器人的开发 Crawl4AI提供爬取功能和多 URL 支持,可轻松集成为库或服务器,并提供了 Docker 容器来简化设置 特点: 1、高效且提取有价值数据 2、适合LLM格式(JSON、清理后的 HTML、Markdown) 3、支持同时多个 URL 4、用 ALT 替换媒体标签 github:github.com/unclecode/craw… 2、FireCrawl FireCrawl能够抓取任何网站的所有可访问子页面,无需站点地图,并将内容转换为干净的Markdown格式 FireCrawl 与传统的网页爬虫工具不同,即使网站使用JavaScript动态生成其内容,FireCrawl 也能有效的进行抓取 此外,还提供了易于使用的API,使开发者能够通过简单的API调用实现内容的爬取和转换 github:github.com/mendableai/fir… 3、Scrapegraph-ai Scrapegraph-ai使用 LLM 和直接图形逻辑为网站和本地文档(XML、HTML、JSON 等)创建抓取流程 用户只需要指定想要提取的信息类型,ScrapeGraphAI 库就能自动执行数据抓取的任务 github:github.com/VinciGit00/Scr… 4、Markdowner 一个快速的开源工具,可以将网站转换为 Markdown 数据 支持自动爬虫、详细模式、javascript网站等 易于扩展和自托管,运行成本低 github:github.com/dhravya/markdo… 5、Jina Reader Jina Reader可以将任何 URL 转化为 LLM 所需Markdown格式 可以针对这些内容集成不同的模型,支持 API github:github.com/jina-ai/reader 6、Skyvern 支持自然语言进行网页导航、过时/电商网站的数据爬取、填写表单等复杂多步操作 支持绕过 CAPTCHA/Authentication 等验证操作 支持API 调用/Debug 模式 github:github.com/Skyvern-AI/sky… #Crawl4AI #FireCrawl #Scrapegraphai #Markdowner #JinaReader #Skyvern

中文
2
109
351
30.2K
M007 retweetledi
AIGCLINK
AIGCLINK@aigclink·
一个集成了Claude 3.5 Sonnet的VSCode插件:Claude Dev,大大增强了编程/开发体验 Claude Dev可以分解和处理复杂任务,具备读写文件、从头创建整个项目以及执行终端命令(授予许可后)的能力 可以执行包括代码生成、项目管理、自动化脚本执行、文件操作、交互式开发辅助、跟踪 API 使用情况、显示代码差异、流式显示命令执行输出等 github:github.com/saoudrizwan/cl… 完成一个小游戏,从想法到成品只需要几秒钟 #Claude
中文
6
81
257
26.8K
M007 retweetledi
chaosflutter
chaosflutter@chaosflutt28952·
换了新 Mac,除了常规的必装软件,比如 Homebrew, VSCode 之类,我发现自己离不开的是这些软件: 梯子:Clash Verge; 个人知识库:Obsidian; 终端:Warp; 项目管理:Linear; 分屏:Rectangle; 输入法自动切换:Input Source Pro; 容器运行:OrbStack; Code Playground:Replit; 设计:Figma。
chaosflutter tweet media
中文
44
294
1.5K
158.5K
M007 retweetledi
米开朗基杨
米开朗基杨@CarsonYangk8s·
🔥这是云原生界最惊天动地的一场阴谋,很少有人能看懂🤣 1/
米开朗基杨 tweet media米开朗基杨 tweet media米开朗基杨 tweet media米开朗基杨 tweet media
中文
9
41
300
163.9K
M007 retweetledi
自在夺造化
自在夺造化@Danielw19410·
今天对芒格的这句“我这辈子遇到的聪明人,没有不每天阅读的”又多了一点理解。 看完了一位美国年销售额过百亿美金零售企业创始人的回忆录,他给出了几本在某个方面对其有启发的书。(有一本至今都没中文版)
中文
6
127
552
136.3K
M007 retweetledi
Geek
Geek@geekbb·
my-tv 电视直播软件迅速冲上 GitHub Trending 了,刚刚在 Chromecast 试了试,可以的,换台很快且无卡顿,正好春节用得上,转给没有订 IPTV 和有线电视的朋友。 github.com/lizongying/my-…
Geek tweet media
中文
87
505
2.1K
583.6K
M007 retweetledi
AI Will
AI Will@FinanceYF5·
Chase Lean已经使用 DALL-E 3 生成了 10,000 多张图像。 他的 Logo Creator GPT 也是 DALL-E 下排名第一的 GPT。 以下是@chaseleantj认为10 个最有用的 DALL-E 提示技巧:
AI Will tweet media
中文
7
57
223
58K
M007 retweetledi
Bitturing
Bitturing@Bitturing·
强迫症的 Mac 设置指南:OCD’s Guide to Setting up Mac Github 4.1K 星 包括设置优化和实用的Mac软件工具等等 github.com/macdao/ocds-gu…
Bitturing tweet media
中文
9
60
190
20.8K
M007 retweetledi
黄赟
黄赟@huangyun_122·
卧槽, 槽槽槽 !! 这次使用 Bert Vits2 来炼雷军雷总的声音,已经完全一模一样,简直真人出镜了。 都快把我自己给吓死了。雷老板要看到了,务必留情,别告我啊,哈哈哈哈哈 整理了一篇如何训练的文章,纯小白操作。走过路过,别错过哈。一定牢记,别犯法,犯法了也别说,是从我这里学的,哈哈哈哈哈 mp.weixin.qq.com/s/0xj4qxJSeJ6X…
中文
81
343
1.3K
396.4K
M007 retweetledi
Yukino Song
Yukino Song@ClassicOldSong·
Git GUI 真的是居家办公必备,各种错综复杂的git branch全都能轻松理顺,还不用担心敲错命令毁掉项目 各种 GUI 里我个人首推 Git Tower ,虽然付费但是我用过最直观也最好用的 GUI 客户端,对生产力的解放完全配得上订阅价格,支持 macOS 和 Windows 其次是 Sublime Merge ,轻量但依旧好用,老牌 Sublime Text 作者出品,相比 Tower 来说更 geek 一些,优点是支持 Linux 然后是免费的 Source Tree ,久经沙场,但相比上述两个选项来说,界面组织逻辑相对落后,而且性能相对较差 绝对不推荐的是 GitFox ,虽然长得像 Tower 而且包含在了 Setapp 订阅里,但这个 app 在我第一次试用的时候就搞错了需要 discard 的文件而导致我写了半天的内容丢失,因此坚决不推荐 我个人真的非常喜欢 Tower ,非常推荐,在此奉上 ref link 一枚,通过此链接购买可以获取 10% 的优惠: git-tower.com/p/refer-a-frie…
中文
51
21
143
48.3K
M007 retweetledi
𝗦𝘁𝗲𝘃𝗲 𝕏
𝗦𝘁𝗲𝘃𝗲 𝕏@st7evechou·
Surge 真的太稳了。配置完基本没关过😼
𝗦𝘁𝗲𝘃𝗲 𝕏 tweet media
中文
111
195
1.6K
740.3K
M007 retweetledi
老白(每日干货分享✊)
帮你搞钱的36部纪录片‼️熬夜都要看完🎬 共 6 幅图🖼️ 1.
老白(每日干货分享✊) tweet media
中文
55
503
1.4K
189.7K
M007 retweetledi
秋风_irwin
秋风_irwin@qiufenghyf·
Stripe 和 水星银行都申请下来了。应之前的要求,给大家分享一下 193 刀 注册美国公司 + EIN + Stripe + 水星银行一整套流程,全流程大约 23天左右。
中文
74
373
1.6K
580.2K
M007 retweetledi
AI Will
AI Will@FinanceYF5·
《AI创业公司的机会,和AI数据简析》 我在深思圈的线上分享。 话题涉及: -创业机会分析图, -用户价值简单估算, -AI的钱被谁赚走了, -国内大语言模型进展, -AI二级公司涨幅, -VC眼里的大机会和小机会(平台算机会,工具不太算机会), -出海公司流量分析, -垂类赛道简析, -GPTs数据简析
中文
6
70
224
57K
M007 retweetledi
OpenCSG
OpenCSG@OpenCsg·
魔法打败魔法,Andrej Karpathy大神一小时大模型入门课程速学 本文讲解如何用大模型帮我们快速整理超长视频内容,快速高效学习👍🏻 mp.weixin.qq.com/s/fPhlgeaI7LcA…
OpenCSG tweet media
中文
0
15
28
3.2K