Han Cheng e/acc

1.9K posts

Han Cheng e/acc banner
Han Cheng e/acc

Han Cheng e/acc

@ashfold

a small startup contributor. doing A.I. things and collaboration tools .

Shanghai शामिल हुए Ekim 2009
2.5K फ़ॉलोइंग858 फ़ॉलोवर्स
Frad
Frad@FradSer·
怀疑飞书的人不会写 skills,用一个的统一的入口然后引用这些子功能不好吗? github.com/larksuite/cli/…
Frad tweet media
中文
11
2
33
15.4K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
you can use chatgpt in china.
Han Cheng e/acc tweet mediaHan Cheng e/acc tweet media
English
0
0
0
102
Han Cheng e/acc रीट्वीट किया
Claude
Claude@claudeai·
Introducing Claude Opus 4.7, our most capable Opus model yet. It handles long-running tasks with more rigor, follows instructions more precisely, and verifies its own outputs before reporting back. You can hand off your hardest work with less supervision.
Claude tweet media
English
3.8K
8K
63.7K
6.5M
艾略特
艾略特@elliotchen100·
@ashfold 感谢测试哈,我们尽快修掉,另外可以投简历的👀
中文
1
0
0
119
艾略特
艾略特@elliotchen100·
非常激动宣布,我们打磨了很久很久的更新,她终于来了,不仅有产品,还有 Methods,Benchmark,Usecases 和官网等。 具体更新: 1. EverOS - 新思路,一站式 Agent 创建,测试和集成的开源库,其中包含了多个 Methods,多个 Benchmarks 和很多种 Usecases。 主打一站式服务,用户可用现成的 Methods 魔改 Usecases 成自己的 Agents,然后再用 Benchmark 对其去测试,提升和迭代。 一站式全能王 ,很方便。 2. 新 Benchmark - EvoAgentBench 开源,可以用来测试你自己配置的 OpenClaw Agent,Hermes Agent 和任何 Agent。 当有了中立 benchmark 测试的时候,方才知道谁是好龙虾。 3. 官网更新 - 新版官网,愿景和感觉,配色和调性,品味和新意,拉爆全场,外加新场景,新产品,新交互。 一个字:夯。 4. Academy - 我们是一个学识很强的团队,所以这个板块以后会是我们发过的所有模型,论文,methods 和benchmark 相关。 学就完了。 5. EverMe - C 端的产品,在来的路上,现在已经放出小彩蛋,可以期待期待。 新面貌,新风向,新动力,依然开源。 github.com/EverMind-AI/Ev…
艾略特@elliotchen100

稍微剧透一下,@EverMind 马上会推出一个 Benchmark,可测试 Agent 的能力。 诸位的 OpenClaw 和 Hermes Agent 都可以测测看。

中文
10
10
112
24.7K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
@oran_ge 🧐其实有个机会是coding agency。新时代的agents 外包🤣
中文
0
0
3
1.2K
Orange AI
Orange AI@oran_ge·
最近一个神奇的矛盾。 大公司裁员计划越来越多,被裁员工在选择下一份工作时,优先还是去找其他大中公司,不愿意去小公司。 与此同时小公司招聘还是很难。 OPC 似乎成了唯一的 easy answer,那又 easy 得不可思议。 预感到在混沌之中蕴育着下一个撮合 service。
中文
59
2
147
58.9K
Yuu💖
Yuu💖@QuantumTransf·
@ashfold 我们已经接近 80% 了
中文
1
0
0
65
Yuu💖
Yuu💖@QuantumTransf·
最近利用 terminal bench 跑 task 等结果的时间,看完了硅谷第一季 这真的是一个很传奇的故事,值得每个想要创造出非同反响的事物的人去看 其实最开始并不知道自己为什么会那么喜欢 vfs 这个概念,不过我今天突然意识到,或许这个种子在多年前看到剧中基于 middle out 的去中心化文件系统就已经埋下…
Yuu💖 tweet mediaYuu💖 tweet mediaYuu💖 tweet mediaYuu💖 tweet media
中文
2
0
19
1.2K
Dinah
Dinah@dinah_zhang·
为什么国外大厂可以制定标准,国内大厂不能
中文
17
0
17
7.2K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
@wey_gu 其实如果愿意,人均200刀,8人团队团一个h200 x 8做glm5.1部署还是很划算的。
中文
1
0
0
51
Wey Gu 古思为
Wey Gu 古思为@wey_gu·
@ashfold 嗯嗯,这是一个人的,稍微 team pool 一下,不过现在另一个前提是自部署没有 frontier 模型
中文
1
0
1
139
枯白啃设计
枯白啃设计@Kubai087·
送四个图标~ 给有产品的有缘人
枯白啃设计 tweet media
中文
26
2
103
12.7K
Han Cheng e/acc रीट्वीट किया
Azalia Mirhoseini
Azalia Mirhoseini@Azaliamirh·
Turns out we can get SOTA on agentic benchmarks with a simple test-time method! Excited to introduce LLM-as-a-Verifier. Test-time scaling is effective, but picking the "winner" among many candidates is the bottleneck. We introduce a way to extract a cleaner signal from the model: 1️⃣ Ask the LLM to rank results on a scale of 1-k 2️⃣ Use the log-probs of those rank tokens to calculate an expected score You can get a verification score in a single sampling pass per candidate pair. Blog: llm-as-a-verifier.notion.site Code: llm-as-a-verifier.github.io Led by @jackyk02 and in collaboration with a great team: @shululi256, @pranav_atreya, @liu_yuejiang, @drmapavone, @istoica05
Azalia Mirhoseini tweet media
English
33
113
975
111.4K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
@RyanLeeMiniMax If you want to operate as a commercial host, you need to pay Minimax to obtain the proper license. The amount you have to pay depends entirely on Minimax’s judgment or market strategy. Am I understanding that correctly?
English
0
0
0
99
yishan
yishan@linyishan·
🚀🚀🚀MiniMax-M2.7 正式开源 不过,一般人也无力部署,看看这核心参数🤣 总参数量:230B 激活参数:每处理一个 token 激活 10B 参数 网络架构: ➤ 62 层Transformer结构 ➤ 256 个局部专家,每个token同时激活 8 个专家 ➤ 上下文长度原生支持 204.8K tokens 显存要求严苛: ➤ 模型权重:220GB(FP16/BF16 精度下) ➤ KV缓存 :每100万tokens 约需240GB显存 推荐配置如下:
yishan tweet media
中文
6
2
31
11.8K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
@yangyi 🤣不要再贴这种没有思考的水结果了。
中文
0
0
2
142
Yangyi
Yangyi@yangyi·
昨天参加GEO大会,向阳提到了一个问题,目前做东西已经不是瓶颈了,那么如何去判断做什么? 我让牛马AI给我构建了一个判断过滤器 大家可以用这11个判断标准来去评估一件事情是否值得投入尝试
Yangyi tweet media
中文
2
3
15
3.8K