Han Cheng e/acc

1.9K posts

Han Cheng e/acc

@ashfold

a small startup contributor. doing A.I. things and collaboration tools .

Shanghai 参加日 Ekim 2009

2.5K フォロー中860 フォロワー

Han Cheng e/acc@ashfold·18h

@elliotchen100 🤣我离你们很近哈哈哈哈哈

中文

艾略特@elliotchen100·19h

@ashfold 感谢测试哈，我们尽快修掉，另外可以投简历的👀

中文

103

艾略特@elliotchen100·1d

非常激动宣布，我们打磨了很久很久的更新，她终于来了，不仅有产品，还有 Methods，Benchmark，Usecases 和官网等。具体更新： 1. EverOS - 新思路，一站式 Agent 创建，测试和集成的开源库，其中包含了多个 Methods，多个 Benchmarks 和很多种 Usecases。主打一站式服务，用户可用现成的 Methods 魔改 Usecases 成自己的 Agents，然后再用 Benchmark 对其去测试，提升和迭代。一站式全能王，很方便。 2. 新 Benchmark - EvoAgentBench 开源，可以用来测试你自己配置的 OpenClaw Agent，Hermes Agent 和任何 Agent。当有了中立 benchmark 测试的时候，方才知道谁是好龙虾。 3. 官网更新 - 新版官网，愿景和感觉，配色和调性，品味和新意，拉爆全场，外加新场景，新产品，新交互。一个字：夯。 4. Academy - 我们是一个学识很强的团队，所以这个板块以后会是我们发过的所有模型，论文，methods 和benchmark 相关。学就完了。 5. EverMe - C 端的产品，在来的路上，现在已经放出小彩蛋，可以期待期待。新面貌，新风向，新动力，依然开源。 github.com/EverMind-AI/Ev…

艾略特@elliotchen100

稍微剧透一下，@EverMind 马上会推出一个 Benchmark，可测试 Agent 的能力。诸位的 OpenClaw 和 Hermes Agent 都可以测测看。

中文

108

23.8K

Han Cheng e/acc@ashfold·22h

@oran_ge 🧐其实有个机会是coding agency。新时代的agents 外包🤣

中文

1.2K

Orange AI@oran_ge·23h

最近一个神奇的矛盾。大公司裁员计划越来越多，被裁员工在选择下一份工作时，优先还是去找其他大中公司，不愿意去小公司。与此同时小公司招聘还是很难。 OPC 似乎成了唯一的 easy answer，那又 easy 得不可思议。预感到在混沌之中蕴育着下一个撮合 service。

中文

137

53.4K

Han Cheng e/acc@ashfold·1d

@QuantumTransf base model是啥？opus?

日本語

Yuu💖@QuantumTransf·1d

@ashfold 我们已经接近 80% 了

中文

Yuu💖@QuantumTransf·1d

最近利用 terminal bench 跑 task 等结果的时间，看完了硅谷第一季这真的是一个很传奇的故事，值得每个想要创造出非同反响的事物的人去看其实最开始并不知道自己为什么会那么喜欢 vfs 这个概念，不过我今天突然意识到，或许这个种子在多年前看到剧中基于 middle out 的去中心化文件系统就已经埋下…

中文

1.1K

Han Cheng e/acc@ashfold·1d

@dinah_zhang 因为做成标准的成本太高了（没有耐心）

中文

403

Dinah@dinah_zhang·1d

为什么国外大厂可以制定标准，国内大厂不能

中文

6.9K

Han Cheng e/acc がリツイート

SagaSu@sujingshen·1d

x.com/i/article/2043…

ZXX

106

308

1.5K

293K

Han Cheng e/acc@ashfold·1d

@elliotchen100

QME

Han Cheng e/acc@ashfold·1d

@elliotchen100 招个前端吧

中文

235

Han Cheng e/acc@ashfold·1d

@elliotchen100

QME

Han Cheng e/acc@ashfold·1d

@wey_gu 其实如果愿意，人均200刀，8人团队团一个h200 x 8做glm5.1部署还是很划算的。

中文

Wey Gu 古思为@wey_gu·1d

@ashfold 嗯嗯，这是一个人的，稍微 team pool 一下，不过现在另一个前提是自部署没有 frontier 模型

中文

139

Wey Gu 古思为@wey_gu·2d

认知更新了，我还真没对这个数字敏感

Eric Zhang@ekzhang1

$200/month is enough to buy an H100 GPU for 6 hours every workday

中文

24.9K

Han Cheng e/acc@ashfold·1d

@Kubai087 师傅，我想要B

中文

257

枯白啃设计@Kubai087·1d

送四个图标～给有产品的有缘人

中文

103

12.6K

Han Cheng e/acc がリツイート

Azalia Mirhoseini@Azaliamirh·2d

Turns out we can get SOTA on agentic benchmarks with a simple test-time method! Excited to introduce LLM-as-a-Verifier. Test-time scaling is effective, but picking the "winner" among many candidates is the bottleneck. We introduce a way to extract a cleaner signal from the model: 1️⃣ Ask the LLM to rank results on a scale of 1-k 2️⃣ Use the log-probs of those rank tokens to calculate an expected score You can get a verification score in a single sampling pass per candidate pair. Blog: llm-as-a-verifier.notion.site Code: llm-as-a-verifier.github.io Led by @jackyk02 and in collaboration with a great team: @shululi256, @pranav_atreya, @liu_yuejiang, @drmapavone, @istoica05

English

112

971

109.9K

Han Cheng e/acc@ashfold·2d

@RyanLeeMiniMax If you want to operate as a commercial host, you need to pay Minimax to obtain the proper license. The amount you have to pay depends entirely on Minimax’s judgment or market strategy. Am I understanding that correctly?

English

RyanLee@RyanLeeMiniMax·2d

x.com/i/article/2043…

ZXX

131

1.1K

195.5K

Han Cheng e/acc@ashfold·2d

@linyishan 你这个上下文长度是不对的。

中文

147

yishan@linyishan·3d

🚀🚀🚀MiniMax-M2.7 正式开源不过，一般人也无力部署，看看这核心参数🤣 总参数量：230B 激活参数：每处理一个 token 激活 10B 参数网络架构： ➤ 62 层Transformer结构 ➤ 256 个局部专家，每个token同时激活 8 个专家 ➤ 上下文长度原生支持 204.8K tokens 显存要求严苛： ➤ 模型权重：220GB（FP16/BF16 精度下） ➤ KV缓存：每100万tokens 约需240GB显存推荐配置如下：