Han Cheng e/acc

1.9K posts

Han Cheng e/acc banner
Han Cheng e/acc

Han Cheng e/acc

@ashfold

a small startup contributor. doing A.I. things and collaboration tools .

Shanghai 参加日 Ekim 2009
2.5K フォロー中860 フォロワー
艾略特
艾略特@elliotchen100·
@ashfold 感谢测试哈,我们尽快修掉,另外可以投简历的👀
中文
1
0
0
103
艾略特
艾略特@elliotchen100·
非常激动宣布,我们打磨了很久很久的更新,她终于来了,不仅有产品,还有 Methods,Benchmark,Usecases 和官网等。 具体更新: 1. EverOS - 新思路,一站式 Agent 创建,测试和集成的开源库,其中包含了多个 Methods,多个 Benchmarks 和很多种 Usecases。 主打一站式服务,用户可用现成的 Methods 魔改 Usecases 成自己的 Agents,然后再用 Benchmark 对其去测试,提升和迭代。 一站式全能王 ,很方便。 2. 新 Benchmark - EvoAgentBench 开源,可以用来测试你自己配置的 OpenClaw Agent,Hermes Agent 和任何 Agent。 当有了中立 benchmark 测试的时候,方才知道谁是好龙虾。 3. 官网更新 - 新版官网,愿景和感觉,配色和调性,品味和新意,拉爆全场,外加新场景,新产品,新交互。 一个字:夯。 4. Academy - 我们是一个学识很强的团队,所以这个板块以后会是我们发过的所有模型,论文,methods 和benchmark 相关。 学就完了。 5. EverMe - C 端的产品,在来的路上,现在已经放出小彩蛋,可以期待期待。 新面貌,新风向,新动力,依然开源。 github.com/EverMind-AI/Ev…
艾略特@elliotchen100

稍微剧透一下,@EverMind 马上会推出一个 Benchmark,可测试 Agent 的能力。 诸位的 OpenClaw 和 Hermes Agent 都可以测测看。

中文
10
10
108
23.8K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
@oran_ge 🧐其实有个机会是coding agency。新时代的agents 外包🤣
中文
0
0
3
1.2K
Orange AI
Orange AI@oran_ge·
最近一个神奇的矛盾。 大公司裁员计划越来越多,被裁员工在选择下一份工作时,优先还是去找其他大中公司,不愿意去小公司。 与此同时小公司招聘还是很难。 OPC 似乎成了唯一的 easy answer,那又 easy 得不可思议。 预感到在混沌之中蕴育着下一个撮合 service。
中文
58
1
137
53.4K
Yuu💖
Yuu💖@QuantumTransf·
最近利用 terminal bench 跑 task 等结果的时间,看完了硅谷第一季 这真的是一个很传奇的故事,值得每个想要创造出非同反响的事物的人去看 其实最开始并不知道自己为什么会那么喜欢 vfs 这个概念,不过我今天突然意识到,或许这个种子在多年前看到剧中基于 middle out 的去中心化文件系统就已经埋下…
Yuu💖 tweet mediaYuu💖 tweet mediaYuu💖 tweet mediaYuu💖 tweet media
中文
2
0
19
1.1K
Dinah
Dinah@dinah_zhang·
为什么国外大厂可以制定标准,国内大厂不能
中文
17
0
17
6.9K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
@wey_gu 其实如果愿意,人均200刀,8人团队团一个h200 x 8做glm5.1部署还是很划算的。
中文
1
0
0
50
Wey Gu 古思为
Wey Gu 古思为@wey_gu·
@ashfold 嗯嗯,这是一个人的,稍微 team pool 一下,不过现在另一个前提是自部署没有 frontier 模型
中文
1
0
1
139
枯白啃设计
枯白啃设计@Kubai087·
送四个图标~ 给有产品的有缘人
枯白啃设计 tweet media
中文
26
2
103
12.6K
Han Cheng e/acc がリツイート
Azalia Mirhoseini
Azalia Mirhoseini@Azaliamirh·
Turns out we can get SOTA on agentic benchmarks with a simple test-time method! Excited to introduce LLM-as-a-Verifier. Test-time scaling is effective, but picking the "winner" among many candidates is the bottleneck. We introduce a way to extract a cleaner signal from the model: 1️⃣ Ask the LLM to rank results on a scale of 1-k 2️⃣ Use the log-probs of those rank tokens to calculate an expected score You can get a verification score in a single sampling pass per candidate pair. Blog: llm-as-a-verifier.notion.site Code: llm-as-a-verifier.github.io Led by @jackyk02 and in collaboration with a great team: @shululi256, @pranav_atreya, @liu_yuejiang, @drmapavone, @istoica05
Azalia Mirhoseini tweet media
English
31
112
971
109.9K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
@RyanLeeMiniMax If you want to operate as a commercial host, you need to pay Minimax to obtain the proper license. The amount you have to pay depends entirely on Minimax’s judgment or market strategy. Am I understanding that correctly?
English
0
0
0
99
yishan
yishan@linyishan·
🚀🚀🚀MiniMax-M2.7 正式开源 不过,一般人也无力部署,看看这核心参数🤣 总参数量:230B 激活参数:每处理一个 token 激活 10B 参数 网络架构: ➤ 62 层Transformer结构 ➤ 256 个局部专家,每个token同时激活 8 个专家 ➤ 上下文长度原生支持 204.8K tokens 显存要求严苛: ➤ 模型权重:220GB(FP16/BF16 精度下) ➤ KV缓存 :每100万tokens 约需240GB显存 推荐配置如下:
yishan tweet media
中文
6
2
31
11.8K
Yangyi
Yangyi@yangyi·
昨天参加GEO大会,向阳提到了一个问题,目前做东西已经不是瓶颈了,那么如何去判断做什么? 我让牛马AI给我构建了一个判断过滤器 大家可以用这11个判断标准来去评估一件事情是否值得投入尝试
Yangyi tweet media
中文
2
3
15
3.8K
Han Cheng e/acc
Han Cheng e/acc@ashfold·
今天不vibe了,休息一天,整理下思路。(想打游戏🎮
中文
0
0
3
167