Pai

11.6K posts

Pai

@junytang

模型炼丹师

Katılım Şubat 2009

1.9K Takip Edilen2.4K Takipçiler

Pai@junytang·1 Nis

@lexrus 差别应该是在质量上，本地跑 agent 时差别就出来了

中文

Lex Tang@lexrus·1 Nis

@junytang LM Studio 没问题，跑了 Qwen3-Coder-Next-UD-IQ2_M.gguf 和 Qwen3.5-35B-A3B-UD-Q4_K_L.gguf。和 Ollma 推荐的那个 MLX 比，主观上看不出明显的速度提升

中文

349

Lex Tang@lexrus·1 Nis

试了在我的 M3 Max 里用 Ollama 0.19.0 跑 MLX 的 qwen3.5:35b-a3b-coding-nvfp4 模型，差不多需要 30GB 内存。这个速度，适合没网的时候应急

中文

30.9K

Pai@junytang·1 Nis

@lexrus 是用 ollama 跑的么? ollama 是最近才支持 mlx 的，可能支持的不够完善。可以试试看 LM studio。如果 gguf 版的话，ollama 要自己做转换

中文

253

Lex Tang@lexrus·1 Nis

@junytang 试了这里面的几个带 UD 的，都报错 Error: 500 Internal Server Error: unable to load model

中文

305

Pai@junytang·1 Nis

@lexrus 有兴趣的话，可以看这里 x.com/Brooooook_lyn/…

Broooooklyn@Brooooook_lyn

x.com/i/article/2037…

中文

412

Pai@junytang·1 Nis

@lexrus 这是 mlx 的问题，mlx 用的是统一量化，而 qwen3.5 用的是混合量化，所以会降智。

中文

305

Pai@junytang·30 Mar

@imwsl90 给个新思路：自制的8健轨迹球，已经完全抛弃鼠标了

中文

卫斯理@imwsl90·30 Mar

万能的 X 圈，最适合 mac 的鼠标有推荐的吗？

中文

144

63.4K

Pai@junytang·29 Mar

@maide89699220 直线导轨做到不难，但是丝杆可以做到还是厉害的

中文

高飞@maide89699220·29 Mar

啥叫同频转速！为什么没撞上，这是说明伺服电机厉害，还是说丝杠精密度很高呢？

中文

125

1.7K

480.3K

Pai@junytang·25 Mar

@CryptoPainter 不客气。再补充一个，就是校验top10%和bottom10%是不是有明显的分层，这个是校验策略抓的是alpha，还是beta

中文

116

Crypto_Painter@CryptoPainter·25 Mar

@junytang 学习了，这就去一步一步做~谢谢

中文

490

Crypto_Painter@CryptoPainter·25 Mar

修改了Regime转换的逻辑后，整体模型再次获得提升，随着策略系统的完善，提升夏普比率的关键窗口逐步转移到了对于市场模式的判断。不得不感慨，真的是大道至简，只要能更准确高效的判断市场究竟是处于震荡还是趋势，本身就是Alpha盈利的来源… 我看到评论区有人担心是否存在过拟合，其实这个图表中显示的回测数据就是专门做的Walk-Forward…… 简单来说，策略因子的生成与回测不是一次性输入全部价格数据，而是先训练一年，再回测后一年，训练2年，回测后一年这样的方式。也就是说，回测数据最终显示结果里面总是存在训练样本以外的数据。接下来的思路是继续优化Regime的识别能力，目前行业内比较成熟的模型主要有两种，一种是多个固定参数集下的复合投票模型：将多个趋势类因子视为投票委员会，然后根据他们给出的信号进行投票，过半因子认为市场模式结构发生转变后，予以通过！另一种是HMM隐马尔可夫模型的变体，也就是Jump Model，给模型输入大量特征数据集后进行训练，比较适合日线级别BTC的模式识别，最关键的一点是，它还可以囊括链上数据、合约数据甚至量化情绪指标等数据。后面我会继续更新这两种Regime识别模型的尝试，前者看起来粗糙，但重在判断逻辑清晰，不用担心过拟合或黑箱问题。后者从感性角度来说确实很酷，但我需要收集大量的数据并处理，这个月Tokens已经快烧完了，估计要等到下个月开工了… 我分享这些不是给大家看的，而是我在研究学过程中笔记，欢迎有建设性的讨论，单纯输出居高临下的情绪我真的不欢迎…

Crypto_Painter@CryptoPainter

新版本终于迭代出来了，确实有点失望，在剔除了所有的潜在过度拟合与策略作弊后，整个系统的表现也就勉强跑赢现货2~3倍... 可以看到一个及格的策略系统真正在做的事情很简单： 1. 牛市不顾一切上车； 2. 熊市不顾一切保住本金，哪怕要承受长达1年的煎熬... 相比之前的版本来说，这一版看起来放心多了，至少证明这个架构是有产生 Alpha 潜力的，虽然不是那种特别牛逼的策略集合，但也勉强看的过去... 经过陆陆续续的反复审计，后面的任务就是不断的喂数据，做向量化，然后交给遗传算法一直迭代下去了... 心情果然好了一些~

中文

51.7K

Pai@junytang·24 Mar

@crblandet @CryptoPainter 客气，可以一起探讨交流

中文

Crblandet@crblandet·24 Mar

@junytang @CryptoPainter 感谢指点👍🤭

中文

Crypto_Painter@CryptoPainter·23 Mar

舒服了~看看这稳定的曲线！我给遗传算法系统增加了30多个特征用来生成随机树，可最终自然选择下来的做多策略居然是一个基于MA20的单均线策略... 当然，这还仅仅是迭代30代的结果，同时我给每笔交易加了0.15%的手续费+滑点，直接困难度拉满！年化22%，最大回撤8.1%，夏普比率达到了2.13，最关键的是，这还是在做空策略与震荡策略没有进化出明显盈利能力的情况下跑出来的... 之前的思路也有所改变，系统不再是基于不同市场结构单独跑一种策略的模式，而是3种策略同时在跑，但会根据市场模式的切换获得不同比例的资金调用权。我知道这个数据看起来很垃圾，它甚至没有跑过现货涨幅，但关键是目前的收益完全是靠一个做多策略在拉动，剩下两个策略还在拖后腿，之后将另外2个策略迭代更多次，总会慢慢变好！哦对了，这个回测我让AI帮我审计了一下，因为交易逻辑简单到令人发指，所以不存在什么过拟合的可能性，同时收益率偏低的原因来自所有仓位都不足1倍，也就是说即使是现货也不会满仓... 我感觉这个方向还是有搞头的，接下来无非就是从遗传算法这个角度开始优化，目前喂进去的数据只有K线与成交量，之后陆陆续续喂进去全量数据以及新闻事件，理论上还会有所提升，尤其是短期做空吃暴跌的新闻交易策略... 最后，我把全部源码发给了 Claude 帮我分析，他说我的完成度才40%，属于地基搭好了，房子还没盖，甚至连水泥砖块（多维数据）都还没运来... 懂了懂了~

Crypto_Painter@CryptoPainter

逐步迭代的效果开始显现了！目前用于判断市场模式的子系统在经过多轮迭代训练后，开始逐渐找到了更好的判断方式，对于市场究竟处于趋势行情还是震荡行情判断的越来越像那么回事了... 你可以看引文里之前的图片，肉眼可见的在逐步升级！如果这个模式判断系统没问题，那么遗传算法那边很快就可以开始根据市场结构进行有选择性的进化了！我估计距离该系统跑出第一份回测报告不远了，一开始肯定不会太好看，但我关注的是整个系统架构是否可以稳定小额盈利。

中文

104

38.6K

Pai@junytang·24 Mar

@crblandet @CryptoPainter 可以这么看是不是有过拟合： 1. 每日超额，去掉±3σ后看中位数 2. 计算 IR stability 的值，行业一般 >0.1 3. 计算置换检验 P 值，行业一般 <0.05 4. 每日超额收益做蒙特卡洛 Bootstrap，看净值>1的概率，行业一般 >0.8，以及下 5% 分位的净值，行业一般 >0.7

中文

Crblandet@crblandet·23 Mar

@junytang @CryptoPainter 看不出来具体问题是什么...但是基于我个人的经验，这么好的结果，如果是复杂策略那就大概率是过拟合，如果是简单策略那就大概率是未来函数（尤其AI写的代码，我之前反复让它检查都给我说没有，最后还是我自己看出来的）🤔

中文

Pai@junytang·23 Mar

@off_thetarget 用净值/sharpe/超额算都可以。需要注意的是：不是预测，用的就是回测每日实际的值，只不过是打乱顺序加有放回的重采样，然后分析回测的收益是小概率事件还是路径依赖。

中文

pepper 花椒@off_thetarget·23 Mar

@junytang 用蒙特卡洛去预测未来1000条收益曲线的sharpe ratio是否大于1是吧

中文

pepper 花椒@off_thetarget·22 Mar

不是 win rate在80% 年华在20-30%稳定回测基本没有 sharpe能跑到5 美股专享策略？被我。。？搞出来了？这还是做了standard过拟合的测试

花椒(一人公司）@pepperfr1ends

不是我跑了2天autoresearch了策略终于拿到一个sharpe在 5.0以上的美股策略了卧槽卧槽卧槽卧槽 maxdd只有-3% 这个回撤基本等于没有啊，我这个做过3重拟合的，不是吧，好运这么快就来了

中文

25.4K

Pai@junytang·23 Mar

@off_thetarget 你说的standard是指数据的标准化？举例：每日收益是 r1,r2,r3,r4,r5，有放回的重采样获取：r3,r3,r2,r1,r2或者r5,r3,r1,r5,r2，随机1000组，一组每日收益可以画出1条收益曲线，这样可以画出1000条曲线，看这1000条收益曲线最终的净值大于1的概率有多少，最差5%的净值有多少，看收益有没有路径依赖性

中文

pepper 花椒@off_thetarget·23 Mar

@junytang 我这个算是过量数据了过拟合确实做了 standard的不过你的那一套检测办法我可以试一下但是我还没完全搞明白

中文

Pai@junytang·23 Mar

@off_thetarget 过拟合有很多种形式，看到未来数据算是对未来的过拟合，只针对特定时间段表现良好算是特定时间的过拟合，偶然抓住一两次极端行情算是特定行情的过拟合，等等

中文

pepper 花椒@off_thetarget·23 Mar

@junytang 请教一下蒙特卡洛不是做预测吗？

中文

159

Pai@junytang·23 Mar

@off_thetarget 可以做预测，也可以做是否过拟合的校验。方法如下：计算每日超额，然后做1000次有放回的重采样，可以画出1000条收益曲线，看胜率和5%分位的净值，如果胜率小于0.6，或者5%分位的净值<0.7，多半就是过拟合的

中文

Pai@junytang·16 Mar

@CryptoPainter 哪怕胜率只有51%，扣除冲击成本和交易成本后还有收益，就可以高频

中文

Crypto_Painter@CryptoPainter·16 Mar

盘感交易宣告失败！整个周末都在搞这个多模态策略，优化了5个版本的样本模式，并花费了大量时间来进行分段回测，最终得到的结果是：这个方向仅存在微弱的Alpha，单纯看价格结构与后续涨跌方向，模式识别后的准确率在52%，也就是说，那些所谓技术形态、K线结构的分析逻辑，仅能带来2%的概率优势… 所以，虽然交易策略没有成功落地，但通过整个周末的数据处理与回测，我现在可以很负责任说，纯粹具基于形态的技术分析可以被证伪了… 画趋势线的、画三角的、画头肩的… 在统计学上基本上等于抛硬币… 从这个角度来说，这次收获颇丰！下个方向已经定好了，做遗传学多因子搜索引擎，既然形态靠不住，咱就上数学公式！

Crypto_Painter@CryptoPainter

小画师的“盘感交易”已经正式开始运行了！给了它2000u，一晚上先亏掉10u… 至于什么是盘感策略，其实我的思路就是模拟人类做裸K交易的状态… 因为那些盘感好的交易员，大部分都是长期盯盘盯出来的，说白了就是自己在大脑里训练了一个价格行为模型… 看到类似的结构或形态，这个脑内模型就会产生交易信号！所以我就让 Agent 也去盯盘，把历史K线全部盯一遍，然后记下来4000多个片段，这些片段内的价格形态都对应了后续市场明显的波动。然后每个小时都让 Agent 去将最新行情与记忆中的样本进行对比，并利用 Embedding 模型从向量库中筛选，最终就会得到一个加权期望值：价格在4h内涨跌的概率及幅度。最后再让Agent根据这个数值进行决策下单即可，这样，它就是在根据自己的记忆与盘感进行交易了… 目前测试了30h，前期在 #OKX 的模拟盘上，现在才接入实盘，总体胜率57%，盈亏比2:1…… 因此这个思路貌似还是有搞头的！继续干！

中文

80.2K