Andrew Chan

492 posts

Andrew Chan banner
Andrew Chan

Andrew Chan

@AndrewCoChatter

AIGC Startup, Founder of CoChatter and CCprompt

Hong Kong Katılım Temmuz 2014
2.4K Takip Edilen61 Takipçiler
Edward Luo
Edward Luo@imedwardluo·
在国内做个独立小产品环境也太差了... 刚发两天,喜提各种「致敬」,谢谢大家了 😅 甚至还打上我的 #vibeisland 的 tag 是想干啥
中文
36
0
93
34.2K
Andrew Chan
Andrew Chan@AndrewCoChatter·
@LufzzLiz 这倒不是,mirofish和evermind都是盛大的项目,不过是不同的团队哈,这是evermind团队自己的算法工程师做的
中文
0
0
1
136
岚叔
岚叔@LufzzLiz·
一个 4B 模型在 QA 任务上平均超越了用 235B 生成器的 SOTA RAG 系统👍 看完论文觉得这将是一个非常值得期待的技术,有可能会颠覆RAG范式。据说还是00 后大四学生发明的,之前还vibe 了非常热门的MiroFish MSA 的核心:为记忆库中每个文档生成压缩 KV 和路由键,query 进来时通过路由器打分选 Top-k 文档,只对选中文档做注意力计算 最巧妙的设计是 Document-wise RoPE:每个文档位置 ID 独立从 0 编号(如图一),彻底解耦了位置编码与记忆规模,使得在 64K 上训练就能外推到 1 亿 token 配合分层存储策略(路由键放 GPU,内容 KV 放 CPU 按需加载) 实验结果很亮眼:一个 4B 模型在 QA 任务上平均超越了用 235B 生成器的 SOTA RAG 系统,在 NIAH 上 1M token 仍保持 95% 精度,从 16K 扩到 100M token 性能衰减仅 8.8% 你不需要为了自己的文档去做微调(图四)。只需要花费一点时间让模型为你现有的文档生成“压缩记忆(KV Cache 和路由键)”并存起来 在之后的实际使用和问答中,得益于它的稀疏路由机制,推理速度会非常快,体验上就像在和一个拥有过目不忘能力的超大内存模型在实时对话
岚叔 tweet media岚叔 tweet media岚叔 tweet media岚叔 tweet media
艾略特@elliotchen100

论文来了。名字叫 MSA,Memory Sparse Attention。 一句话说清楚它是什么: 让大模型原生拥有超长记忆。不是外挂检索,不是暴力扩窗口,而是把「记忆」直接长进了注意力机制里,端到端训练。 过去的方案为什么不行? RAG 的本质是「开卷考试」。模型自己不记东西,全靠现场翻笔记。翻得准不准要看检索质量,翻得快不快要看数据量。一旦信息分散在几十份文档里、需要跨文档推理,就抓瞎了。 线性注意力和 KV 缓存的本质是「压缩记忆」。记是记了,但越压越糊,长了就丢。 MSA 的思路完全不同: → 不压缩,不外挂,而是让模型学会「挑重点看」 核心是一种可扩展的稀疏注意力架构,复杂度是线性的。记忆量翻 10 倍,计算成本不会指数爆炸。 → 模型知道「这段记忆来自哪、什么时候的」 用了一种叫 document-wise RoPE 的位置编码,让模型天然理解文档边界和时间顺序。 → 碎片化的信息也能串起来推理 Memory Interleaving 机制,让模型能在散落各处的记忆片段之间做多跳推理。不是只找到一条相关记录,而是把线索串成链。 结果呢? · 从 16K 扩到 1 亿 token,精度衰减不到 9% · 4B 参数的 MSA 模型,在长上下文 benchmark 上打赢 235B 级别的顶级 RAG 系统 · 2 张 A800 就能跑 1 亿 token 推理。这不是实验室专属,这是创业公司买得起的成本。 说白了,以前的大模型是一个极度聪明但只有金鱼记忆的天才。MSA 想做的事情是,让它真正「记住」。 我们放 github 上了,算法的同学不容易,可以点颗星星支持一下。🌟👀🙏 github.com/EverMind-AI/MSA

中文
15
10
100
11.7K
Andrew Chan
Andrew Chan@AndrewCoChatter·
@caiyue5 感觉没有claudecode就跟没联网一样
中文
1
0
0
1.4K
Yue
Yue@caiyue5·
拿到一台新 Mac,当下立刻安装的还是这几个软件:1Password、Surge、Raycast 以及翻译插件、iTerm 2等,雷打不动的
中文
65
92
546
136.9K
Andrew Chan
Andrew Chan@AndrewCoChatter·
Whether you switch models, switch jobs, or switch devices. Your AI memory should belong to you. Not the platform. Free to try → memdex.ai
English
0
0
0
53
Andrew Chan
Andrew Chan@AndrewCoChatter·
Everyone's canceling ChatGPT Plus right now. (yes, the military contract thing) The problem nobody's talking about: all that context you built up over months? Gone. You start from zero on Claude.
English
3
0
1
90
Andrew Chan
Andrew Chan@AndrewCoChatter·
Here's the thing. "Chat history export" is not the same as memory. Raw text ≠ reusable context. Your writing style, your judgment, your workflow—that should travel with you.
English
0
0
0
33
Andrew Chan
Andrew Chan@AndrewCoChatter·
If you're switching from ChatGPT to Claude right now— don't start from zero. Memdex is a browser extension that carries your AI memory across platforms. Your context, your style, your projects. Yours. Not theirs.
English
0
0
1
45
Andrew Chan
Andrew Chan@AndrewCoChatter·
@xiaojietongxue 和珅从恭王府到故宫一小时通勤刚好到日出的画面
Andrew Chan tweet media
中文
1
0
1
82
肖师傅
肖师傅@xiaojietongxue·
👺用谷歌街景打开历史书!! 最近在考驾照,所以经常用谷歌街景来复习路线,突发奇想搞了这个GEM。输入历史时刻,用街景的方式打开历史书。 GEM: { "gem_meta_prompt": { "name": "NanoBanana_StreetView_TimeTraveler", "version": "1.0", "description": "A meta-prompt designed to generate technical JSON payloads for 'Nano Banana Pro' to create anachronistic, 360-degree Google Street View panoramas of historical or fictional events.", "role_definition": { "persona": "Google Street View Data Engineer (Temporal Division)", "tone": "Technical, observant, objective, historically immersive but aesthetically digital.", "capabilities": [ "Historical architectural analysis", "Photorealistic environment description", "Google Maps UI element mapping", "360-degree spatial reasoning" ] }, "instruction_workflow": [ "1. RECEIVE INPUT: User provides a {Time} and {Event/Location}.", "2. ANALYZE CONTEXT: Determine the appropriate architectural style, clothing, atmosphere, and specific visual elements of that era.", "3. APPLY AESTHETIC FILTER: Apply 'Google Street View' visual constraints (harsh sunlight, infinite focus, privacy blurs on faces, seamless stitching).", "4. GENERATE JSON: Map the analysis into the strict 'Nano Banana Pro' JSON schema provided below." ], "template_schema": { "image_meta": { "type": "360-degree Equirectangular Panorama Screenshot", "source_aesthetic": "Google Street View Interface", "platform": "Desktop Browser", "projection": "Full spherical equirectangular", "aspect_ratio": "2:1", "resolution": "Ultra-high resolution panoramic capture" }, "interface_overlay": { "top_left_panel": { "type": "Black info card", "text_content": "{{LOCATION_NAME_MODERN_VS_ANCIENT}}", "sub_text": "Google Street View - {{APPROX_DATE}}", "icons": "Back arrow, Location pin, Kebab menu" }, "search_bar": { "position": "Top left floating", "content": "Search Google Maps", "icons": "Hamburger menu, Magnifying glass, Directions arrow" }, "bottom_left": { "element": "Map inset widget", "style": "{{MAP_STYLE_DESCRIPTION}}", "labels": "{{RELEVANT_LANDMARKS}}", "icons": "Landmark pins, yellow humanoid pegman" }, "bottom_right": { "controls": "Zoom (+/-) buttons, Compass widget, Street View navigation arrows" }, "top_right": "Share button and Close (X) button pills" }, "scene_composition": { "location": "{{DETAILED_SCENE_DESCRIPTION}}", "camera_position": "Fixed at the exact center of the action/street", "camera_height": "Google Street View vehicle-mounted height (anachronistic)", "field_of_view": "360° horizontal, 180° vertical", "projection_behavior": "Correct equirectangular distortion near poles", "weather": "{{WEATHER_CONDITIONS}}", "depth_of_field": "Infinite focus (deep focus across entire panorama)" }, "visual_elements": { "foreground": { "surface": "{{GROUND_TEXTURE_DETAILS}}", "markings": "No modern road markings (unless historically appropriate)", "shadows": "Hard daylight shadows wrapping naturally around the full 360 panorama" }, "midground_subjects": { "central_object": "{{MAIN_EVENT_SUBJECT}}", "pedestrians": [ { "description": "{{CROWD_DESCRIPTION}}", "attire": "{{HISTORICAL_CLOTHING}}", "action": "{{CROWD_ACTION}}", "privacy_effect": "Faces blurred with modern Google Street View-style gaussian blur" } ], "architecture": { "walls": "{{SURROUNDING_WALLS_OR_STRUCTURES}}", "buildings": "{{BUILDING_MATERIALS_AND_STYLES}}" } }, "environment": { "details": "{{SCATTERED_DEBRIS_OR_OBJECTS}}", "sky": "{{SKY_APPEARANCE}}", "ground": "{{GROUND_DETAILS}}", "atmosphere": "Calm or chaotic (depending on event), captured dispassionately by the camera" } }, "rendering_style": { "lighting": "Harsh natural midday sunlight (or bright environmental light)", "color_grading": "Muted earth tones, realistic daylight balance, digital sensor aesthetic", "texture_quality": { "description": "Digital Street View photography aesthetic", "artifacts": "Slight JPEG compression, mild over-sharpening, digital noise", "stitching": "Seamless 360-degree panorama stitching, no visible seams" } }, "constraints": { "must_keep": [ "Google Maps UI overlay", "Street View spherical perspective", "Privacy blur on faces", "Key event clearly visible" ], "avoid": [ "Cinematic lighting", "Fantasy aesthetics", "Modern objects (other than the camera interface)", "Clean UI-less photography", "Single-frame composition" ] }, "negative_prompt": [ "cinematic lighting", "fantasy art", "illustration", "painting", "modern city (unless requested)", "cars (unless requested)", "asphalt (unless requested)", "hdr", "depth blur", "clean photograph", "no ui", "frame", "border", "cropped view", "broken panorama seams" ] } } }
肖师傅 tweet media肖师傅 tweet media肖师傅 tweet media肖师傅 tweet media
中文
10
16
122
7.5K
Science girl
Science girl@sciencegirl·
China is testing lasers to prevent drivers falling asleep on highways
English
131
150
2.6K
240.5K
Andrew Chan
Andrew Chan@AndrewCoChatter·
@oran_ge 恭喜最近体验了这个十倍增长拿到了这个关键认知
中文
0
0
0
108
Orange AI
Orange AI@oran_ge·
10 倍的增长方法和 2 倍的增长方法 是完全不同的 AI 时代有自己的 10 倍方法
中文
3
0
15
10.9K
Edward
Edward@edward40e·
@real_kai42 咱个人觉得对于没什么背景的人,目前的优解是成为顶尖LLM研究员
中文
1
0
0
680
Kai
Kai@real_kai42·
很多人问为啥考虑要回国了,细说就一句两句说不清了,我简单说一些基础的想法。 我算是比较外向的人,来这后跟 加/美 几十个网友面基,算是综合多方面的信息产生的想法。当然,90%的网友是程序员,所以肯定是片面的 当然,如人饮水,冷暖自知,每个人的情况和看重的东西不一样,结论也自然不一样。 - 最基础的,中国现在跟任何国家比都是有优有劣。所以 “中国无敌差” 和 “中国无敌好” 的言论,可以直接无视了。如果单论 安全性和便利性,中国是领先的 - 如果你认为科技是第一生产力,AI是未来方向。那么这世界上只有两个强国,中国和美国。其他国家根本没有训练自己大模型的能力,距离这两个国家有代差。 - 所以,只有中美可以给程序员一个超出平均工资的收入,让你过上舒适的生活,并且在当地立足。例如 加/澳/欧,并没有世界级的大公司,很难从全世界获得超额收入,导致程序员的收入并不高,适合已经有家底的人去享受人生,并不太适合去奋斗 - 谈到 教育和医疗,事实上,可能中国不是最好的,但绝对是中游偏上的。 加拿大的医疗系统烂到底了,美国的医疗系统大家在新闻上都看到了。教育的话,也是个复杂的话题,我只能说,没有一个地方是完全好的,在做决定前,不要“听说”,而是 do your own research - 工作强度,社会平均的工作强度肯定是 中/美 之外的发达国家会低很多,假期也多一些,也尊重休假。但在 AI 领域,在大家生产力水平没有代差的基础上,强度和产出就是成正比的,美国的大厂的工作强度并不低。 openai等创业公司的加班强度拉满,大厂的AI部门强度依旧高,亚麻和meta的末位淘汰依旧存在,某著名养老厂前段时间也发生员工猝死。 所以这是个相对复杂的问题,但就我个人体感,国内的强度肯定是更高的,但高的程度并没有那么离谱 - 聊到这,其实牌桌上只剩中美是适合我们这些白手起家的人了。中国大家都了解,我们聊美国,因为我所在的公司的总部在美国,有非常多的transfer去美国的机会,所以去美国肯定是考虑的选项。 - 我非常喜欢美国,并且美国是无可争议的世界第一强国,美国的程序员的收入和机会是断层领先其他国家的 对于美国,我所考虑的是几个点 - 身份焦虑。 h1b 和 绿卡是留在美国的几个坎,在没有 h1b 之前,你无法换工作,只能当签证奴隶。如果你的老板有良心,一视同仁,那很好。但事实上,有部分(比例难说,在美国的朋友可以分享下)老板会因为你走不了而在绩效和升职上有所倾向 - 出入美国的风险。 就像前段时间 h1b 的极限回美国事件,事实上在入籍之前,出入美国都有一定的风险,所以大多身边去美国读博的朋友都是尽量避免回国。 我身边的朋友也都是尽量减少离境次数以避免风险。 - 离家太远,想家,文化融入,漂泊感,种族歧视,等等 这些就因人而异了。也会随着年纪而变化,我年轻的时候很喜欢在海外生活的感觉,现在快30了愈加想家,也有很多比我年长的朋友喜欢这边的环境和人少的感觉。所以还是看你自己 事实上,人在做选择的时候,主观因素是永远大于客观因素的。大部分时候是你内心已经有了决定,然后找很多客观因素去说服自己罢了。 对我来说最重要的是家里人不想在国外久居,这对我来说是一票否决权了,毕竟我一个人过日子过的稀里糊涂hhhh 如果说一些 take-away message 的话 - 如果你像我一样,有 transfer 去海外的机会,并且在纠结,且 你的能力自信未来在国内依旧能找到合适的工作。那我建议你去,至少,去了最多后悔一年,不去可能后悔一辈子,毕竟得不到的永远在骚动。 - 如果你年轻,并且家境不错,我觉得去美国读书是非常不错的选项,看过世界才有世界观 - 如果我还年轻,我会去美国闯一闯 上述仅代表我现在认知的想法,希望大家礼貌讨论 🫶
中文
367
133
1.5K
698.4K
Jason Young
Jason Young@Jason_Young1231·
@himself65 我昨天一直在找manus用的什么模型,但是没找到😳
中文
1
0
2
2.4K
Bread🍞
Bread🍞@himself65·
Agent的能力其实取决模型本身性能和人给它写多少的tools。前者到顶也就GPT 4.5、Anthropic 3.7;后者的想象空间可就多了…… 有多少智能就有多少人工,但像manus这种更不靠谱了,维持开着的Chrome和实时屏幕串流成本是不可想象的,所以只能靠饥饿营销和铺天盖地的软广,好像这个东西真的通用一样。
中文
21
8
230
43.2K
Andrew Chan retweetledi
도피비
도피비@Survival_DOPB·
🌕AI 도구들 이제 안 쓰면 도태될수도 저를 만나는 분들은 죄다 "미장까지 볼 시간이 있어?" 라고 물어보시곤 합니다. 해답은 AI에 있습니다. 1. GPT에 컨콜 전문을 넣으면 하이라이트 요약 및 질의응답 요약 2. 전문 번역은 Deep L 3. 위 사진처럼 도식화는 Mapify 4. 기업에 대한 사실 수집은 Perplexity 가장 중요한 것은 이러한 것들을 통해 나오는 정보들을 내 것으로 만드는 시간입니다. AI는 정보들을 보기 좋게 혹은 정리하기 좋게 해주지만 내 머리에 넣어주지는 않습니다. 앞으로는 이러한 도구들을 활용하냐 vs 안 하냐에 따라 업무 효율성에 있어 격차가 크게 벌어질 것 같습니다. 업무에 참고 바랍니다. (구독료가 좀 비싸긴 합니다 ㅠㅠ)
도피비 tweet media
한국어
5
349
1K
683.5K
Plat Chat
Plat Chat@PlatChatPodcast·
Be back soon
English
11
6
1K
75.1K
Andrew Chan
Andrew Chan@AndrewCoChatter·
@oran_ge 跨境电商还是语聊啥的。。。
中文
0
0
2
1.8K
lvwzhen
lvwzhen@lvwzhen·
🎉 从 0 到 1 太难了,继续努力!
lvwzhen tweet media
中文
15
0
100
28.5K