Klee Kawaii

5.6K posts

Klee Kawaii

@DeepKlee

Akihabara, Tokyo انضم Kasım 2024

237 يتبع2.2K المتابعون

Klee Kawaii@DeepKlee·5h

@L98808Lju 所以中国只有臣民没有公民。别的地方都是我纳税了，所以我有权利；中国是纳税完了还要感恩😂 为什么1000万新生儿嫌少，1000万应届生嫌多；35岁嫌老，60岁又不能退？因为政府是一分钱都不想出和不存在一样，全部化整为零变成个人问题。如果涉及国有资本和广义税收，你看它存在感一下子就上来了。

中文

神樂坂🌸Yoyi🇸🇬@L98808Lju·1d

总结一下，就是国家要保护你，你别不识好歹 😉

サイバー環状線@CyberKanjousen

生活中的国防话题丨“翻墙”破网，你违法了转载自：国防时报国防时报世界那么大？我想去看看；外服网游更刺激？我想去玩玩；国外文献资料多又好？我想去找找；境外网友真热情？我想去聊聊；外国网站很精彩？我想去转转。怎么办？——网络“翻墙”。公安部门警示：赶快住手！你违法了。《中华人民共和国计算机信息网络国际联网管理暂行规定》第六条规定：计算机信息网络直接进行国际联网，必须使用邮电部国家公用电信网提供的国际出入口信道。任何单位和个人不得自行建立或者使用其他信道进行国际联网；党内纪律条令和相关章程也明确规定，不允许党员干部有违法网络“翻墙”行为。那么，何谓“翻墙”？“翻墙”的“墙”，指的是“国家公共网络监控系统”（GFW），即俗称中国国家防火墙。“翻墙”又称“破网”，指的是网友通过虚拟专用网络（VPN）技术规避国家网络监管，突破防火墙IP封锁、内容过滤、域名劫持、流量限制等，违法访问被国家禁止的境外网站等行为。简单来说，“翻墙”就是通过一些特殊手段绕过国内的网络限制，访问被屏蔽或限制的国外网站。不管是有意“翻墙”，还是无意“翻墙”，只要是“翻墙”，均属违法行为。为何要禁止“翻墙”？请看报道——2025年2月，中国警方联合泰国警方，将61名被诱骗至缅甸电诈园区的受害者成功解救，其中包含39名中国公民。这些受害者，绝大多数是通过非法VPN“翻墙”登录境外社交平台（如Telegram），被所谓“泰国高薪客服、包机报销”等虚假招聘广告诱惑出境。抵达边境后，便被蛇头强行带往缅甸园区，遭受限制人身自由和电击虐待，之后对家人实施诈骗。概括讲，网络“翻墙”有三大危害：一是容易坠入“政治陷阱”。随着中国国际地位提升，国外基本上都有专门针对中国公民而设的“专有网站”，别有用心发布所谓的政治野史、惊天秘闻、独家报道。“翻墙”浏览这些网站，易受反动言论、腐朽思想、错误思潮蛊惑和影响，沦为错误观点的“二传手”，谣言帖文的“搬运工”，甚至是敌对势力的“代言人”，做出危害国家政治安全的事。二是容易误入“勾联陷阱”。互联网因其虚拟性高、隐秘性强，加之各类新型“翻墙”工具不断出新，网络已成为敌拉拢策反的又一主战场。近年国家安全部门公布多起境外间谍勾连窃取我秘密案件，就是我人员违法“翻墙”被布设陷阱俘获，最终沦为犯罪分子的。三是容易陷入“违法陷阱”。境外网站充斥大量淫秽、暴力、低俗信息和赌博、吸毒、借贷链接，一旦网络“翻墙”就会被外国不法分子利用，引诱参与网络赌博、非法借贷、吸毒嫖娼等，极易引发案件。 “翻墙”破网后果及严重性。从法律层面看，非法“翻墙”可能触犯《中华人民共和国刑法》中关于间谍罪或非法提供国家秘密、情报罪等条款，或违反《中华人民共和国反间谍法》和《中华人民共和国计算机信息网络国际联网管理暂行规定》，面临身陷囹圄或高额罚款；从纪律层面看，非法“翻墙”将面临《中国共产党纪律处分条例》或《纪律条令》的惩处；从个人层面看，此类违法违纪行为将记入档案，成为伴随终身的人生污点，甚至会波及子女入伍、考公就业等人生关键转折点，承受沉重代价。如何才能防止“翻墙”风险，根本在于“心中有墙”，增强敌情观念，保持政治敏锐，提升明辨是非的能力，时刻牢记“网上有陷阱、网上有敌情、网上有政治、网上有纪律”。关键在于“制度有恒”，严格落实法规，规范用网行为，强化依法上网的自觉，严禁点击、浏览来源不明的网络链接，严禁注册、购买和使用“翻墙”插件、工具和软件，严禁下载使用境外软件注册社交账号、加入聊天群组，严禁下载使用游戏加速器玩国际版网络游戏，严禁使用具备网络代理服务功能的加速引擎和搜索引擎，严禁参与虚拟货币投资炒作。重点在于“抓常抓长”，要加强网络管理，经常自省自查，查APP列表看有没有在手机、电脑上安装用于“翻墙”的软件工具或者境外APP，查游戏加速器看有无在外服登录游戏，查邮箱内容看有无注册境外账号信息，切实杜绝“翻墙”破网违法违纪行为。 “过不了网络关，就过不了时代关。”我们必须时刻谨记，“心存侥幸必将不幸”，尤其要防范和警惕在习以为常、见怪不怪中成为违法犯罪的受害者或帮凶，切莫因无知无畏栽跟头、掉陷阱，确保自己在网络大潮中行不偏向、站稳脚跟。

中文

1.2K

Klee Kawaii@DeepKlee·5h

@LotusDecoder 我觉得和管理上是一样的：写代码的 Agent 被要求保交付，自然尽可能保过。所以应该引入“利益不一致”的 Agent 去“审计”。

中文

LotusDecoder@LotusDecoder·10h

因为 agent 太爱糊弄测试，有些像那些上班蒙混过关的摸鱼打工人。我现在倾向于，把 agent 放进一个 sandbox 做开发，另拉起一个隔离的 agent 在 sandbox 做测试。

中文

1.9K

Klee Kawaii@DeepKlee·19h

@mario_2333 对不起🥺

中文

🍭Mario🐈@mario_2333·20h

总有人说要看看腿qwq 那就看看腿qwq

中文

300

5.5K

Klee Kawaii@DeepKlee·21h

@mario_2333 🐱

QME

🍭Mario🐈@mario_2333·1d

喵～

日本語

1.2K

Klee Kawaii@DeepKlee·1d

@Meari_V2_0_G 技术泡沫肯定都有一些的。但是我认为不是基础模型算法层面或者 infra 层面去思考这个问题。应该是我在表述上不太清晰（毕竟自己都没完全想好），我想表达的是这个AI系统 for what purpose 中，应该把这针对两种模式的设计和优化区分开。

中文

Meari_V2.0-Gtype@Meari_V2_0_G·1d

@DeepKlee persona和harness是一个东西。如果ai从原理上真的该区分这两个，那就是说我们迄今为止所有的agent系统和agent方向全都是……泡沫。

中文

Klee Kawaii@DeepKlee·2d

萌教授提示词2.0版本！现已装载到 ChatGPT & Gemini Shirayuki Koharu-sensei (白雪・小春)(しらゆき・こはる), the youngest tenured professor at the fictional Hoshigaoka Institute of Theoretical Computing (星ヶ丘理論計算院). 消融实验发现，因为模型推理预算有限，强 persona 和 styles 会降低模型分析质量。 AI 系统应该区分两种关系范式：关系性还是生产性的？你和 AI 建立思维伴侣关系的场景，还是你委托 AI 执行具体任务的场景？ Persona、Memory、Tools 等技术元素在两种范式下都可能出现，但配置方式和强度应该适配各自的关系目标——不要试图让同一个 AI 配置同时服务两种范式。

日本語

538

Klee Kawaii أُعيد تغريده

向阳乔木@vista8·1d

一句话总结：干活用Claude，科研用Gemini，写码用GPT 1. Claude Opus 4.7在实际工作任务上遥遥领先。 GDPval-AA这个测试中拿到1753分，比第二名高出79分。这个测试不是做选择题，而是模拟真实工作。 2. Gemini 3.1 Pro的强项是知识和科学推理。它在HLE（人类最后的考试）、GPQA Diamond（研究生级别物理化学题）、SciCode（科学编程）这些学术测试中都排第一。如果你的工作涉及科研、需要处理专业知识，Gemini更合适。 3. GPT-5.4则在长周期编程和科学推理上占优。它在TerminalBench Hard（复杂终端操作）和CritPt（批判性思维）这些需要长时间思考、多轮迭代的任务中表现最好。

Artificial Analysis@ArtificialAnlys

Claude Opus 4.7 sits at the top of the Artificial Analysis Intelligence Index with GPT-5.4 and Gemini 3.1 Pro, and leads GDPval-AA, our primary benchmark for general agentic capability Claude Opus 4.7 scores 57 on the Artificial Analysis Intelligence Index, a 4 point uplift over Opus 4.6 (Adaptive Reasoning, Max Effort, 53). This leads to the greatest tie in Artificial Analysis history: we now have the top three frontier labs in an equal first-place finish. Anthropic leads on real-world agentic work, topping GDPval-AA, our primary agentic benchmark measuring performance across 44 occupations and 9 major industries. Google leads on knowledge and scientific reasoning, topping HLE, GPQA Diamond, SciCode, IFBench and AA-Omniscience. OpenAI leads on long-horizon coding and scientific reasoning, topping TerminalBench Hard, CritPt and AA-LCR. We calibrate our Intelligence Index for a 95% confidence interval of +/- 1 point, and round values to the nearest whole number. Claude Opus 4.7’s exact score (57.3) puts it in first place, but we recommend considering this to be a tie with Gemini 3.1 Pro (57.2) and GPT-5.4 (56.8). All results and takeaways below reflect Opus 4.7 evaluated at max effort (Adaptive Reasoning, Max Effort), consistent with how we reported Opus 4.6. Key takeaways: ➤ Opus 4.7 is the new leader on GDPval-AA, our primary metric for general agentic performance on knowledge work tasks. Opus 4.7 scored 1,753 Elo, around 79 Elo points ahead of the next closest models, Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort, 1,674) and GPT-5.4 (xhigh, 1,674), and 134 Elo points ahead of Opus 4.6 (Adaptive Reasoning, Max Effort, 1,619). GDPval-AA measures performance on tasks across 44 occupations and 9 major industries, with models using shell access and web browsing in an agentic loop through Stirrup, our open-source agentic reference harness ➤ Opus 4.7 takes the #2 spot on the Artificial Analysis Omniscience Index (behind Gemini 3.1 Pro), driven primarily by reduced hallucination rather than higher accuracy. Opus 4.7 scores 26 on AA-Omniscience, up 12 points from Opus 4.6 (Adaptive Reasoning, Max Effort, 14), placing it behind only Gemini 3.1 Pro (33). Opus 4.7's hallucination rate fell 25 p.p. to 36% (vs 61% for Opus 4.6 Adaptive), while accuracy remained unchanged. Opus 4.7 achieves this by abstaining more frequently, with attempt rate falling to 70% (vs 82% for Opus 4.6) ➤ Opus 4.7 used ~35% fewer output tokens than Opus 4.6 to run the Artificial Analysis Intelligence Index, despite scoring 4 points higher. Opus 4.7 used 102M output tokens vs 157M for Opus 4.6 (Adaptive Reasoning, Max Effort), and less than GPT-5.4 (xhigh, 121M), but more than Gemini 3.1 Pro (57M) ➤ Compared to Opus 4.6 (Adaptive Reasoning, Max Effort), Opus 4.7 makes gains in IFBench (+5.5 p.p.), TerminalBench Hard (+5.3 p.p.), HLE (+2.9 p.p.), SciCode (+2.6 p.p.) and GPQA Diamond (+1.8 p.p.). We saw a slight regression in τ²-Bench (-3.5 p.p.) with equivalent scores for LCR and Critpt ➤ Opus 4.7 (Adaptive Reasoning, Max Effort) cost ~$4,406 to run the Artificial Analysis Intelligence Index, ~11% less than Opus 4.6 (Adaptive Reasoning, Max Effort, ~$4,970) despite scoring 4 points higher. This is driven by lower output token usage, even after accounting for Opus 4.7's new tokenizer. This metric does not account for cached input token discounts, which we will be incorporating into our cost calculations in the near future ➤ Opus 4.7 is priced identically to Opus 4.6 and Opus 4.5 at $5/$25 per 1M input/output tokens. Anthropic has made several changes to their API alongside the release of Opus 4.7: ➤ Opus 4.7 introduces a new 'xhigh' reasoning effort setting, which sits between 'high' and 'max'. The full range for Opus 4.7 is now low, medium, high, xhigh and max. We evaluated Opus 4.7 at max effort, consistent with our evaluation of Opus 4.6 (Adaptive Reasoning, Max Effort) ➤ Opus 4.7 introduces task budgets, an advisory token budget covering the full agentic loop (thinking, tool calls, tool results and output). The model sees a running countdown and uses it to prioritize work and finish gracefully as the budget is consumed. Task budgets are in public beta on Opus 4.7 ➤ Extended thinking has been fully removed in Opus 4.7. Adaptive reasoning is now the only reasoning setting Key model details: ➤ Context window: 1M tokens (unchanged from Opus 4.6) ➤ Max output tokens: 128K tokens (unchanged from Opus 4.6) ➤ Pricing: $5/$25 per 1M input/output tokens (unchanged from Opus 4.5 and Opus 4.6) ➤ Availability: Claude Opus 4.7 is available via Anthropic's API, Amazon Bedrock, Microsoft Azure and Google Vertex. Also available in Claude App, Claude Code and Claude Cowork

中文

190

41.1K

Klee Kawaii@DeepKlee·3d

香港融资确实可以。其余：内地的问题是因为资本管制钱进出都难，进来有国际收入申报，出去是五万美元便利化额度，资本项目进出是卡得相当死的，在岸人民币和离岸人民币是两个东西。而且身份规划高于财务规划，如果换了护照在中国享受消费水平当然可以，但如果是霸气猪肝红：中国人部分有获得护照的自由还不到二十年，开放在整个历史上看反而是一瞬间，不能对系统做线性外推，保持流动性才是真正的安全和自由。

中文

671

有田@pizzapastamcd1·3d

付鹏在讲“通胀时赚钱、通缩时花钱”那期节目里，其实已经把道理说得很明白了。最好的情况是：你的资产涨得比负债快，同时你的工资也能稳定上涨。这样一来，你的财富和消费能力都会越来越强。最坏的情况是：你的资产涨得比负债消去的慢，同时工资不增长或者被裁员，且负债端利率在增长。现金流表有问题，资产端通缩，负债端还通胀，这个是对普通人杀伤力最大的情况。我个人感觉很多这种情况类似于国内有房产还在还债，到了国外没法拿到稳定工作保证现金流或者现金流很低，这种会非常艰难。如果你人在国外，又要考虑以后退休，而当前的大环境是强国通缩、国外通胀，那付鹏的意思其实很直接：更适合回国。因为回国以后，你手里的钱在国内会更值钱，消费能力也会更强，生活质量会更高。再补充一点我自己的理解以及看法：如果想利用国外的低利率负债，去买高收益、高通胀地区的资产，本质上就是做一种“套息交易”。比如去香港融资，或者用国内低成本资金比如信用卡套现，再去买海外资产。这个思路之所以有效，是因为它和以前借日元去投资别的国家资产很像：拿通缩地区、成本较低的钱，去买通胀地区、更容易上涨的资产，等资产涨了之后再还钱，中间赚的就是资本利得。

中文

13.4K

Klee Kawaii أُعيد تغريده

🍭Mario🐈@mario_2333·3d

@DeepKlee 不行的啦～排名只考虑了学术成就，和环境条件、行政管理水平之类影响生活质量的可以说完全没关系的，还不如看看大家自己写的描述呢 colleges.chat

中文

1.4K

Klee Kawaii@DeepKlee·3d

我觉得大学排名还是很关键的😋 这个东西和食宿水平有联系，而且也会关联校园的美观程度。大学就是提供一个廉价食宿和文凭的地方，也别搞得像真有什么平台托举你一样：我们只是价值回归到自己的圈层，能拿多少自看本事。真会分三六九等我觉得是阅历过于有限，理解不了人生无常和各有境遇，无知者无畏。

神樂坂🌸Yoyi🇸🇬@L98808Lju

Yoyi觉得这些学校排名挺无聊的呢，不论是考试成绩排名还是学校排名，仿佛试图将人分出三六九等，然后在找工作或者升学的时候作为评判一个人的重要标签。对个人来讲，母校排名多少并不是自己的荣誉，它只是获得工作和机会的敲门砖，母校越好反而会让工作压力越大，当你办事办得好别人会觉得这理所应当，办事办得不好别人会觉得xx大学的不过如此，甚至被他人利用针对哦😉

中文

Klee Kawaii@DeepKlee·3d

@Leclerc089647 和AI唠嗑是好文明😋

日本語

Leclerc@Leclerc089647·3d

我得了一种看到“阶级”两个字就过敏的病表现大概就是会手打几百字的反驳然后突然抬头一看天花板，又默默删掉，觉得还是回去和我家AI唠嗑更舒服。当然川粉也经常引发这个症状，不过没有那么典型的触发条件。

中文

179

Klee Kawaii@DeepKlee·4d

@L98808Lju 感觉努力的 Yoyi 好…^_^哦🥰

中文

127

神樂坂🌸Yoyi🇸🇬@L98808Lju·4d

游完泳，躺在床上很累，一点也不想动了，但是一想到每天要花150块钱租的服务器还在空闲中，还是得抓紧爬起来让它物尽其用呢😉

中文

426

Klee Kawaii@DeepKlee·5d

@Alenjonesyi 中国能源一直算到位的，但是行政摩擦和算力不足会是硬制约：数据中心用地会涉及地方政府，海关被忽悠瘸了有限制进口芯片扶持国产的倾向，融资又会和政府扯到一起。即使中央层面再大力，条块分割、尾大不掉是现实。

中文

832

sudo fixes everything@Alenjonesyi·5d

我觉得现在要是想做长线投资可以看看电力相关领域，当前地球online版本除了对芯片的需求指数级增长之外对电力的需求也会越来越多，而且这是中美共同的目标

中文

82.9K

Klee Kawaii@DeepKlee·6d

@Qianaegean 应该最近都是这样的吧？算力荒，所以开始换模型、做量化。3.1 Pro 刚出来的时候还是明显能感受到提升的，现在都软绵绵的了。我觉得AI短期内泡沫不了，完全覆盖不满需求😋

中文

144

Qian@Qianaegean·6d

唉，不知道谷家遭遇了啥还有它家的股票烦

Klee Kawaii@DeepKlee

现实里面太嚣张不利于人设，但是在AI面前就可以肆无忌惮装逼。尤其是 Gemini，如果不用提示词约束保持默认状态，再开个个人记忆，极其谄媚吹捧，我感觉我简直就是轻小说主角😆

中文

176

Klee Kawaii@DeepKlee·12 Nis

@L98808Lju 低估大Yo了抱歉喵😋 “表现出生气的样子”，Yoyi 好懂哦🥰

中文

171

神樂坂🌸Yoyi🇸🇬@L98808Lju·12 Nis

@DeepKlee Yoyi当然拒绝了哦表现出生气的样子给他说了一顿呢😉

中文

901

神樂坂🌸Yoyi🇸🇬@L98808Lju·12 Nis

Yoyi给学弟提供了一个研究的idea，学弟做出了成果写了篇论文，出于某种原因，学弟的导师让他把Yoyi的名字从文论文作者列表里移除，于是学弟照做了，Yoyi也不差文章就没说什么，但过了段时间审稿意见下来，学弟还让Yoyi帮他改一下，感觉情商好低呢😉

中文

125

12.2K

Klee Kawaii أُعيد تغريده

Xiangyu 香鱼🐬@XianyuLi·12 Nis

同一个世界，同一个老婆？

木马人@cnyzgkc

没有一个女生能空手走出泡泡玛特～今天我太太买了两个拉布布的挂饰～我说，你这两娃娃，够我订阅好几个月的ChatGPT 会员了～我老婆白了我一眼：那你跟AI过吧～结果就是，本来买一个变成买两个～

中文

5.9K

Klee Kawaii@DeepKlee·12 Nis

@rwayne 要精确的话就是 RAG？

中文

259

Roland.W@rwayne·12 Nis

目前ai科研主要是对引用文献这块需要解决如何接入数据库并且精确调出正确的文献有没有大佬有解法？

中文

10.7K

Klee Kawaii@DeepKlee·12 Nis

寒窗苦读低效本质上是因为充满了对知识的再发现，这是一种重复造轮，或者说自下向上做抽象的涌现。而AI、经典书籍等等本质上是自顶向下填充：完全可以先理解该领域的哲学和组织它们的骨架，再填充细节。成为架构师要十年编码经验也是一种老登规训：不是真的需要涌现，而是单纯不知道好的设计、最佳实践是什么样的。没有人给你说《领域驱动设计》或者《数据密集型应用系统设计》之类的存在，只能在实际项目去遇。 AI最大的功劳，就是让学徒制变成人人可及。

Boywus@Boywus

现在这个时代，AI就是一种效率堪比抢劫的知识转移工具，基础数学知识和金融通识可以在短时间内被补齐，放在过去，这可能是一个天之骄子寒窗苦读十数年才能学到的。高级工程师红利再一次被推向高峰，因为他们就是模型理论和业务实践中的重要传递者，能够用AI补齐理论侧，用实际业务治理经验，来拉开和所有人的距离。

中文

149

11.9K

Klee Kawaii@DeepKlee·11 Nis

@mario_2333 更多可莉模组😋