Codatta中文社区

370 posts

Codatta中文社区 banner
Codatta中文社区

Codatta中文社区

@Codatta_China

构建 AI 的知识协议层,让你的知识数据变成你的资产 @codatta_io

Entrou em Temmuz 2013
8 Seguindo727 Seguidores
Codatta中文社区
Codatta中文社区@Codatta_China·
机器人需要学会操作人类日常使用的控制装置。通过标注旋钮,你为具身AI操作现实世界电器提供了所需的数据。🤖🎛️ 发现旋钮 ▶️ 标注 ▶️ 提交并赚取奖励。 观看本指南,立即开始训练具身AI!👇
中文
1
0
0
7
Codatta中文社区
Codatta中文社区@Codatta_China·
祝贺亚洲首个「以太坊社区中心」正式落成!🎉 Codatta 将作为圆桌嘉宾参与本次活动。 期待在现场与各位 Builder 们交流连接!
Hong Kong Ethereum Community Hub@ethereumhkhub

Asia’s first☝️Ethereum Community Hub is opening. Backed by @EFetheverywhere (@ethereumfndn) Operated by @snzholding & @Ethtao_Ethtao A milestone for Ethereum in Asia. Expect: 1⃣Core ecosystem voices 2⃣Leading institutions & builders 3⃣Real conversations on applications & adoption Join us during 🇭🇰Web3 Festival. See what’s next for Ethereum in Asia. RSVP👉luma.com/uf5v6joa

中文
0
0
0
40
Codatta中文社区
Codatta中文社区@Codatta_China·
Codatta 的数据不止“存着”——它持久、私密、访问极快! 我们把去中心化真源与云端热路径融合,再叠加安全计算,让每字节数据都绑定贡献指纹(CF)和数据集版本,来源永远可追溯。 工作原理如下: 存储:载荷在写入前即完成加密,内容哈希与 CID 永久锚定在 Arweave、IPFS/Filecoin 等去中心化网络作为不可变真源,同时镜像到 S3/GCS/OSS 提供低延迟访问。 核心原则:内容引用永不改变,缓存层只镜像策略允许的字节。 计算:两种隐私优先模式 - TEE 飞地:按需进行脱敏、特征提取等变换,无需暴露原始数据 - 联邦式运行:数据留在本地孤岛,仅传输模型更新 服务:访问网关在任何数据交付前强制执行角色/属性/令牌策略,同时生成计量事件用于审计与精准计费。 结果:相同数据集版本的相同请求,永远产生一致的计量轨迹,可完全重放、可审计、可追溯!真正实现 Web3 真源 + Web2 性能 + 端到端隐私保护的混合架构。 📖 完整文档:docs.codatta.io/cn/core-system…
Codatta中文社区 tweet media
中文
0
0
0
62
Codatta中文社区
Codatta中文社区@Codatta_China·
Data on Codatta doesn't just live somewhere — it's encrypted, anchored, and served through a layered architecture designed so that provenance is never broken. Here's how it works. 🧵 Storage: Every payload is encrypted before storage. Content hashes and CIDs are anchored to decentralized networks (Arweave, IPFS/Filecoin, BNB Greenfield) as the source of truth, then mirrored to cloud hot paths (S3, GCS, OSS) for low-latency access. The key principle: content references never change — caching layers only mirror permitted bytes. Compute: Two patterns for secure processing: - TEE enclaves — per-request transforms (redaction, feature extraction) without exposing raw data - Federated runs — training across isolated data silos; data stays local, only updates transfer Serving: An access gateway enforces role, attribute, and token-based policies before any data moves. Every request generates metering events, logged for audit and billing alignment. The result: identical requests against the same dataset version always produce identical metering trails. Replayable by design. 📖 Read the full docs: docs.codatta.io/en/core-system…
Codatta中文社区 tweet media
English
0
0
0
31
Codatta中文社区
Codatta中文社区@Codatta_China·
这才是真正将数据变成资产的意义 —— 它不再只是一个文件,而是一个带版本、可证明、归因到每位贡献者的记录,你可以从其历史的任何时间点进行审计。 完整文档请见: docs.codatta.io/en/core-system…
中文
0
0
0
14
Codatta中文社区
Codatta中文社区@Codatta_China·
核心保证: - 确定性:相同的输入 + 相同的规则 = 每次都产生完全相同的输出 - 不可变性:历史版本永远不会改变 - 完全可解释性:可以清楚说明为什么某个 CF 被纳入或排除 - 引用完整性:验证总是引用它所评估的 CF —— 没有任何内容是漂浮无根的
中文
1
0
0
36
Codatta中文社区
Codatta中文社区@Codatta_China·
Codatta 数据组装机制:原始贡献如何转变为可重现的数据资产与版本化数据集 —— 附带完整血统记录,支持溯源、差异对比与回滚。 在 Codatta,每一个原子级贡献(一个样本、一条标注、一次验证)在被接受的那一刻,就会获得一个贡献指纹(Contribution Fingerprint,简称 CF)。这个 CF 是后续所有构建的基础单元。以下是我们的组装流程:🧵
Codatta中文社区 tweet media
中文
1
0
0
38
Codatta中文社区
Codatta中文社区@Codatta_China·
用互联网回收文本训练出来的模型已经撞墙。接下来的出路,在于前沿数据。 那种真正稀缺、深耕特定领域、又经过人工验证的数据——比如手术机器人、金融推理、文化语境、极端场景下的科学问题。 Codatta 正在搭建冲破瓶颈的基础设施——把专家的真知灼见,变成带版权、可追溯的链上资产,直接喂给下一代的 AI 模型。
Codatta中文社区 tweet media
中文
0
0
0
64
Codatta中文社区
Codatta中文社区@Codatta_China·
Codatta 数据集系列(6):大模型失败案例 大模型不仅会犯错,它们会自信地犯错。错误的对称性原理、有缺陷的数列推理、前后矛盾的逻辑。最危险的错误,不是模型表示"不确定"的那些,而是那些听起来完全正确的回答。 LLM-Failure-Cases 是 Codatta 在 @huggingface 上开源的数据集,来源于 Airdrop Season 1 期间收集的真实对抗性提交。贡献者找到了让主流大模型翻车的提问,并为每个失败案例附上了专家点评,解释错在哪里、为什么错。 ✨ 有什么不同: 模型级追踪:每条失败案例标注对应模型(GPT-4o、Gemini、Claude 等) 专家点评:不只是标出错误答案,而是解析错误背后的原因 多领域覆盖:物理、数学、逻辑、科学、语言理解 双语支持:中英文 🛠️ 适用任务: ✅ 模型评估与红队测试 ✅ 幻觉现象研究 ✅ RLHF 训练数据 ✅ 专家评审分析 📊 探索并下载数据集:huggingface.co/datasets/Codat… 🤝 参与共建 LLM 纠错数据集:app.codatta.io/app/frontier/8…
Codatta中文社区 tweet media
中文
0
0
0
63
Codatta中文社区
Codatta中文社区@Codatta_China·
总结: 数据一直都在创造价值。但直到现在,这些价值很少能回流到真正构建它的人手中。 Codatta 的数据血统系统旨在改变这一切——将每一次贡献都转化为可追踪、可拥有、可变现的资产,并拥有不可篡改、不可删除的永久记录。 从原始提交到最终支付,每一步都清晰可见,每一位参与者都需负责,每一笔奖励都可验证。
中文
0
0
0
31
Codatta中文社区
Codatta中文社区@Codatta_China·
4/ 支付(Payouts) 最终阶段闭合经济循环。当采用事件产生收入时(例如许可费),它会被可视化为一个“支付事件”——并将连接线拉回到每一个曾贡献过的原始锚定资产。 由于分数所有权可交易,支付不会自动流向原始创建者。血统系统会识别当前持有者——无论是原始贡献者还是二级市场买入的 Backers——并确保奖励到达在快照时刻实际持有该资产份额的钱包。 所有权会演变,但记录不会。
中文
1
0
0
67
Codatta中文社区
Codatta中文社区@Codatta_China·
大多数链上数据生态系统只会告诉你“发生了什么”。Codatta 的数据血统(Data Lineage)将向你展示“为什么这很重要”——并确保价值能够回流给每一位创造它的人。 Codatta 平台即将上线:对每一个数据资产提供透明、不可篡改的可视化——从它在链上被验证的那一刻起,经过组装成数据集,直到它产生的具体支付事件。 在 @base 链上构建。每一次贡献都被完整记录。
Codatta中文社区 tweet media
中文
1
0
0
77
Codatta中文社区
Codatta中文社区@Codatta_China·
Codatta 数据集系列 (5):RoboManip-Traj-Demo 🤖 具身智能(Embodied AI)最大的瓶颈并非算法,而是高质量数据的极度稀缺。 RoboManip-Traj-Demo 是 Codatta 在 @huggingface 上开源的数据集,专为具身智能和计算机视觉研究设计。 它专注于机器人操作轨迹,提供高精度操作数据和细粒度标注。凭借高精度的空间坐标以及丰富的事件/姿态标注,该数据集有力支持以下下游任务: • 轨迹预测 • 关键帧提取与事件检测 • 细粒度机器人控制 • 物体交互分析 📊 查看 & 下载数据集:huggingface.co/datasets/Codat… 🤝 帮助我们共同构建下一代 AI 数据集: app.codatta.io/app/frontier/R…
Codatta中文社区 tweet media
中文
0
0
0
44