
🚨 Tencent выложили модель для агентов HY-Embodied-0.5
Это модель, заточенная под embodied агентов. То есть тех, кто действует в физическом мире или его симуляции.
Фокус смещён с текста на восприятие и действие. Модель учится понимать пространство, время и принимать решения на основе этого.
В линейке две модели.
• Модель на 2B параметров открыта и подходит для edge-сценариев. Её можно гонять локально и встраивать в реальные системы.
• Модель на 32B уже про сложное планирование и reasoning. По качеству она приближается к фронтирным решениям.
Архитектура Mixture-of-Transformers. Разные части модели обрабатывают разные типы данных. Это снижает шум и даёт более точное восприятие.
Latent tokens. Более компактное представление визуальной информации, что помогает модели лучше понимать окружение.
Self-evolving post-training. Модель продолжает дообучаться и улучшать поведение после базового обучения.
On-policy distillation. Знания переносятся с большой модели на маленькую без сильной потери качества.
По бенчмаркам маленькая модель обгоняет аналоги на большинстве задач. Это важный сигнал для edge и роботики.
GitHub: github.com/Tencent-Hunyua…
Hugging Face: huggingface.co/tencent/HY-Emb…
Русский





















