Soynade Research

18 posts

Soynade Research banner
Soynade Research

Soynade Research

@soynade

The moon shines for everyone. https://t.co/hjdcnXFWAE

Katılım Kasım 2024
0 Takip Edilen104 Takipçiler
Soynade Research
Soynade Research@soynade·
Oolel-Embed est efficace grâce aux représentations Matryoshka, permettant de représenter l'information dans des espaces vectoriels très petits. Voyez Oolel-Embed en action:
Français
0
2
8
1.2K
Soynade Research
Soynade Research@soynade·
4e publication du mois de l'open-source de Soynade. Oolel-Embed: un modèle permettant de récupérer des documents directement à partir de la parole, sans passer par des étapes intermédiaires coûteuses de reconnaissance vocale et de traduction. Model: huggingface.co/soynade-resear…
Français
2
19
38
6.2K
Soynade Research
Soynade Research@soynade·
Continued pre-training allows us to be more compute-optimal than Orange's model while significantly outperforming the base Meta/HuBERT-Base model. We release the ASR fine-tuned model along with 100 hours of clean Wolof ASR data. Models and dataset here: huggingface.co/collections/so…
Soynade Research tweet media
English
1
4
3
751
Soynade Research
Soynade Research@soynade·
Release 2 of the Soynade Open Source Month. A small foundational speech representation model for Wolof, continued pretrained from Meta/HuBERT on 860 hours of Wolof speech. This improves the ASR performance using only unlabeled speech data. huggingface.co/soynade-resear…
Soynade Research tweet media
English
1
13
24
2.3K
Soynade Research
Soynade Research@soynade·
Frontier technology, research, and data should circulate, not sit behind closed doors. Anyone should be able to audit it, extend it, and build on it.
English
1
0
0
86
Soynade Research
Soynade Research@soynade·
Today we kick off Soynade's Open Source Month, four weeks of releasing models, datasets, and tools for African languages. Learn more: soynade.ai/research/soyna… The first release is live: → AfVoices-Translated: +200k Bambara-English speech translation dataset with acoustic tags.
English
1
4
4
857
Soynade Research
Soynade Research@soynade·
Ce qui permettra d'avoir des capacité multimodales pour les langues africaines à moindre coût 💸 Stay tuned! On a plein de modèles ouverts qui arrivent.
Français
0
2
2
139
Soynade Research
Soynade Research@soynade·
Oolel peut voir des images et vidéos : un vision LLM ouvert pour le wolof. Et il n’a été entraîné sur aucune donnée visuelle en wolof ! On explore des pistes de recherche pour transférer les capacités multimodales d’une langue à une autre, sans entraînement multimodal direct.
Français
1
4
6
261
Soynade Research
Soynade Research@soynade·
It has been optimized for essential tasks like natural text generation in Wolof and English, translation, and RAG capabilities, while maintaining a compact size.
English
1
1
1
187
Soynade Research
Soynade Research@soynade·
𝐎𝐨𝐥𝐞𝐥-𝐒𝐦𝐚𝐥𝐥-1𝐁: On-device AI for Wolof with a Lightweight Language Model  🚀 Meet Oolel Small, the lighter version of the Wolof LLM Oolel - bringing on-device AI to Wolof speakers. You can run it locally without any internet connectivity
English
1
12
13
2.9K
Soynade Research
Soynade Research@soynade·
En attendant, vous pouvez d'ores et déjà combiner ces deux technologies. C'est la beauté de l'open source - des innovations qui se complètent pour faire avancer les technologies pour les langues sous-représentées.
Français
1
0
1
109
Soynade Research
Soynade Research@soynade·
La combinaison de ces deux modèles open source ouvre la voie à de nombreux cas d'usage : création de contenus audio, assistants vocaux, etc. Les prochaines versions d'Oolel intégreront directement des capacités vocales.
Français
1
0
0
110
Soynade Research
Soynade Research@soynade·
Petite expérience intéressante que vous pouvez reproduire : générer du texte avec notre LLM 𝐎𝐨𝐥𝐞𝐥 et le vocaliser à l’aide du modèle Text-to-Speech de @galsenai.
Français
1
1
1
186