Prompsit

2.8K posts

Prompsit banner
Prompsit

Prompsit

@Prompsit

We speak Natural Language Processing, Data Analysis and Artificial Intelligence, among many other languages!

Присоединился Haziran 2011
411 Подписки588 Подписчики
Prompsit ретвитнул
HPLT
HPLT@hplt_eu·
Describing HPLT datasets in depth is an essential part of our commitment as data curators: 🆕HPLT 3.0: Very Large-Scale Multilingual Resources for LLM and MT. Mono- and Bi-lingual Data, Multilingual Evaluation, and Pre-Trained Models: arxiv.org/abs/2511.01066 We are on🔥at #HPLT
English
0
6
7
294
Prompsit ретвитнул
HPLT
HPLT@hplt_eu·
The #HPLT crowd is at #EMNLP2025!!! If you are around, please visit our booth to discuss: - multilingual datasets 🌏 - dataset insights and stats 📊 - dataset performance 🔝 - efficient MT models ⏱️ - and the future of multilingual LLMs 💡 We don't want to miss U!
HPLT tweet mediaHPLT tweet media
English
0
2
9
767
Prompsit
Prompsit@Prompsit·
Gracias #PCUMH por insistir en que contemos lo que hacemos y por estar siempre atentos a nuestros avances y logros. Vuestro apoyo nos da visibilidad y alegrías como esta. ¡Gracias!
Parque Científico UMH@PcientificoUMH

📢 El #PCUMH, finalista en los “Disruptores Innovation Awards 2025” de @elespanolcom . 🏆Ha sido seleccionado como "Mejor proyecto impulsado por parques tecnológicos" gracias a la empresa @Prompsit , parte de @OpenEuroLLM . Noticia completa🔽 parquecientificoumh.es/noticias/pcumh…

Español
0
0
0
34
Prompsit
Prompsit@Prompsit·
Impossible oblidar el dia que vam conèixer a l'Olga Torres, aquell somriure que va fer de MultiTrainMT molt més que un projecte d'èxit quant als resultats: va fer pinya, va fer família. Eixe somriure ens acompanyarà sempre, DEP benvolguda amiga.
MultiTraiNMT@MultiNmt

Kick-off meeting at @UABBarcelona of MultiTrainMT "Machine Translation training for multilingual citizens meeting" @EUErasmusPlus project. Feel free to follow/contact us for further info and/or becoming an associate partner. Anyone interested in the topic is most welcome!

Català
0
0
1
184
Prompsit
Prompsit@Prompsit·
We had a great time at @MTSummit2025 presenting work about HPLT v2 multilingual datasets (v3 coming soon!) and ProMut, an improved DYI platform to teach and learn about MT. Great to be there also to celebrate the Award of Honour to our co-founder, CRO and friend Mikel Forcada! 😍
Prompsit tweet mediaPrompsit tweet mediaPrompsit tweet media
English
0
0
2
97
Prompsit ретвитнул
HPLT
HPLT@hplt_eu·
We are happy to announce the second release of HPLT bilingual datasets: - 50 English-centric language pairs = 380M parallel sentences (HPLT) 🤩 - 1,275 non-English-centric language pairs = 16.7B parallel sentences (MultiHPLT) 😮 Available at the HPLT dataset catalogue and OPUS.
English
0
12
15
1.2K
Prompsit
Prompsit@Prompsit·
Fue un gusto participar en esta jornada. Gracias por la invitación @PcientificoUMH, nos gustó mucho compartir la jornada con las compañeras de @Prosperabiotech. ¡Tenemos unas científicas y tecnólogas excepcionales a la vuelta de cada esquina! 👩‍🔬👩‍💻💪🦾
Parque Científico UMH@PcientificoUMH

Así ha sido la jornada sobre ciencia y tecnología en femenino organizada por el #ParqueCientífico de la @universidadmh para los estudiantes del @IES Victoria Kent 🧪🧬 Una sesión muy especial, promovida por @APTE y el #PCUMH, que ha contado con distintas charlas y talleres.

Español
0
0
1
97
Prompsit
Prompsit@Prompsit·
Para contaros lo que estamos haciendo en SmartBiC, proyecto liderado por @Linguaserve, nuestro póster de la @EAMT_2024 vale más que mil palabras.
Prompsit tweet media
Español
0
2
2
271
Prompsit ретвитнул
Rik van Noord
Rik van Noord@rikvannoord·
Happy to share our latest MaCoCu paper, accepted at #LRECCOLING2024 @LrecColing #NLProc 🎉 We have linguists annotate the data *quality* of 4 well-known monolingual corpora (OSCAR, CC100, mC4 and MaCoCu) across 11 European low-resource languages. Link: arxiv.org/pdf/2403.08693…
Rik van Noord tweet media
English
1
3
31
2.7K
Prompsit ретвитнул
HPLT
HPLT@hplt_eu·
First datasets, then models! Initial HPLT models (LLMs and MT) are out: hplt-project.org/models, some still running 🏃 We explain what we are doing in the deliverables section: hplt-project.org/deliverables Meanwhile, we keep cooking IA peta-data-bytes 🥘, enriching, dashboarding 📊
English
0
14
30
4.2K
Prompsit
Prompsit@Prompsit·
Hoy cumplimos 18 años haciendo lo que más nos gusta en este cruce entre lenguas y tecnología. Gracias por vuestra confianza. Per molts anys Prompsit! Gràcies de tot cor pel vostre suport! Happy birthday to us! 🥳 Thanks for your trust, we'll keep doing our best!
Español
0
1
3
143
Prompsit ретвитнул
HPLT
HPLT@hplt_eu·
We just published version 1.2 of HPLT datasets. What's new? - we fixed a bug in monolingual dedup, please redownload! 🛠️ - we filtered out very ugly monolingual documents🤮 - we anonymised the bilingual datasets🕵️‍♀️ hplt-project.org/datasets/v1.2
English
0
4
12
2.4K
Prompsit
Prompsit@Prompsit·
Select, filter, visualize your data (OpusCleaner). Then schedule and train MT and LLMs consistently (OpusTrainer) with them. As part of the HPLT project, we build tools to make it easy. They are open-source and we encourage you to use them. More:
English
0
0
1
124
Prompsit ретвитнул
Clarin.si
Clarin.si@ClarinSlovenia·
We are excited to share with you that we now provide 4 more massive monolingual corpora for under-resourced languages: you can access Icelandic, Ukrainian, Catalan and Greek #MaCoCu web corpora for free from the CLARIN.SI repository 😃
Clarin.si tweet media
English
1
18
35
4.7K
Prompsit ретвитнул
Taja Kuzman Pungeršek
Taja Kuzman Pungeršek@TajaKuzman·
#MaCoCu crew is in Groningen these days! Walking towards great results of MaCoCu corpora evaluation and new MaCoCu language models for under-resourced languages 😁
Taja Kuzman Pungeršek tweet media
English
0
2
13
436
Prompsit ретвитнул
HPLT
HPLT@hplt_eu·
Next June, 17th-25th, the #HPLT consortium will held a #hackathon around a set of topics related to corpora curation in Prague. Interested? Drop us a line and join! hplt-project.org/hackathon2023
English
0
3
7
845