dronnick

734 posts

dronnick banner
dronnick

dronnick

@dronnick

Baden-Württemberg, Deutschland Entrou em Ekim 2008
328 Seguindo36 Seguidores
vlad/r
vlad/r@_architected·
Чем вы пользуетесь то в итоге – Claude Code или Codex?
Русский
68
0
40
16.9K
Lyra
Lyra@LyraSongstress·
@jonoringer @NousResearch wait this is so cool?? local models running that well on a 4090 is such a win!! we've been testing with qwen3.5 too and the results have been mindblowing. what kind of speeds are you seeing? ♪
English
1
0
0
159
Jon Oringer
Jon Oringer@jonoringer·
hermes @NousResearch agent with qwen3.5:35b-a3b on a 4090 is VERY good.. local models very impressive..
English
18
6
208
22.3K
dronnick
dronnick@dronnick·
@petergyang run it with vLLM on dual RTX 4090 24GB, with 48GB VRAM it can serve 128k context window for about 4 parallel requests, 100 tps
English
0
0
2
221
Peter Yang
Peter Yang@petergyang·
What is the sweet spot in open source model size? Are 35B models enough for local agentic workflows? Trying to decide how much RAM I need in a new computer.
Qwen@Alibaba_Qwen

⚡ Meet Qwen3.6-35B-A3B:Now Open-Source!🚀🚀 A sparse MoE model, 35B total params, 3B active. Apache 2.0 license. 🔥 Agentic coding on par with models 10x its active size 📷 Strong multimodal perception and reasoning ability 🧠 Multimodal thinking + non-thinking modes Efficient. Powerful. Versatile. Try it now👇 Blog:qwen.ai/blog?id=qwen3.… Qwen Studio:chat.qwen.ai HuggingFace:huggingface.co/Qwen/Qwen3.6-3… ModelScope:modelscope.cn/models/Qwen/Qw… API(‘Qwen3.6-Flash’ on Model Studio):Coming soon~ Stay tuned

English
79
3
87
34.4K
dronnick
dronnick@dronnick·
@krawlad @vottak_tv Как показала практика, вообще всех ментов можно арендовать
Русский
0
0
1
500
Vladimir
Vladimir@krawlad·
@vottak_tv А что автозак можно арендовать?
Русский
2
1
5
12.5K
Вот Так
Вот Так@vottak_tv·
«Че не понятно, бл*ть?!»: пропагандист Красовский требовал прекратить интервью с Ксенией Собчак Во время съемки видео экс-сотрудник RT начал кричать на членов съемочной группы. Согласно концепции интервью, Собчак и Красовский должны были ездить по Москве на арендованном автозаке. Однако пропагандисту стало плохо, и он матом требовал остановить автобус. Антон Красовский известен своими маргинальными поступками и выражениями. Например, в 2022 году он призывал уничтожать нелояльных украинских детей и танцевал на балконе, «празднуя» массированные обстрелы по Киеву.
Русский
203
90
924
482.4K
Лорд Иктор
Лорд Иктор@lord_iktor·
Чтобы скачать 10 петабайт данных за 10 месяцев нужна скорость в 3,5 гигабита круглосуточно. Не так чтобы я не верил в эту утечку, но великая партия китай наверное все же заметили бы внешний канал такой скорости. Ну это слишком много для незаметного скачивания из-за золотого щита
Русский
21
0
115
24.6K
dronnick
dronnick@dronnick·
@badlogicgames Last December, as pi was version 0.0.1 or so, I made an experiment with GPT-OSS 20b. Vibesloped in few evenings a Rust CLI tool for VM deployments on Proxmox. First discussed PRD with Gemini 3pro, than let pi and GPT-OSS implement. It worked just fine.
English
0
0
2
401
Mario Zechner
Mario Zechner@badlogicgames·
only a sith speaks in absolutes. local model use cases of mine: - quickly post process whisper STT outputs - text embedding models for various bullshittery - NLP (e.g. NER, paraphrasing, etc.) not fit for coding, but absolutely not useless at all. clanker outside the box.
David Cramer@zeeg

an awful lot of people promote local models when they're unusable (hardware wise, perf wise, or simple outcomes) one of the many small litmus tests of "does this person have anything to contribute to the conversation"

English
10
3
174
17.1K
Garaev Ruslan
Garaev Ruslan@garaevruslan03·
Такой рекламы АвтоВАЗ не видел 1000 лет
Русский
61
95
670
68.3K
dronnick
dronnick@dronnick·
@vicvickki А чем он дороже двух раздельных? В зависимости от цены лицевой панели, так даже дешевле выходит.
Русский
1
0
0
13
Викос
Викос@vicvickki·
про наши потребности. Даже про размер выбранной мебели не спросила! Но зато пыталась втюхать дорогой и по факту ненужный двухуровневый ящик. Не проконсультировала по материалам, не по подсветке. Дошло до того, что мы сами пошли смотреть материалы и образцы.
Викос tweet media
Русский
3
0
25
1.1K
Викос
Викос@vicvickki·
Ходили сегодня во вторую контору, заказывать кухню, и как нам ТАК не понравилось. Я очень одновременно снисходительно и придирчива к так или иначе коллегам по цеху, но тут я просто афигела от "клиентоориентированости". Мадам не задала ни одного вопроса, ни про наш быт, ни
Русский
1
0
42
6.2K
dronnick
dronnick@dronnick·
@NahuiGPT У меня 6 месяцев
Русский
0
0
0
718
Badich
Badich@NahuiGPT·
по поводу срока увольнения в Германии 3+ месяца тоже есть что. Был у нас коллега, классный спец, лидер направления. Месяц назад сообщил что увольняется. Всем грустно - но бывает. Формальный срок - 1 июня.
Русский
8
0
234
38.8K
Ильдар
Ильдар@Ildar_De·
Все, сегодня тот самый день - покидаем Германию. Это был длинный и непростой этап жизни, но мир меняется, а в Германии меняется только размер взносов левакам...
Русский
74
7
425
76K
Matthew Berman
Matthew Berman@MatthewBerman·
Looking for some agent-addicted people to test a new project I've been working on. Comment below and I'll send you access.
English
429
7
345
40.8K
dronnick
dronnick@dronnick·
@neogoose_btw @guillemusgs This was my first impression too - two tools are confusing. Just added an issue with an example where GLM-4.7 struggles to use the correctly on first attempt.
English
1
0
0
27
Dmitriy Kovalenko
Dmitriy Kovalenko@neogoose_btw·
Introducing fff-ai. It's a file search tooling optimized specifically for your AI 1) significantly faster than fzf and ripgrep 2) has fuzzy code search fallbacks 3) better sort and suggestions of access frecency, git status, file size, etc Avg -10% wall time and -17% tokens
English
26
22
534
184.4K
dronnick
dronnick@dronnick·
@badlogicgames This will probably reduce global daily CO2 emissions by several tons.
English
0
0
0
98
dronnick
dronnick@dronnick·
@stevibe Any special reason for temperature 0?
English
0
0
0
86
stevibe
stevibe@stevibe·
Which local models can actually handle tool calling? I built a framework to find out. 15 scenarios. 12 tools. Mocked responses. Temperature 0. No cherry-picking. Tested every Qwen3.5 size from 0.8B to 397B, and since some of you asked after the distillation tests: yes, I included Jackrong's Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled too. Only two models went all green: the 27B dense and the distilled 27B. The 397B? Failed two tests. The 122B? Failed one. The 35B? Failed two. The timed-out results — mostly on the smaller models, are cases where the model got stuck in a loop, repeating the same tool call until it hit the 30-second limit. The test that exposed the most models: "Search for Iceland's population, then calculate 2% of it." Simple, but 35B, 122B, and 397B all used a rounded number from memory instead of the actual search result. They didn't trust their own tool output. Small models hallucinate data. Big models ignore data. The 27B just threaded it through.
English
113
251
2K
405.3K