Ján Regeš

132 posts

Ján Regeš

Ján Regeš

@janreges

Head of Development & Infrastructure @SiteOneCZ, author of @siteone_crawler

Prague / Slovakia Katılım Ekim 2009
530 Takip Edilen113 Takipçiler
Ján Regeš
Ján Regeš@janreges·
Hi @stevibe, thank you for your great benchmarks! It would be great if you could automatically publish a leaderboard for CLI-40 and other types of benchmarks, showing how each LLM (commercial and open-weight) has historically performed on each benchmark. For example, as a wiki in the repository?
English
1
0
0
45
stevibe
stevibe@stevibe·
Benchmarked 7 models on real Linux shell tasks. The worst one refused literally zero destructive commands. New Bench Pack on BenchLocal: CLI-40. 40 Linux shell scenarios, real Docker execution, no mocked tool calls. Ran it against 7 models and the headline isn't who won, it's this: Every model tested is bad at refusing bad tasks. Category G of CLI-40 tests Restraint and Safety: scenarios that ask the model to do something destructive, unnecessary, or already satisfied. Scores, lowest to highest: > GLM 5.1 — 0 > MiniMax M2.7, Qwen3.6, Gemma4, DeepSeek V4 Flash — 23 > Kimi K2.6 — 40 > DeepSeek V4 Pro — 53 The best score is a D. The rest of the leaderboard: > Three-way tie at 73 between Kimi K2.6, DeepSeek V4 Flash, and DeepSeek V4 Pro. > Gemma4 31B (72) and Qwen3.6 27B (71) right behind. > MiniMax M2.7 and GLM 5.1 trail at 61 and 60. The bright spot: Investigation tasks (read a log, find the answer, write it to a file) — 90+ across all 7 models. That part is basically solved. So: find things, yes. Stop and think before running the command, not yet. CLI-40 is live in the Bench Pack section of BenchLocal.
English
22
7
92
12.1K
Ján Regeš
Ján Regeš@janreges·
Když před několika měsíci vydal Anthropic do Claude Code subagenty, hned první den jsem zavětřil gamechanger. Ještě ten večer jsem sestavil tým několika agentů pro SW vývoj a nechal je realizovat malý testovací projekt. Agenti si zadávali práci i mezi sebou, ale po pár desítkách minut docházelo k memory leakům a padání CC. Hned další ráno byla vydaná nová verze CC, která místo omezení hloubky rekurze agentů vypla možnost volat agentům jiné agenty a vše muselo jít přes orchestrátora (main session). Byl jsem z toho zklamaný. Před pár dny ale Anthropic vydal týmy agentů a to je dle mého ten opravdový gamechanger. Domysleli tam i komunikaci mezi agenty a sdílení úkolů, nikoliv pouze delegování. Implementovali to jako možnost nechat si sestavit tým agentů dynamicky pro daný komplexní úkol. Společně se zadáním je teď možné požádat CC, aby pro realizaci sám sestavil tým agentů. Pochopitelně je ale lepší, pokud společně se zadáním sami navrhnete a krátce popíšete, kolik a jakých přesně agentů doporučujete, aby pro realizaci použil. I když je to první verze tohoto konceptu, funguje to s Opus 4.6 obdivuhodně dobře a je to vlastně už i v této podobě můj splněný sen o tom, jak orchestrovat realizaci komplexních úkolů. Tokeny to papá rádo, ale výsledek stojí za to! Doporučuji si tu experimentální funkci aktivovat, pochopit jak funguje a challengovat ji na vlastních úkolech, projektech, expirementech. code.claude.com/docs/en/agent-…
Čeština
0
0
0
49
Alex Lieberman
Alex Lieberman@businessbarista·
I want to start a community dedicated to Claude Code. It’s become the gateway drug to coding and experiencing the power of AI for tons of people. This will be a space for people to share killer use cases, agentic workflows, proven prompts, and connect with other CC obsessives. Comment “Claude” if you want to join.
English
7.1K
208
6.3K
621.3K
Ján Regeš
Ján Regeš@janreges·
@MultiTricker Milióny let SecureCRT se SecureFX na rychlý přesun souborů, kdysi dávno WinSCP. Pro RDP nativní RDP nebo Jump na iOS/macOS. Termius pro SSH z iOS.
Čeština
0
0
1
134
Michal Ševčík
Michal Ševčík@MultiTricker·
Používáte někdo nějaký hezký SW na správu připojení, především SSH a v druhé řadě RDP? Sám jedu Kitty a spouštěné sessions, ale vůbec se nebráním něčemu lepšímu. Ještě správa VPN ve Windows je na prd, ale tam asi moc možností nebude (když je to systémová věc).
Michal Ševčík tweet media
Čeština
14
0
5
1.8K
Ján Regeš
Ján Regeš@janreges·
I use ChatGPT and Claude every single day. Claude can generate quite advanced diagrams (either through mermaid or SVG), but it's very far from being "wow". The ability to generate various forms of high quality diagrams/infographics would be a reason for me to pay for another service.
English
0
0
0
16
Yaroslav
Yaroslav@512x512·
Have you used ChatGPT, Claude or Perplexity today? How can we improve Grok to make you switch?
English
10.1K
412
8.3K
21.9M
Ján Regeš
Ján Regeš@janreges·
Obdivuhodné a velký respekt celému týmu! Je to relativně obecná otázka, ale máte prosím vhled do toho, co je na celé léčbě nejdražší? Předpokládám, že je velmi málo těchto zákroků, přístroje i specifické vzdělání doktorů jsou velmi drahé, takže 95% nákladů jde na „zpětné splácení“ toho, co se zakoupilo/naučilo dříve?
Čeština
0
0
0
529
Chirurg🔪
Chirurg🔪@Chirurg06·
🧵Case report o multioborové a multimodální léčbě mladé onkologické pacientky (neurologie/neurochirurgie/onkologie/chirurgie) Pac. 30-40 let chronické bolesti hlavy. Vyšetření v okr. nemocnici na neurologii a provedeno MRI vyšetření hlavy s nálezem nádoru mozku.
Chirurg🔪 tweet media
Čeština
55
62
1.1K
203.4K
Ján Regeš
Ján Regeš@janreges·
Nemyslím si, že v dohledné době ChatGPT zcela nahradí vývojáře, ale už teď je to nástroj, kterým může každý vývojář zásadně podpořit svojí efektivitu a v jistých ohledech i kvalitu. Sdílím vlákno s pár užitečnými tipy, s čím dokáže smysluplně pomoct už i dnes #AI #development
Santiago@svpino

11 ways ChatGPT saves me hours of work every day, and why you'll never outcompete those who use AI effectively. A list for those who write code: 1 of 16

Čeština
1
1
1
353
Ján Regeš
Ján Regeš@janreges·
@JMachytka @bramboracka1 Je to někdy nevděčná role a obzvláště v cizím prostředí, kde daná role nemá přirozenou autoritu a důvěru z minulosti. Ne každému se poštěstí najít rozumně-optimální prostředí pro seberealizaci. Ale... Hlavu vzhůru, občas slevme z nároků a nevzdávejme se :-)
Čeština
0
0
1
0
Ján Regeš
Ján Regeš@janreges·
Pokud pracujete v menší či větší IT firmě, přečtěte si prosím tento můj článek, který popisuje některé naše společné problémy. Věřím, že si z toho odnesete něco prospěšného i pro sebe a svoji práci. Budu vděčný za každý názor či váš pohled :) Hezký den. siteone.cz/novinky/scitan…
Čeština
1
5
21
0
Ján Regeš
Ján Regeš@janreges·
@posobota Technicky jde o dobrá tech. a architektonická rozhodnutí, kvalitní stack, sladění i akceptování pravidel, konzistenci ve vývoji, kvalitu vývojářů, řízení jejich očekávání v čase či hlídání rozumné míry overengineeringu :-)
Čeština
0
1
1
0
Ján Regeš
Ján Regeš@janreges·
@posobota Udržitelnost IT projektů vnímám jako disciplínu, kdy se usiluje o to, aby byla práce na projektu i po letech příjemná a bylo možné efektivně impementovat požadované změny. Aby kolem projektu dlouhodobě panovala dobrá nálada a vždy existoval tým, který na projektu rád pracuje.
Čeština
1
1
1
0
#posobota
#posobota@posobota·
Téma s03e04 je udržitelnost. Sustainability. Co si pod ním představujete spolu s IT? #nettefw #pehapkari
Čeština
5
0
4
0
Ján Regeš
Ján Regeš@janreges·
@borekb Nedám dopustit na tig clienta jonas.github.io/tig/ a “tig status”. Jak pro self code review před commitem s rychlým stageováním vybraných řádků či jejich revertem, tak pro prohlížení historie. Neukazuje ale highlighty změn uvnitř stejného řadku :-)
Čeština
0
0
0
0
Borek Bernard
Borek Bernard@borekb·
Diffy v konzoli nestuduju, ale s tímhle by se o tom dalo uvažovat: #side-by-side-view" target="_blank" rel="nofollow noopener">github.com/dandavison/del…
Borek Bernard tweet media
Čeština
2
1
20
0
Ján Regeš
Ján Regeš@janreges·
@debsuryorg Yes, exactly! This is another great support module and another layer of web security. I have no doubt that it will make happy many people.
English
0
0
0
0
Ján Regeš
Ján Regeš@janreges·
@banterCZ @novoj Čekal jsem tuto otázku a děkuji za ní :) Taky mě to irituje. Tuším kvůli čemu to tam je (krátké vs. dlouhé stránky vs. layout). Proberu s FE kolegy a upravíme to. Stejně jako pár dalších FE rezerv, které tam máme.
Čeština
1
0
1
0
Ján Regeš
Ján Regeš@janreges·
@debsuryorg @debsuryorg WOW!!! 😍 Brotli, Swoole and ModSecurity are 3 packages for which we had to use dynamically compiled modules with complicated Nginx upgrade process. 2 of 3 you have already solved. THANK YOU!
English
1
0
4
0
Ján Regeš
Ján Regeš@janreges·
@debsuryorg Ondrej, BIG THANK YOU for the implementation of mod_brotli to your Nginx repo 🙏 You made my day! ❤️ I’m your new patreon :)
English
0
0
1
0
Ján Regeš
Ján Regeš@janreges·
@debsuryorg Big THANK YOU for the implementation of mod_brotli into your Nginx repo. You made my day! I’m your new patreon :)
English
0
0
1
0
Ján Regeš
Ján Regeš@janreges·
@borekb V případě Linuxu a CLI doporučuji klienta tig a “tig cesta/ke/slozce”. Pro self-codereview před commitem a postupné stage-ování souborů a případně i pouze vybraných řádků, boží.
Čeština
0
0
0
0
Borek Bernard
Borek Bernard@borekb·
Nevíte o Git GUI klientovi, který by měl filesystem view a na něm operace typu "dej mi historii téhle složky"? Myslím, že to umějí JetBrains IDEs, nějaké další tipy?
Čeština
6
0
4
0
Ján Regeš
Ján Regeš@janreges·
@jantichy @ignum Pokud je potřeba hostovat více domén a oceníte i anycast NS, GEO a auto-failover funkcionality či statistiky, doporučuji Constellix a sekundárně ClouDNS. Stojí to pár $$. Nejbližší NS mají oba ve Frankfurtu.
Čeština
0
0
0
0
Jan Tichý
Jan Tichý@jantichy·
Kdo jste teď v poslední době také utíkali se svými doménami pryč od @ignum / Doména​.cz, kam jste nakonec šli? Nechce se mi trávit čas zkoušením a porovnáváním deseti jiných registrátorů. Etalon v podobě puvodni.domena​.cz je jasný. Nějaké doporučení, zkušenosti?
Čeština
17
0
4
0