Łukasz Szawryński

69 posts

Łukasz Szawryński

@tempuzfugit

Getting the most out of artificial and real neural networks. Machine Learning specialist with 12 years of experience 🧠 Blockchain enthusiast ₿

Katılım Nisan 2025

77 Takip Edilen7 Takipçiler

Łukasz Szawryński@tempuzfugit·6d

@goorsky_pl Masakra, nie używajmy, piszmy ręcznie.

Polski

Goorsky@goorsky_pl·6d

Claude usunęło całą produkcyjną bazę danych z backupami 😎 #claude #claudeai

Polski

1.7K

Łukasz Szawryński@tempuzfugit·28 Nis

@claudiomutka napiwek zawsze powinien być dobrowolny, ja używam polskiej apki fasttip.app

Polski

Claudio Mutka@claudiomutka·28 Nis

Ogólnie zawsze zostawiam kelnerom, ale jakbym zobaczył coś takiego to mogliby zapomnieć o napiwku xD

Płonąca Firanka@MagnoliaNowak

Polski

336

19.4K

Łukasz Szawryński@tempuzfugit·27 Nis

@K_Stanowski Klasy nie kupisz

Polski

240

Krzysztof Stanowski@K_Stanowski·27 Nis

Babka nagrała kolejny film w którym stwierdza, że bez włosów wygląda się strasznie. Ja pierdolę.

BOOP.PL@boop_pl

Blanka Lipińska odnosi się do komentarzy pod jej filmem z nocy.

Polski

415

144

6.6K

477K

Łukasz Szawryński@tempuzfugit·26 Nis

@K_Stanowski To są firmy które wiedzą jak dużą moc ma dziś internet

Polski

Krzysztof Stanowski@K_Stanowski·26 Nis

Jako Kanał Zero jesteśmy dumni, że mamy takich sponsorów. Podium największych wpłat to firmy, z którymi na co dzień pracujemy: XTB - 6,2 mln ZEN - 5,5 mln Kuchnia Vikinga - 5,1 mln Bardzo dziękuję, dla nas to zaszczyt!

Polski

575

1.1K

28.2K

725.5K

Łukasz Szawryński@tempuzfugit·26 Nis

@Majki115 To jest osoba wyraźnie zepsuta, przesiąknięta nie wiem nawet jak to nazwać. Przykre

Polski

635

Miguel 🇪🇸 ⭐@Majki115·26 Nis

Ale to jest spierdolona baba. Zadeklarowała się, że się goli, a później zniechęcała ludzi do wpłat, bo dla niej to ciężkie. Opowiadała o fetyszach swojego faceta, a przy goleniu cieszyła się, że będzie wyglądać jak gwiazda porno. Niech wypierdala.

BOOP.PL@boop_pl

Blanka Lipińska po zgoleniu włosów.

Polski

3.4K

289.2K

Łukasz Szawryński@tempuzfugit·25 Nis

@thsottiaux @thsottiaux please reset, please reset.

English

Tibo@thsottiaux·25 Nis

It’s the little things that matter, what are some small papercuts you have noticed in Codex? We’ll fix as many as possible in the next week.

English

2.3K

265.2K

Łukasz Szawryński@tempuzfugit·25 Nis

@sama We need reset. We need reset. Sam. We need reset. Please.

English

Sam Altman@sama·25 Nis

5.5 is so earnest "little engine that could" energy

English

637

130

4.1K

362.7K

Łukasz Szawryński@tempuzfugit·25 Nis

@SzymonMachalic1 W sensie ta kawiarnia konkretnie ma swoją apke?

Polski

Szymon Machalica@SzymonMachalic1·25 Nis

@tempuzfugit Mają i jeszcze premiują posiadanie apki, bo tam czasami pieczątki są naliczane podwójnie.

Polski

Szymon Machalica@SzymonMachalic1·25 Nis

Jaki cyfrowy piniondz? Jakie tokeny? Za espresso tonic pieczątkami płace - tzw. old money.

Polski

3.5K

Łukasz Szawryński@tempuzfugit·25 Nis

@SzymonMachalic1 Chodziło mi o sam koncept zbierania pieczątek, nie picia kawy. Myśle że jakaś apka zniwelowałaby ryzyko zgubienia lub zapomnienia co mi zdarza się często

Polski

Szymon Machalica@SzymonMachalic1·25 Nis

@tempuzfugit No uwaga bo do picia kawy będę apki używał

Polski

Łukasz Szawryński@tempuzfugit·25 Nis

@miroburn GPT-5? czemu nie 5.4 albo 5.5?

Polski

409

miroburn@miroburn·25 Nis

Jestem zachwycony pracą z: Kimi CLI + Kimi 2.6 Codex CLI + GPT-5 xhigh Claude Code + Opus 4.7 xhigh Ten tydzień naprawił wszystko. Każde z tych narzędzi działa dobrze. W końcu zrobili mi upgrade ChatGPT, więc dziś jadę dużo na Codex. Co za czasy, aby budować.

Polski

6.3K

Łukasz Szawryński@tempuzfugit·24 Nis

🔥 GPT-5.5 właśnie dropnęło, a OpenAI zagrało sprytnie z benchmarkami! OpenAI wczoraj (23 kwietnia 2026) wypuściło GPT-5.5. Dostępny od razu dla Plus/Pro i przez API.Oto pełna tabela z oficjalnych wyników (patrz obrazek): Gdzie GPT-5.5 miażdży: 🧿Terminal-Bench 2.0: 82.7% (skok z 75.1% u 5.4, bije Claude Opus 4.7 o 13 pkt i Gemini) 🧿CyberGym: 81.8% – totalnie dogonił/rozjechał Claude’a Opus 4.7 (73.1%) 🧿OSWorld-Verified: 78.7% (minimalnie przed Claude’em 78.0%) 🧿GDPval: 84.9% 🧿BrowseComp: 84.4% (wersja Pro nawet 90.1%) 🧿FrontierMath i Toolathlon - też wyraźny skok A tu jest haczyk, o którym warto głośno mówić: Na Expert-SWE (Internal) pokazali wynik 73.1%. Tylko że to wewnętrzny benchmark OpenAI testowany wyłącznie na ich własnych modelach. Żadnego Claude’a, żadnego Gemini, żadnego otwartego porównania. Klasyczny ruch OpenAI: „pokazujemy tylko to, w czym jesteśmy najlepsi”. Nie ma tu śladu po publicznym SWE-Bench Verified ani SWE-Bench Pro tam gdzie wcześniej Opus 4.7 i Mythos od Anthropic miażdżyli. Zamiast tego dostajemy ich własny „Expert-SWE Internal” i agentyczne benchmarki, w których GPT-5.5 naprawdę świeci. Podsumowanie faktów: GPT 5.5 To model, który OpenAI celowo pozycjonuje jako narzędzie do realnej pracy - agentyka, cybersecurity, przeglądanie, terminal. I w tych obszarach jest już na poziomie przewyższającym konkurencje. Kto już odpalił GPT-5.5? Jakie pierwsze wrażenie po realnych zadaniach? Dajcie znać w komentarzu⬇️

Polski

Łukasz Szawryński@tempuzfugit·24 Nis

@truten2000 @MateuszChrobok Mam identyczne odczucia, codex przynajmniej gdy skończą się tokeny nie przerywa zadania. Polecam też Composera 2 sprawdzić sobie w Cursorze, ciężko osiągnąć limit za 20 dolców miesięcznie

Polski

Marcin Jużko 🇵🇱 🇪🇺@truten2000·24 Nis

@MateuszChrobok Przecież to było wczoraj, zdążyłem już zużyć tak ciągną tokeny te nowe modele od nich. Plany za 20 dolców tracą sens. 2 prompty i musze sie przełączać na codex lub kimi

Polski

621

Mateusz Chrobok@MateuszChrobok·24 Nis

Rada wujka Mateusza: zużyłeś limity claude code? Jest darmowy reset:

ClaudeDevs@ClaudeDevs

Over the past month, some of you reported Claude Code's quality had slipped. We investigated, and published a post-mortem on the three issues we found. All are fixed in v2.1.116+ and we’ve reset usage limits for all subscribers.

Polski

24.5K

Łukasz Szawryński@tempuzfugit·24 Nis

@CwanyKangur @KO_Kryptowaluty @44Crew_PL W sumie to dziś każdy dowód można zakwestionować w ten sposób. Ciekawe czasy

Polski

Cwany Kangur@CwanyKangur·24 Nis

@KO_Kryptowaluty @44Crew_PL A skąd pewność, że to nie AI?

Polski

2.6K

K.O Kryptowaluty@KO_Kryptowaluty·24 Nis

No i pojawiła się cała rozmowa z Rzeczpospolitej... za @44Crew_PL

Polski

423

74.3K

Łukasz Szawryński@tempuzfugit·23 Nis

@bridgemindai Pay attention to SWE - it's internal, i am courious why not regular SWE pro benchmark.

English

1.3K

BridgeMind@bridgemindai·23 Nis

GPT 5.5 JUST DROPPED. Claude Opus 4.7 is no longer the best model in the world. 82.7% vs 69.4% on Terminal-Bench 2.0. 84.9% vs 80.3% on GDPval. 81.8% vs 73.1% on CyberGym. Not even close. Sam said it would be a leap. He wasn't lying. OpenAI just took the crown back from Anthropic. And they did it across the board. Coding. Security. Math. Agentic tasks. Everything. Claude Opus 4.7 held the throne for exactly 7 days. BridgeBench is running the benchmarks right now.

English

123

133

1.6K

155.8K

Łukasz Szawryński@tempuzfugit·23 Nis

Przetestowałem właśnie Build Nvidia z uwagi na to, że udostępniają takie modele jak chociażby GLM 5.1 czy MiniMax 2.7 za darmo. Zintegrowałem klucz api z narzędziem OpenCode (Open source alternatywa dla Claude Code - przyjemna w integracji różnych modeli). Oto wynik bardzo trudnego prompta, mielił, aż 5 minut:

Polski

Łukasz Szawryński@tempuzfugit·22 Nis

@bridgemindai There is really no more sense to believe in this shi...

English

1.2K

BridgeMind@bridgemindai·22 Nis

Qwen 3.6 27B just scored 53.5 on SWE-Bench Pro. A 27 billion parameter open source model. If that doesn't prove these labs are benchmaxing, I don't know what does. This is a model you can run on a laptop. Outscoring Google. Nearly matching Claude Opus 4.5 on agentic coding. The benchmarks are broken. The labs optimized for the test, not for the work. This is exactly why BridgeBench exists.

English

265

30.2K

Łukasz Szawryński@tempuzfugit·22 Nis

Jak generalnie oceniasz jakość względem czołówki poki co? Bo ja mam wrażenie, że zbyt pewny siebie potrafi zcommitowac cos bez odpalenia podstawowych komend kompilacji czy builda, pamiętam, że kimi 2.5 nie miał takich problemów i zwykle na koniec upewniał się przed finalnym stwierdzeniem , że skończył

Polski

129

miroburn@miroburn·22 Nis

Dziś dzień eksperymentów. Kimi 2.6. Yolo. I produkcja.

Polski

7.3K

Łukasz Szawryński@tempuzfugit·22 Nis

@miroburn Mamy wkońcu czym się pochwalić jako Polska w dziedzinie AI, miażdży bielika w benchmarkach.

Polski

1.5K

miroburn@miroburn·22 Nis

Nie wiem, jak Wy. Ale ja jestem pod wrażeniem GPT Image 2. Genialny w wizualizacji pomysłów na biznes. P.S. Używałbym :)

Polski

31.1K

Łukasz Szawryński@tempuzfugit·22 Nis

To nie jest zwykłe partnerstwo - to compute na skalę, której Composer, czyli model od twórców Cursora nigdy nie miał. Colossus (~1M H100 equiv.) zdejmuje wszystkie bottleneck’i treningowe i może dać Composerowi skok w agentic coding + long-context refactoring.

Cursor@cursor_ai

We're partnering with SpaceX to improve Composer. cursor.com/blog/spacex-mo…

Polski

Keşfet

@goorsky_pl @claudiomutka @K_Stanowski @Majki115 @thsottiaux @sama @SzymonMachalic1 @miroburn