MacMallow

790 posts

MacMallow banner
MacMallow

MacMallow

@MacMalllow

SWE, Azure Developer, JS hater, bad at FE, AI agent builder amateur, angler, MTB lover, gamer with 27 years of experience

Katılım Ocak 2017
67 Takip Edilen6 Takipçiler
MacMallow
MacMallow@MacMalllow·
@censor_net він ж тільки недавно божився що це не в інтересах його країни... Чи це вже якась інша місія?
Українська
0
0
0
10
MacMallow
MacMallow@MacMalllow·
@Danko007 в мене тоже пригорає... могли б перенести гру в іншу локу...
Українська
5
0
8
3.2K
Oleg Danylov
Oleg Danylov@Danko007·
У росіян в Steam знатно пригорає від METRO 2039.
Українська
20
9
852
40.4K
MacMallow retweetledi
0x45
0x45@0x45o·
it is confirmed, we reached AGI
0x45 tweet media
English
392
881
20.1K
1.4M
MacMallow
MacMallow@MacMalllow·
What really triggers me is that many years have already passed since LLMs and a huge variety of benchmarks first appeared. Yet throughout all this time, people still have not understood how they actually work or what kinds of problems they have.
English
0
0
0
3
MacMallow
MacMallow@MacMalllow·
@pvncher According to system card, they want prompts to be less vague and more detailed... For me it indicates that model is not so intelligent... But maybe it's more tuned for detailed instructions...
English
0
0
3
654
eric provencher
eric provencher@pvncher·
4.7 is performing so poorly for me that I think it has to be a bug, potentially with the tokenizer change. It just doesn’t see text the same way the model is a lot less reliable as a result. I’m convinced it’s a regression on image comprehension too.
English
36
9
340
64.9K
MacMallow
MacMallow@MacMalllow·
@ThePrimeagen Mythos scored 77% on Swe-pro. I keep wondering when people will realize that, sooner or later, any open dataset will be saturated to 100%, but that will mean absolutely nothing about real production performance.
English
0
0
34
2.1K
ThePrimeagen
ThePrimeagen@ThePrimeagen·
If opus 4.7 scores a 64.3% on SWE-bench pro and mythos scored a 93.9% what % of SWE-bench pro is the too dangerous percent? 69? 75? 80? Is Dario edging us?
English
153
49
3.3K
149.1K
MacMallow
MacMallow@MacMalllow·
@bookazoid_ Дуже класно, але варто почекати бенчі на закритих датасетах. Коли датасет відкритий - не складає великої проблеми через RL не хирово так підтягнути папугаїв.
Українська
0
0
2
1K
MacMallow
MacMallow@MacMalllow·
Unit and integration tests will not solve your reliability problems. AI-generated tests are the kind of thing that helps you save nerve cells during development. But later you will lose even more of them when a critical issue hits you in production.
English
0
0
0
8
Roman
Roman@romxdev·
truly senior developer always picks the most boring technology possible agree?
English
74
5
159
16.6K
MacMallow
MacMallow@MacMalllow·
@kylegawley I think it is obvious that AI does not solve the quality problem. That is exactly the part that remains the responsibility of humans. And as we can see, we are not doing a particularly great job of it either.
English
0
0
0
2
Kyle Gawley
Kyle Gawley@kylegawley·
if ai is so great at building software why are we in peak enshitification?
English
50
17
363
8.3K
MacMallow
MacMallow@MacMalllow·
I thought that with the arrival of AI, software quality would actually improve. I thought we would finally be able to spend more time on code quality, covering edge cases, testing, and so on. But for some reason, the opposite happened. And honestly, I do not fully understand why. The only thing I know for sure is that AI is not to blame - human intelligence and laziness are.
English
0
0
0
6
MacMallow
MacMallow@MacMalllow·
If some CEO tells you that software engineers no longer write code for 8 hours a day because of AI, feel free to add that CEO to your list of idiots. That was never relevant in the first place. 80 percent of the time is spent writing specs, thinking through architecture at a lower level, reviewing and trying to understand the current code and its edge cases — code that was written a long time ago by many different people — figuring out the most optimal ways to implement changes, testing what was written, discussing technical solutions with the team, doing security hardening, talking things through with the client, debugging, and digging through logs. Another 15 percent goes into criticizing how inefficient the current project processes are, and how things were better two years ago.
English
0
0
0
5
MacMallow
MacMallow@MacMalllow·
@dissarray Блять, я один не пам'ятаю часів коли деви просто писали код 8 годин в день?
Українська
0
0
1
313
MacMallow
MacMallow@MacMalllow·
@kartanis @bookazoid_ Будь кому хто слідкує за ним, зрозуміло що Тео в дьосни сосатися готовий з Альтманом і Укомбінейтор двіжухою. Там блог вже давно не про розробку, чувак пиляє венчурні гроші)
Українська
0
0
0
22
Sergii
Sergii@kartanis·
@MacMalllow @bookazoid_ Та це на кожну модель так. Із opus те саме було
Українська
2
0
0
72
MacMallow
MacMallow@MacMalllow·
@kartanis @bookazoid_ З Опусом вони його реально занерфили обмеживши токен ліміти на thinking з часом. А з ГПТ5 там була просто рекламна компанія. В день виходу - Тео був одним з блогерів які його рекламили. Комюніті тоді висміяло реліз з перших годин. А Тео на льоту перевзувся)
Українська
0
0
0
57
MacMallow
MacMallow@MacMalllow·
@GoslingUA краще глянути Останнє Королівство - екранізація романів. А Вікінги максимально скатуються після 3 сезону
Українська
1
0
8
254
•Гослінг•
•Гослінг•@GoslingUA·
До якого сезону можна дивитись цей серіал? Просто наскільки я чув, там в якихось сезонах присутні "болотяні" неДОактори.
•Гослінг• tweet media
Українська
47
0
37
10.8K
MacMallow
MacMallow@MacMalllow·
@Pashak1436 Рубіо насправді один єдиний політик в респів, а не просто говоряща голова. Ну, не пощастило йому з начальством…
Українська
1
0
2
338
РК
РК@Pashak1436·
Як центрист Боже який позор Який то 20й пацан просто найшов вагон фіктивних компаній які тупо пиздять $ з бюджету І це чучело намагається взяти кредити за це Удачі демократам в 2028му Партія клоунів і дегенератів Сподіваюсь Рубіо виграє а не диванойоб
Governor Gavin Newsom@CAgovernor

California is again leading the charge against large-scale identity theft and hospice fraud. Today, we're taking decisive action against 14 providers who tried using stolen identities to bill Medi-Cal for nonexistent hospice services.

Українська
4
0
57
10.8K
MacMallow
MacMallow@MacMalllow·
@pofigiST_UA а сьогодні ми приготуємо севіче. найкращою рибою для севіче є карась і окунь.
Українська
0
0
0
127
ПоФігіст™🇺🇦😛
невже в Києві ніхто не пам'ятає 👇 як це робиться?
Українська
6
1
25
6.2K
MacMallow
MacMallow@MacMalllow·
@justme_ua @nesterov_u Я думаю проблема не саме в індусах. А в тому, що великі компанії не вміють масштабуватися. І я знаю про, що говорю бо працюю в такому середовищі. Мідл менеджмент працює для того щоб отримати премію. Їм головне заделівирити вчасно, а на якість пофіг.
Українська
0
0
7
233
Ted S. 🇺🇦
Ted S. 🇺🇦@justme_ua·
здається це із-за індусів - вони суто від кількості працівників пробились у керівництво і почали підтягувати своїх людей, і щоб влаштувати кума на тепле містечко - кажемо що поточні проєкти погані і потрібно переробити, в результаті того що команди теж підбираються під керівника, індуси видають свій фірмений код який не робе і потім все доводиться повертати
Українська
1
0
14
2K
Володар тепла у твоїй Хаті 🇺🇦🏳️‍🌈🇺🇸🇮🇱
Ахуєнно шо майкрософт майже вбили свій ігровий бізнес який стабільно зростав і приносив бабки за ради того аби спалити 100 лярдів в мікрослоп який тепер видаляють з відусіль.
Українська
7
2
123
15.5K