Devin

16 posts

Devin

Devin

@Devin32107895

Soy un chico amnte de la música, los videojuegos y de las redes sociales.

Altos del Rosario, Colombia Katılım Eylül 2020
123 Takip Edilen3 Takipçiler
Devin
Devin@Devin32107895·
@CommandCodeAI Oigan como hablo la cli si tiene el mismo nombre que el comando cmd de windows
Español
2
0
0
940
Command Code
Command Code@CommandCodeAI·
DeepSeek works best in Command Code. two ways to prove it: $1 Go plan with $10 → $40 for DeepSeek V4 pro read this harness engineering deep dive below: on how we fix and repair 50K+ tool calls, saving you cost and improve speed & quality of outputs.
Command Code tweet media
Ahmad Awais@MrAhmadAwais

how did we make deepseek outperform opus 4.7? i've been thinking about why "open model bad at tool calling" is almost always a harness problem, not a model problem. context: spent the two days looking at billions of tokens in @CommandCodeAI (tb open source ai cli) using deepseek. I ended up writing a tool-input repair layer. the trigger was watching deepseek-flash fail on the simplest /review run, every shellCommand and readFile call bouncing back with a raw zod issues blob, the model unable to recover because the error wasn't in a form it could read. by the end deepseek v4 pro was beating opus 4.7 6/10 times on our internal evals. a few things i learned that feel general: 1/ the failure modes aren't random they're a small finite compositional set. across deepseek-flash, deepseek v4 pro, glm, qwen, the same four mistakes repeat almost exactly: - sending `null` for an optional field instead of omitting it - emitting `["a","b"]` as a json *string* instead of an actual array - wrapping a single arg in `{}` where the schema expected an array (an "empty placeholder") - passing a bare string where an array was expected (`"foo"` instead of `["foo"]`) four repairs, ~30-100 lines each, ordered carefully (json-array-parse must run before bare-string-wrap or `'["a","b"]'` becomes `['["a","b"]']`). that is the whole catalogue. when i hear "this open source model can't do tool calls" i now assume one of those four, and so far that's been right ~90% of the time. 2/ the funniest failure mode is also the most revealing. deepseek-flash, when asked to edit or write a file, sometimes emits the path as a *markdown auto-link*: filePath: "/Users/x/proj/[notes.md](http://notes. md)" our writeFile tool obediently trued creating files literally named `[notes.md](http://notes .md)` until we caught it. this is not a hallucination. it's the post-training chat distribution leaking through the tool boundary the model has been rewarded for auto-linking in conversational output, and is applying that prior in a context where it makes no sense. the fix is two regex lines that unwrap only the degenerate case where link text equals url-without-protocol real markdown like `[click](https://x .com)` passes through untouched. this is also conditioning of their own tools during RL which were different from all other tools we write and ofc can't predict. "tool confusion" is a more useful frame than "capability gap." the model knows how to format a path. it just hasn't been told clearly enough that this path is going to fopen, not into a chat bubble. so we encode that hint at the schema level `pathString()` instead of `z.string()` and the leak is plugged for every path field at once. 3/ the design choice that mattered was inverting preprocess-then-validate to validate-then-repair. my first attempt was the obvious one: a preprocessing pass that normalized inputs (strip nulls, parse stringified arrays, etc.) before zod ever saw them. it broke immediately, writeFile content that *happened* to be json-shaped got rewritten before it hit disk. silent corruption, easy to miss in a smoke test. then i made it less greedy - parse the input as-is. if it succeeds, ship it. valid inputs are never touched. - on failure, walk the validator's own issue list. for each issue path, try the four repairs in order until one applies. - parse again. on success, log `tool_input_repaired:${toolName}`. on failure, log `tool_input_invalid:${toolName}` and return a model-readable retry message. the structural insight here is: when you preprocess, you encode a prior about what's broken. when you let the validator complain first, the schema is the prior, and you only spend repair budget at the exact paths the schema actually disagreed at. the validator is doing the work of localizing the bug for you. it's the same shape as cheap-then-careful everywhere else try the fast path, fall back on evidence. (this also gives you per-tool telemetry for free. you can watch repair rates per (model, tool) and notice when a model regresses on a specific contract before users do.) 4/ shape invariants and relational invariants need different fixes. the four repairs above all handle shape problems wrong type, missing key, wrong container. but read_file had a *relational* invariant: "if you provide offset, you must also provide limit, and vice versa." deepseek kept calling `readFile({ absolutePath, limit: 30 })` and getting an `ERROR:` back. you can't fix this with input repair, because each field is independently valid the bug is in the relationship between them. so i taught the function the model's intent instead. `limit` alone → `offset = 0`. `offset` alone → `limit = 2000` (matches common read tool ops default). then surfaced the decision back to the model in the result: "Note: limit was not provided; defaulted to 2000 lines. To read more or fewer lines, retry with both offset and limit." no `Error:` prefix, so the tui doesn't paint it red. the model sees what we picked and can self-correct on the next turn if our guess was wrong. transparency over silent magic wins big. repair where you can. extend semantics where you can't. surface the choice either way. zoom out: a lot of what looks like model capability is actually contract design. a strict schema is a choice with a cost it filters out noise, but it also filters out recoverable noise from any model that hasn't memorized the exact json contract you happened to pick. the largest commercial models eat that cost invisibly and are linient on tool calling because they've seen enough of every contract during pretraining; open models pay it loudly and get dismissed for it. the harness is where you mediate between distributions. four small repairs (i'm sure more to follow as we have three more merging today), two regex lines for auto-links, one relational default, one prefix change. the model didn't change. the contract got more forgiving in exactly the places it needed to be. deepseek v4 pro now beats opus 4.7 6/10 times on our internal evals. imo "skill issue" applies to the harness more often than the model.

English
7
7
151
745.7K
CONFESIONES Y SECRETOS TABOO
CONFESIONES Y SECRETOS TABOO@Sim816932946846·
Después de tanto tiempo y ahora que somos más de 1000 en esta comunidad me complace invitar a formar parte de este proyecto donde conviviremos y compartiremos material y experiencias para alentar a otros a vivir la maravilla del Incesto!!🔥😈 #CjQKIE62wHEkpdWUpaqIYS-rjgppjWjQ0qU5qRlMqBw1uXBwEhDIN8lYMXfiDnx4Ai9b9kqM" target="_blank" rel="nofollow noopener">signal.group/#CjQKIE62wHEkp
Español
10
6
52
110.3K
Devin
Devin@Devin32107895·
@juanda158392211 Y que solución presenta al ir, no veo que diga que quiere acabar con el conflicto armado, no veo que diga que va a movilizar a la fuerza publica para combatir los asedios hacia la ciudadanía
Español
0
0
0
93
Devin
Devin@Devin32107895·
@henyerhuriza @petrogustavo En un principio no debía iniciar diálogos, estos grupos subversivos no buscan paz por qué no les genera ganancias a sus líderes y la maldad que tienen no los deja ver al campesino libre
Español
0
0
2
71
Henyerh Uriza
Henyerh Uriza@henyerhuriza·
Muy bien hace el presidente @petrogustavo al suspender diálogos con los criminales del ELN Es claro que no tienen ánimo de paz y en un ataque terrorista dejaron un saldo de 30 muertos y 70 familias desplazadas en el Catatumbo, entre ellos firmantes de paz
Henyerh Uriza tweet media
Español
2
2
19
3K
Devin
Devin@Devin32107895·
@Orlando71156528 Dejen de vanagloriar presidente como si fueran personas buenas a toda costa por qué la gestión en materia de orden público de este gobierno y todos los anteriores siempre ha sido un desastre aunque este dijo que iba a ser lo contrario
Español
0
0
0
61
Orlando Curioso
Orlando Curioso@Orlando71156528·
Para meterse al Catatumbo como lo hizo el valiente Presidente Petro, hay que tener los cojones muy bien puestos, algo que le faltó a los otros mandatarios que siempre gobernaron detrás de un escritorio, dandoselas de muy frenteros y bravitos de micrófono. x.com/juanda15839221…
Español
347
911
1.8K
61.4K
Devin
Devin@Devin32107895·
@ProsperidadCol @GustavoBolivar @DIANColombia En los gobiernos anteriores y en gestiones anteriores los retrasos se informan así mismo los problemas con estos, su gestión en este programa está siendo más que deficiente por la falta de gestión temprana de los procesos de liquidación y pagos.
Español
1
0
1
369
Prosperidad Social
Prosperidad Social@ProsperidadCol·
El director @GustavoBolivar y su equipo de trabajo recorren 🇨🇴 llevando justicia social y devolviéndole a muchas familias lo que el contrabando les arrebató por años. En alianza con la DIAN, el #GobiernoDelCambio ha entregado miles de paquetes de donaciones a hogares vulnerables.
Prosperidad Social tweet media
Español
254
474
1.1K
94.7K
Devin
Devin@Devin32107895·
@valentinajimr Todo el que este leyendo este hilo repostee para darle visibilidad a esta gran problemática #TodosSomosUDC
Español
0
0
5
663
Devin retweetledi
Valentinita
Valentinita@valentinajimr·
¿SABÍAS QUE 𝗘𝗖𝗢𝗣𝗘𝗧𝗥𝗢𝗟 QUIERE APODERARSE DE 𝟮𝟬𝟬 𝗠𝗜𝗟 𝗠𝗜𝗟𝗟𝗢𝗡𝗘𝗦 𝗗𝗘 𝗣𝗘𝗦𝗢𝗦 Y DEJARÍA SIN EDUCACIÓN a 23.000 ESTUDIANTES DE LA 𝗨𝗡𝗜𝗩𝗘𝗥𝗦𝗜𝗗𝗔𝗗 𝗗𝗘 𝗖𝗔𝗥𝗧𝗔𝗚𝗘𝗡𝗔? 𝗔𝗯𝗿𝗼 𝗵𝗶𝗹𝗼 de como la 🦎 le saca los 🥚🥚 a la UDC
Valentinita tweet media
Español
44
547
1.3K
324.3K
Devin
Devin@Devin32107895·
@petrogustavo Me gustaría que no hablara tanto de política y tomara más acciones sobre la creciente inseguridad que presenta el sur del bolivar, Magdalena y zonas aledañas. La delincuencia común, los grupos armados al margen de la ley y la corrupción tanto en salud como lo educativo.
Español
0
0
0
26
Gustavo Petro
Gustavo Petro@petrogustavo·
Este es el mapa político de Colombia en las elecciones pasadas. En rojo fuerte las gobernaciones ganadas por los movimientos y personas que estuvieron conmigo en la primera vuelta presidencial. En azul fuerte las gobernaciones ganadas por la oposición. En rosado independientes que se acercan al gobierno, en azul claro independientes que se acercan a la oposición Gobernaré para todos. Como ven el panorama es muy alejado al relato mediático
Gustavo Petro tweet media
Español
7.1K
4.6K
13.8K
3.7M
Devin
Devin@Devin32107895·
No se que se necesita en #Colombia para poder conseguir un empleo, lo que si tengo entendido es que si la empresas no se comienzan a interesar por el talento joven, la mayoría de jóvenes como yo, recién egresados de sus estudios no va a conseguir empleo ni remoto ni presencial.
Español
0
0
0
111
Devin
Devin@Devin32107895·
@MovistarCo Quiero informarles y de paso quejarme sobre el pésimo servicio que están brindando acá en mi pueblo, Altos del Rosario Bolívar. Llevamos varios días sin señal de Movistar, al parecer por un daño y no siquiera han venido a revisar o arreglar la antena.
Español
1
0
0
0
Devin
Devin@Devin32107895·
@Xiaomi Su capa de personalizacion es un mierda, llevo ya un año con un redmi note 9 que me ha tocado restablecerlo de fabrica varias veces por que siempre se pone lentro, la pantalla se congela y todas la aplicaciones comienzan a fallar, si contar los multiples bugs que encontre
Español
0
0
0
0
Devin
Devin@Devin32107895·
Seis Sigma Este es un método que ha tomado gran importancia en las empresas por los resultados que se obtienen con la implementación de este método, ya que ayuda a la empresa a lograr estándares de calidad que se acerca a la perfección teniendo en cuenta sus seis principios.
Español
0
0
0
0