
FlyingIkki
7.7K posts





NEW: Top-10 crypto exchange with 120M+ users, @okx, adopts Chainlink to unlock the $80 trillion tokenized RWA opportunity on X Layer. Chainlink enables devs to create advanced apps, bringing the agentic economy & high-speed DeFi to Chainlink Scale member @XLayerOfficial.



A technical dive inside our new "Midjourney Scanner"

Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong long-horizon capabilities with a 1M context window - Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance between performance and token efficiency - MIT-licensed open weights - Same API pricing as GLM-5.1 Tech Blog: z.ai/blog/glm-5.2 Weights: huggingface.co/zai-org/GLM-5.2 API: docs.z.ai/guides/llm/glm… Coding Plan: z.ai/subscribe Chat: chat.z.ai



Announcing a new division of Midjourney called "Midjourney Medical"

Run Gemma 4 26b MTP on 8 GB VRAM GPUs at 25+ tokens/second. Flags included! local llm space is moving at terminal velocity. only 3 days ago google released gemma 4 26b a4b qat quants. more efficient than before, ran on 8gb vram at 20 tok/sec. and now just a few hours ago, mainline llama.cpp merged a massive update and we just shattered our own record. decode throughput went 25-40% up on the same 8 GB VRAM setup! Before MTP: 20 tps -> After MTP: 28 tps! llama.cpp just officially merged PR #23398 ("add Gemma4 MTP"), bringing native Multi-Token Prediction (MTP) support to Gemma 4 models. By running speculative drafting on the same 8GB VRAM RTX 4060 setup, my decode throughput on a 64k context instantly leaped to a blistering 25–27 tokens/sec thats 25-30% increase with the same hardware. Here is the architectural catch you need to know: Unlike the Qwen 3.5 and 3.6 series, which bake the MTP heads directly into the base GGUF, the Gemma 4 MTP head is not built in. You must download a separate, specialized MTP drafter GGUF (the assistant model) to act as the speculator. (I've dropped the download link in the replies). copy and try the exact flags: -m gemma-4-26B-A4B-it-qat-UD-Q4_K_XL.gguf --spec-type draft-mtp --spec-draft-n-max 6 --spec-draft-p-min 0.7 --spec-draft-model gemma-4-26b-A4B-it-assistant-Q4_0.gguf -c 64000 -v n-max 4 and p-min 0.7 is also worth checking out. benchmark on your setup and workflow. if you have a single 8 gb vram nvidia rtx 4060, 3060, 3070, 2080, 2070, grab the MTP drafter GGUF link in the comments and try it yourself. Check it out even if you have asmaller or a larger gpu, such as a single rtx 3090, 4090, 3060, 2060. MTP works for all gemma 4 sizes such as gemma 4 12b, gemma 4 31b etc. but remember to grab the correct mtp draft assistant models respectively. what are you benchmarking today

Es geht in die nächste Runde: Mit einer Kundgebung vor unserem Redaktions-Büro möchte uns die linke Szene aus der Stadt vertreiben. Illustriert wird der Aufruf mit einem Flugzeug, das vor unserer Hausfassade einschlägt - es ist das Foto eines Flugzeugs, das der Pilot einst in ein Stadion in Baltimore steuerte. Was auch immer die friedliebende Zivilgesellschaft damit sagen will. Eine Fahrraddemo will unsere neuen Redaktionsräume markieren und danach unsere ehemaligen Standorte sowie die Kollegen von @niusde_ besuchen und einschüchtern. Ich finde es toll, dass wir uns auf die PR-Kraft der Szene verlassen können. Danke an alle Fans und den polizeilichen Schutz! Übrigens, liebe Genossen, wir sind nicht umgezogen, weil ihr uns erfolgreich vertrieben habt. Wir haben ein neues, wesentlich größeres Büro, weil uns immer mehr Menschen lesen, schauen und mögen. Diesen Menschen fühlen wir uns verpflichtet. Und wir lassen uns ganz sicher nicht von irgendwelchen zugezogenen Soziologie-Studenten im vierzehnten Semester von unserem Weg abbringen.


In der Zukunft wird jeder Bundesminister für 15 Minuten Darsteller in einer Scripted-Reality-Show sein.



Introducing GLM-5.2: Frontier Intelligence, Open Weights - Significant improvements in coding and agentic tasks - Strong long-horizon capabilities with a 1M context window - Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance between performance and token efficiency - MIT-licensed open weights - Same API pricing as GLM-5.1 Tech Blog: z.ai/blog/glm-5.2 Weights: huggingface.co/zai-org/GLM-5.2 API: docs.z.ai/guides/llm/glm… Coding Plan: z.ai/subscribe Chat: chat.z.ai



NEWS: SpaceX will break its own news on X, not on newswires, an SEC filing shows The company named its X account @SpaceX as an official disclosure channel. Its investor page at ir.spacex.com is the other. SpaceX says it will skip wire services like Business Wire and PR Newswire. It tells investors to follow @SpaceX for material updates.


Debanking in Deutschland: Wenn die "falsche" Meinung zum Problem wird und wie man sich dagegen wehrt – HAINTZmedia auf YouTube: youtube.com/watch?v=85Bzec… Janine Beicht im Gespräch mit Rechtsanwältin Melina Schwendenmann von Haintz legal zum Thema Debanking. Unsere mediale Arbeit unterstützen, siehe Link im ersten Kommentar.


