Mathieu Colas

2.5K posts

Mathieu Colas banner
Mathieu Colas

Mathieu Colas

@ColasM78

Data is the new Water. Founder and and CEO of Starzdata. #API #alternativedata #climate #SaaS

Europe Joined Kasım 2010
1.5K Following1.1K Followers
JNS
JNS@_devJNS·
what database do you use?
JNS tweet media
English
741
136
2.5K
177.7K
Branko
Branko@brankopetric00·
Vector databases explained for people who just want to understand. You have 10,000 product descriptions. User searches for "comfortable outdoor furniture." Traditional database: - Searches for exact word matches - Finds products containing "comfortable" OR "outdoor" OR "furniture" - Misses "cozy patio seating" even though it's the same thing - Keyword matching is stupid Vector database approach: - Convert search into numbers representing meaning: [0.2, 0.8, 0.1, 0.9, ...] - Convert every product description to similar numbers - Find products with similar number patterns - Returns "cozy patio seating" because the numbers are close - Meaning matching is smart How it works: Step 1: Turn text into vectors (arrays of numbers) - "comfortable chair" becomes [0.2, 0.7, 0.1, 0.4, ...] - "cozy seat" becomes [0.3, 0.8, 0.2, 0.5, ...] - Similar meanings = similar numbers - Uses AI models like OpenAI embeddings Step 2: Store vectors efficiently - Traditional database: Stores text - Vector database: Stores arrays of numbers per item - Indexes them for fast similarity search - Optimized for "find similar" not "find exact" Step 3: Search by similarity - User query: "outdoor furniture" - Convert to vector: [0.3, 0.6, 0.2, 0.8, ...] - Find closest vectors using math (cosine similarity) - Returns items ranked by similarity score Use cases: - Product search that understands intent - Documentation search that finds relevant answers - Recommendation engines - Chatbots that find similar questions - Anomaly detection Popular vector databases: - Pinecone: Managed, easy, expensive - Weaviate: Open source, feature-rich - Milvus: Fast, scalable, complex - pgvector: Postgres extension, simple - Qdrant: Fast, Rust-based Controversial take: You don't need a vector database for most projects. Start with Postgres + pgvector extension. Vector databases are great for scale. For under 1 million vectors, your regular database with a vector extension works fine.
English
67
145
1.6K
142.6K
Mathieu Colas
Mathieu Colas@ColasM78·
@Poulin2012 100 mds de tokens, cela correspond à des crédits d’API utilisés sur des solutions maisons, certaines pour l’interne d’autres revendues aux clients comme des produits SaaS par McKinsey. Le chiffre peut impressionner mais en réalité cela représente peu à l’échelle de Mac Kinsey.
Français
0
0
3
1.1K
Alexis Poulin
Alexis Poulin@Poulin2012·
McKinsey est fier d’être un des premier utilisateur mondial de Chat gpt. Des consultants inutiles qui revendent des powerpoint fait par IA une fortune à des gogos corrompus. Sacré business model 👍
Alexis Poulin tweet media
Français
104
1.6K
6.7K
159.3K
Mathieu Colas
Mathieu Colas@ColasM78·
@babgi Ce serait intéressant si ces analyses différenciait le b2b et le b2c.
Français
1
0
0
278
Gilles Babinet
Gilles Babinet@babgi·
Le thème de mon dernier papier dans les Echos concerne ce qui pourrait se passer après l'éclatement –hypothétique à ce stade– de la bulle de l'IA. Ca tombe bien, je sors d'une conférence en Asie où nous avons largement débattu de cela. Quelques observations qui semblent intéressantes : - Plusieurs analyses concordantes montrent que la presque totalité de de la croissance du PIB américain vient de l'IA – Jason Furman Harvard, Schroder, etc. Cela signifie que sans ces investissements, les USA seraient techniquement en quasi-récession, mais aussi que l'IA n'entraîne pas (encore) le reste de l'économie. En soit, ce n'est pas inquiétant, sauf en cas d'explosion de la bulle avec une économie qui pourrait rentrer fortement en territoire négatif. - L'amortissement des GPU se fait sur des durées incroyablement courtes, de l'ordre de 12 à 18 mois, parfois même moins, suscitant une grande avidité des investisseurs, un facteur évident de renforcement du risque de bulle. Plusieurs analyses observent –aux USA– que les RFQ pour les datacenters sont faits en triple voir en quadruple. Il y a probablement une forte surestimation du nombre réel de projets. - L'unité de mesure en IA est désormais le GW de GPU. Un gigawatt c'est en gros une tranche de centrale nucléaire. C'est beaucoup. En France, c'est l'équivalent de la consommation de 1,3 millions de personnes moyennés sur l'année. Les états-Unis concentreraient presque 100 GW de nouveaux projets de datacenters IA, soit 1/5ème de la consommation élec. du pays. - Pour faire bonne mesure, en France Xavier Piechaczyk, le DG de RTE, a annoncé avoir contractualisé pour 30GW d'accès pour des datacenters d'IA. A l'échelle du pays, c'est considérable et si ça se réalise vraiment, ça va durablement affecter l'organisation du grid électrique français (à priori surtout dans les Hauts de France et dans l'île de France). - Il y a des niveau de valorisation totalement absurdes. En premier lieu pour Tesla, dont Musk expliquait encore récemment que "ce n'est pas une entreprise qui fabrique des voitures mais une plateforme Saas" et que le robot Optimus et les revenus des véhicules autonomes vont prochainement composer 90% des profits. Le problème est que le patron de la division de véhicules autonomes vient de partir chez Meta. On pourrait penser que c'est pour un salaire+stocks plus important. Ce n'est pas le cas car il a accepté une diminution de revenus. En second lieu Palantir qui vaut 200 à 300 fois ses revenus, ce qui est évidemment absurde. Voir également les interessantes déclaration de Yann Le Cun sur les robots humanoïdes. - Le sujet c'est l'Europe. Comment éviter une contagion d'une explosion de bulle qui semble désormais difficilement évitable ? L'Europe est en retard et en toute vraisemblance, un éclatement de la bulle y serait aussi prononcé qu'ailleurs, alors qu'il faudrait plutôt continuer à investir lorsque le marché ralenti.
Gilles Babinet tweet media
Français
14
81
209
20.8K
Defend Intelligence (Anis Ayari)
Defend Intelligence (Anis Ayari)@DFintelligence·
ET VOILÀ !!!!!! Dans une note bien cachée publiée cette nuit sur le site des releases de Google, Chrome va recevoir les capacités agentiques de Gemini. Donc même Google Chrome va être augmenté par l’IA. La réponse à ChatGPT Atlas ne s’est pas fait attendre. Lien du site en bas. "Gemini in Chrome 📷 Gemini is now integrated into Chrome on macOS and Windows, and can understand the content of your current page. Users can now seamlessly get key takeaways, clarify concepts, and find answers, all without leaving their Chrome tab. This integration includes both chat—where users can interact with Gemini via text, and “Gemini Live”, by which users can interact with Gemini via voice."
Defend Intelligence (Anis Ayari) tweet media
Français
18
43
276
49.7K
Mathieu Colas
Mathieu Colas@ColasM78·
@DFintelligence Un bon point de départ c’est un SEO blindé et des balises json ld au poil non ?
Français
0
0
0
149
Defend Intelligence (Anis Ayari)
Defend Intelligence (Anis Ayari)@DFintelligence·
Bon, désolé, ça ne va pas plaire à plein de vendeurs d’air, mais non, aujourd’hui il n’existe aucune méthode applicable, scalable et prouvée pour améliorer la recommandation de votre marque sur ChatGPT. Il y a plein de monde qui vous vendent des approches où, soi-disant, en créant plein de pages vous allez être mieux ranké sur les modèles d’IA. Alors que c’est tout simplement une attaque sur les modèles, mitigée et connue depuis au moins dix ans : c’est ce qu’on appelle l’empoisonnement de base de données (j’ai même fait une vidéo dessus il y a trois ans). En gros, générer des données en masse pour manipuler des bases de données, ça se repère ultra facilement. La seule chose qui est admise aujourd’hui, c’est d’influencer les sites qui vont être retrouvés par les web search de ChatGPT, Gemini, etc. Et là encore, c’est à la marge, et uniquement un monitoring à moyen terme peut vous dire si une approche fonctionne. Parce que oui, surprise : il n’y a pas de réponse ni de solution générale. Ça va dépendre du contexte, de votre industrie, de la demande, etc. À terme, nul doute, comme en 2005, qu’on va commencer à voir émerger de gros patterns, mais ça viendra uniquement quand les providers (@OpenAI , @Google , etc.) fourniront des données, comme le search traffic (qui n’existe pas non plus aujourd’hui, malgré ce que certains acteurs veulent faire croire). Bref, c’est pour éviter tout ce bullshit qu’avec @WhiteShipAI , on se concentre d’abord sur fournir une intelligence ultra poussée à visée des analyses récurrentes avec des conclusions et des actions moyen terme. Tout simplement parce que je ne crois pas en la formule magique providentielle, ni au bullshit marketing facile. Le sujet du GEO dans les boîtes est un sujet grandissant, donc autant l’adresser de manière sérieuse dès maintenant plutôt que de perdre du temps. Et gardez bien en tête cette courbe : dire qu’en un clic on peut améliorer votre ranking sur ChatGPT aujourd’hui, c’est le sommet de la courbe. Ce qui va être dommage, c’est que d’ici quelques mois certaines marques vont tomber dans la désillusion en disant : « On a essayé, ça ne marche pas. » Autant être productif dès le début.
Defend Intelligence (Anis Ayari) tweet media
Français
7
4
66
13.2K
Mathieu Colas
Mathieu Colas@ColasM78·
@xjfontanet Et un zest de capitalisation sur les retraites pour tout le monde, s’il vous plaît. Merci !
Français
0
0
0
17
Xavier Fontanet
Xavier Fontanet@xjfontanet·
Si on se remet à la durée de travail de nos voisins européens on retrouve les marges de manœuvres financières . Il faut reconnaitre que les deux erreurs de base ont été les 35 heures et la retraite à 60 ans
Xavier Fontanet tweet media
Français
4
10
32
1.7K
Philippe Briday 🇪🇺🇺🇦#NiFachoNiFacho
Jusqu'au prochain tirage, ce ticket est valorisé plusieurs millions d'euros. Suivant le principe de la taxe Zucman (qui s'applique à partir de 100M) son propriétaire devrait verser un impôt calculé sur le gain potentiel, sachant que si le ticket s'avère perdant, il n'obtiendra aucun remboursement.
Philippe Briday 🇪🇺🇺🇦#NiFachoNiFacho tweet media
Français
189
649
3.6K
338.8K
Octave Klaba
Octave Klaba@olesovhcom·
After MKS Free, now we have MKS Standard built with a multi-AZ control plane deployed across three availability zones, this new plan ensures native fault tolerance against zonal failures. With a 99.99% SLA , dedicated etcd (up to 8 GB), and support for clusters scaling up to 500 nodes, the Standard plan delivers unmatched resilience and scalability for your cloud-native applications. Available in Paris, soon Milan then Berlin.
Octave Klaba tweet media
English
3
2
18
10.5K
Gilles Babinet
Gilles Babinet@babgi·
Dans quelques années, on évoquera ce moment où on aurait pu mettre en place des sanctions, isoler ce régime génocidaire, cesser de l'armer et non. Par faiblesse, on n'a presque rien fait. L'histoire jugera et elle ne sera pas tendre.
franceinfo@franceinfo

“80 % de la population de Gaza se trouve dans les stades maximums de pénurie alimentaire (…) Les délégations honteuses du gouvernement israélien ne laissent pas envisager une entrée de vivres dans la bande”, indique Rony Brauman, ex-président de MSF.

Français
124
312
859
106.3K
Mathieu Colas
Mathieu Colas@ColasM78·
@DFintelligence Tellement d’accord avec toi - 98% des cas d’usage trouvent leur réponse dans une base de code bien organisée. Perso, je suis in love avec Pydantic.
Français
0
0
3
586
Defend Intelligence (Anis Ayari)
Defend Intelligence (Anis Ayari)@DFintelligence·
Il y a 2 ans, certaines équipes data ne juraient que par LangChain. Aujourd’hui, beaucoup s’en mordent les doigts. En IA, et notamment en IA Gen : N’UTILISEZ PAS DE FRAMEWORK. Et ce, pour une raison simple : les technologies, les outils, les providers, les méthodes… tout ça évolue à une vitesse absolument folle. Dépendre d’un framework, c’est déjà rajouter une couche d’abstraction bien souvent totalement inutile. Et c’est surtout dépendre de tiers et de versions de dépendances pour avoir des projets toujours au top de la technologie. J’en ai souvent parlé avec des Lead Tech qui me demandaient mon avis sur LangChain, et je leur ai toujours donné ces explications. Mais attention, je ne dis pas qu’il faut recréer la roue, pas du tout. Bien souvent, les SDK de Pinecone pour faire du RAG, ou ceux d’OpenAI pour la complétion, suffisent largement dans 99 % des cas d’usage. Nul besoin de se rajouter une couche d’abstraction juste pour être à la mode. Et ça, ça vaut en tout temps : méfiez-vous des effets de mode, surtout en IA.
Defend Intelligence (Anis Ayari) tweet media
Français
13
5
86
15.8K
Mathieu Colas
Mathieu Colas@ColasM78·
@GuillaumeRozier Bonjour @GuillaumeRozier - un post parfait pour accroître le fossé entre le président de la république et la nation, même si l’intention technologique était de le diminuer.
Français
1
0
3
529
GRZ
GRZ@GuillaumeRozier·
Pour la première fois on pourra vivre la descente des Champs Elysées du Président de la République comme si on y était, avec une qualité d'immersion inédite !
Nicolas Lellouche@LelloucheNico

Info Numerama : la caméra derrière Emmanuel Macron pendant le défilé du 14 juillet appartenait à @ImmersiveFlash. Le Président a enregistré un documentaire Apple Vision Pro qui sera diffusé à l'Élysée dès septembre. 👉 numerama.com/tech/2032739-e…

Français
115
49
184
55.5K
Mathieu Colas
Mathieu Colas@ColasM78·
@StephaneMallard Vous sous estimez la valeur du tampon et du cadran, même si la ligne directrice est bonne 🤓
Français
1
0
0
23
Fabrice Epelboin
Fabrice Epelboin@epelboin·
@SouveraineTech Contrairement à ce que l'on croit, il en reste quelques un qui savent faire des maths et qui réalisent qu'ils arrivent à la fin d'une pyramide de Ponzi... Ca les rend aigris...
Français
6
15
156
3.1K
Mathieu Colas
Mathieu Colas@ColasM78·
@DFintelligence Ah ben moi c’est justement ce qui m’a sauvé la vie il y a 18 mois pour dé commissionner tout ce qui tournait dans 5 ou 6 régions différentes dans tous les sens, impossible à faire avec la console AWS. 1500€ / mois (les crédits c’est pas éternel).
Français
0
0
3
515
Defend Intelligence (Anis Ayari)
Defend Intelligence (Anis Ayari)@DFintelligence·
Pour vous donner un ordre d'idée une migration de server et bdd c'est un truc qui normalement prend ENORMEMENT de TEMPS. Là je lui ai demandé de faire des test, des dry run, des save pour rollback si besoin, et de lancer la migration. Et ca a marché tellement smooth.
Defend Intelligence (Anis Ayari) tweet media
Français
8
1
64
7.1K
Defend Intelligence (Anis Ayari)
Defend Intelligence (Anis Ayari)@DFintelligence·
Je viens de créer en 5 minutes un script en CLI pour mon CI/CD qui migre certains de mes serveurs des US vers l’Europe. Et y’en a encore qui osent dire : « L’IA dans le code, c’est pour les nuls qui ne comprennent rien et qui savent pas coder, gné gné... » Mdr. La sélection naturelle, elle va être violente dans les prochains mois, je vous le dis.
Defend Intelligence (Anis Ayari) tweet media
Français
23
10
212
25.5K
Mathieu Colas
Mathieu Colas@ColasM78·
@julienbahloul « Je ne critique jamais Israel , c’est le prix à payer pour avoir choisi de ne pas y vivre » (Elie Wiesel)
Français
0
0
0
107
Julien Bahloul
Julien Bahloul@julienbahloul·
Lettres à mes sœurs/frères juifs de diaspora et aux amis vivant en dehors d’Israël. Depuis quelques jours je vois passer plusieurs tribunes exprimant un effroi quant à la situation en Israël et dans la bande de Gaza. Les auteurs de ces textes sont tous profondément attachés à notre pays. Personne ne peut remettre en question leurs liens affectifs et personnels. Il ne s’agit en rien de vulgaires militants d’extrême gauche pro-Hamas. Mais des éléments dans leurs textes sont à mes yeux plus que problématiques. Tout d’abord en focalisant leurs critiques de la situation sur la politique de Netanyahu, ils se trompent d’adresse. La fin de la guerre ne dépend pas d’Israël, elle dépend des Palestiniens. La guerre a été déclenchée par des milliers de Palestiniens qui ont envahi Israël depuis la bande de Gaza, territoire qu’Israël a complètement quitté en 2005. La guerre se poursuit parce que le leadership palestinien rejette toutes les offres de cessez-le-feu. Toutes. Une. Par. Une. Depuis plus d’un an et demi. C’est avant tout aux Palestiniens qu’il faut s’adresser. On ne peut pas déresponsabiliser ainsi la société palestinienne. Cette même société qui éduque, avec l’argent de l’aide internationale, à la haine du juif. Cette société qui a donné naissance à une génération élevée au culte du meurtre de juifs. Cette société civile, oui civile, qui a pris part avec excitation au pogrom du 7 pogrom, aux viols, aux tortures, aux kidnappings, aux captivité d’otages. Souvenez-vous des images des kidnappings du 7 octobre, en direct devant des caméras de presse (!). Avez-vous vu un seul homme, une seule femme, se dresser pour protester ? Pour tenter de sauver Yaffa Adar, 85 ans. Pour épargner les bébés Bibas ? Rien. Personne. A chaque fois que vous parlez de la situation entre Israël et la bande de Gaza, n’oubliez pas qui sont nos voisins. Il est trop simple de faire porter la responsabilité de la poursuite de la guerre au gouvernement israélien. C’est vite oublier la réalité. Parlons du gouvernement israélien justement. J’ai passé des mois en 2023 à manifester contre lui. Jour et nuit. J’étais déjà convaincu à l’époque qu’il s’agissait du pire gouvernement de l’histoire du pays. Ai-je changé d’avis ? Certainement pas. Smotrich et Ben Gvir sont à mes yeux une honte pour notre Etat. J’ai dénoncé ici à de multiples reprises leur racisme, leur homophobie. Mais surtout je dénonce leur incompétence crasse. Et Netanyahu ? J'espérais déjà son départ depuis… je préfère ne pas tenter de me rappeler depuis quand. Aujourd’hui ma colère contre lui est encore plus immense : jamais je ne pourrais lui pardonner de ne pas avoir réussi à empêcher le 7 octobre. Je l’ai écrit, je le redis, tous ceux qui ont échoué le 7 octobre (police, armée, Mossad, Shin Bet, gouvernement) doivent dégager. Et vite. En quoi mes critiques diffèrent de celles exprimées par les auteurs des tribunes ? D’abord car ce que je décris concerne des affaires *internes* à Israël. Nous sommes un État de droit, démocratique. Je vis ici. J’élève mes enfants ici. Je vis nos drames et nos peines ici. Personne à l’étranger ne peut imaginer ce que nous traversons. Personne. Personne ne peut imaginer ce que signifie se réveiller chaque matin et avoir l’impression que la date de son téléphone est encore bloquée à 7 octobre, 6h29. Personne ne peut imaginer ce que l’on ressent lorsque, parfois quotidiennement, nous consultons des listes de morts en priant pour ne pas y croiser le nom d’un proche. Je pourrais vous parler de mon collègue David qui revient de 7 semaines en réserve à l’armée, après y avoir passé l’an passé plus de 200 jours. Lui qui a 3 enfants de bas âge et qu’il voit à peine. Je pourrais vous parler de Niv qui est revenu au bureau amputé, lui le sportif qui était également arbitre de foot. Je pourrais vous parler de Laly qui a enterré son fils. Je pourrais vous parler d’Ido, psychiatre, qui est allé prendre en charge des rescapés des massacres du 7 octobre. Je pourrais vous parler de Yotam qui a abandonné son mari Elad et leur bébé tout juste né pour aller rejoindre son unité au front en tant qu’officier combattant et médecin. Je pourrais vous parler de tous ces enfants autour de moi qui se réveillent en pleurant la nuit et qui font des crises de panique à chaque fois que les sirènes d’alerte se déclenchent. Je lis dans les tribunes les multiples “appels à la paix” et je suis effaré par tant de naïveté et de cynisme. La paix ? Mais avec qui ? Pensez-vous vraiment que nous prenons plaisir à vivre encore dans une telle situation ? Je ne suis pas indifférent aux souffrances de la population gazaouie. Comment pourrais-je l’être. Mais nous sommes en guerre. Une guerre que nous n’avons pas choisie et qui se poursuit contre notre volonté. Avant de me soucier de la population palestinienne, je me soucie d’abord de la survie de mes enfants et de mes amis au front. Et là est là aussi une différence majeure entre mes critiques du gouvernement israélien et celles lues dans les différentes tribunes. Je sais que les auteurs de ces tribunes expriment leur sincère inquiétude et le font par amour d’Israël. Mais de fait, ils ne vivent pas ce que nous vivons et se trompent d’adresse lorsqu’ils pointent un doigt accusateur pour désigner le responsable de la situation. Je sais également que beaucoup se sentent obligés de publier leur texte pour préserver leur image d’interlocuteur “pour la paix”, “modéré”, si importante afin d’être invité dans les médias. Je connais les règles du jeu. J’ai été moi aussi écarté par certains qui se disent nos amis mais qui ont préféré prendre leurs distances parce que “tu représentes trop Israël”. Quel courage… Je termine ce post en rappelant que nous vivons des moments extrêmement douloureux. Il était important de se tenir à nos côtés le 7 octobre lorsque nous étions encore en train de ramasser nos cadavres. Mais ça l’est encore plus d’être avec nous lorsque nous nous battons pour éviter un autre 7 octobre.
Julien Bahloul tweet media
Français
473
650
2.1K
227.2K
Mathieu Colas
Mathieu Colas@ColasM78·
@DFintelligence Hello Anis. Si tu aimes la lecture (?), je te conseille de lire ce livre de Karine Tuil qui permet de comprendre les conséquences de propos tels que tu les tiens : amzn.eu/d/3FekSy7
Français
0
0
2
447
Defend Intelligence (Anis Ayari)
Defend Intelligence (Anis Ayari)@DFintelligence·
Un génocide est en cours, et on ferme les yeux. On veut forcer le déplacement de millions de personnes qu’on tue en masse, et on ferme les yeux. L’Europe et la France devraient avoir honte de ce qui est en train de se passer sous nos yeux. L’Histoire jugera. Ça me dégoûte. Free Palestine. 🇵🇸
Defend Intelligence (Anis Ayari) tweet media
Français
9
43
208
12.1K
Mathieu Colas
Mathieu Colas@ColasM78·
@auren So happy not to depend on VCs almost 5 years after creating my company - the drawback was to have a zero comp until last month. Now I can set my own salary and fully decide on the compensation of my recruits. #bootstrap
English
1
0
4
1.1K
Auren Hoffman
Auren Hoffman@auren·
Founder CEOs are massively under-comped after 4 years. I just spend the last few days advocating for 3 different founders to get higher go-forward comp. But their VCs just don’t get it. The VCs are soooo short-term. when you have a truly great founder, making them feel comfortable and valued could potentially 2x your return – give them the comp they deserve
English
55
12
514
99.8K