Arthur Sarazin

1.9K posts

Arthur Sarazin banner
Arthur Sarazin

Arthur Sarazin

@SrzArthur

IT, Governance and Design 🧐 | Ongoing designer of Le Graphe de Borges 📚

Paris, France Katılım Aralık 2015
354 Takip Edilen448 Takipçiler
Sabitlenmiş Tweet
Arthur Sarazin
Arthur Sarazin@SrzArthur·
Statistics are just one face of reality.
English
1
0
4
4.3K
Arthur Sarazin
Arthur Sarazin@SrzArthur·
Dans tous les lieux de débats, on parle indistinctement d'IA, d'Intelligence Artificielle et des IAs mais... ...ces termes recouvrent-ils la même chose ? Si oui, de quoi parlons-nous ? Si non, de quoi parlons-nous ? 🙃 👇 linkedin.com/pulse/lia-lint…
Arthur Sarazin tweet media
Français
0
0
0
38
Arthur Sarazin
Arthur Sarazin@SrzArthur·
[Loin des LLMs, proche des reasoners] Le 6 janvier 2026, une solution totale au problème d'Erdos #728 a été trouvée, une nouvelle qui bouleversa le quotidien... ...de personne, et pourtant 👇 linkedin.com/pulse/d%C3%A9c…
Français
0
0
0
49
Arthur Sarazin
Arthur Sarazin@SrzArthur·
[Open is the new regret] Let's have a kind thought for all companies and organisation that looked down on open data... ...for today they wish LLMs and AI Agents would consume their data instead of making up probable (but not exact) information about themselves.
English
0
0
0
46
Arthur Sarazin
Arthur Sarazin@SrzArthur·
If your idea is off the GenAI training data distribution chart, then you know you are on a really creative path ! @emollick
English
0
0
0
44
Arthur Sarazin
Arthur Sarazin@SrzArthur·
@safehell Pour info : la vectorisation est extrêmement rapide sur Databricks, avec un petit modèle d'embeddings mais le calcul derrière sur ces vecteurs (cosine similarity par ex) trés long et coûteux. J'en ai jeté l'éponge.
Français
1
0
0
63
Arthur Sarazin
Arthur Sarazin@SrzArthur·
@safehell Mmm, on m'a mis a dispo une instance Databricks. Je suis en train de tester.
Français
1
0
0
180
Arthur Sarazin
Arthur Sarazin@SrzArthur·
Au risque de poser une question bête : est-il possible d'embedder des fichiers parquet sans sortir de #duckdb ?
Français
1
0
1
154
Dr. S. Fray (Moyen Age) 🇺🇦 🟦
Bon je suis sans doute super naïf. Mais comment des étudiants peuvent-ils utiliser l'IA pour rédiger des cr d'intervention de M2 venant présenter leurs travaux ? Les passages notés IA par compilatio sont les + personnels. Je ne comprends pas. Réécriture à partir de leurs notes ?
Français
13
1
25
45.2K
Arthur Sarazin
Arthur Sarazin@SrzArthur·
@FraySebastien J'ai une autre réponse à t'apporter : le détecteur d'IA de Compilatio a renvoyé un "faux positif", très probable au regard des garanties catastrophiques offertes par l'entreprise et son soit disant modèle de détection. Fiable à 70 % au mieux selon des études scientifiques
Français
0
0
3
419
Arthur Sarazin
Arthur Sarazin@SrzArthur·
@InfosReseaux Oui, d'où l'idée de commencer avec du connu (ontologie, noeuds de base) pour faire peut être de l'analyse de graphe et détecter des dépendances dangereuses, gap analysis, etc. Tu fais du query dans réseau, pas de génération. Puis pour le reste des simulations via LLM
Français
0
0
0
19
Infos-Réseaux.com
Infos-Réseaux.com@InfosReseaux·
@SrzArthur Un début de réponse : les LLM ne sont pas le seul cas d'usage du SI. Ca détruirait beaucoup de chose pour un seul cas d'usage qui ne reprendrait pas tout le reste avec des risques importants (Regardes ce qu'il est arrivé à gifi juste sur un changement de CRM)
Français
1
0
0
21
Arthur Sarazin
Arthur Sarazin@SrzArthur·
Réflexion tardive : si la gouvernance des données piétine parce qu'on ne peut savoir tout ce qu'il se passe dans un SI, et que les #LLMs naviguent dans des espaces latents, est ce que ça ne serait pas malin de concevoir un SI comme un espace latent ?
Français
1
0
0
91
Arthur Sarazin
Arthur Sarazin@SrzArthur·
Qui a prompté Eric Sadin ?
Français
0
0
0
196
Arthur Sarazin
Arthur Sarazin@SrzArthur·
Quelqu'un a t'il une solution (gratuite et open source) ?
Français
1
0
0
39
Arthur Sarazin
Arthur Sarazin@SrzArthur·
Je découvre un vrai dilemme entre confidentialité et efficacité sur le traitement des données assistés via #LLM Si vous voulez traiter données via #LLM, il doit accéder aux données. Bye Bye la confidentialité. Si vous voulez que cela reste confidentiel, Bye bye #LLMs
Français
1
0
1
100
Arthur Sarazin
Arthur Sarazin@SrzArthur·
" En fait, l'étude des machines à calculer nous en apprend plus sur le fonctionnement du cerveau que tous les procédés d'introspection. Telle la cocaïne. Vous êtes vous déjà flanqué une bonne ration de coco dans la veine ?" William S. Burroughs dans Le destin nu.
Français
0
0
0
88
Arthur Sarazin
Arthur Sarazin@SrzArthur·
Je découvre l'interface de @databricks pour travailler avec des données via notebooks. Un chef d'œuvre.
Français
0
0
0
117
Arthur Sarazin
Arthur Sarazin@SrzArthur·
@safehell J'ai un fichier parquet trés volumineux. Je cherche à appeler un modele d'embeddings qui tournerait sur une colonne de ce parquet. Pour l'instant je convertis mon parquet en dataframe. Ca marche sur des subsets mais ttop lents pour des gros fichiers (8 millions de lignes)
Français
1
0
0
137