GalisLab 💻📊
7.2K posts

GalisLab 💻📊
@galislab
🤖 Data Scientist & AI Engineer 📈 Te enseño Ciencia de Datos, Python e IA 💸 Finanzas personales 📩 Contacto → [email protected]

Os compraríais un apartamento de playa para vivir todo el año? O una casita de pueblo para lo mismo? Os leo.


Pues ha caído oferta en la empresa grande 😮💨🙌🏻 Hay dos sobre la mesa y la otra sigue a la espera después de la prueba técnica. Estoy al 90% de aceptar la que me acaban de hacer, pero no quiero precipitarme. Me han ofertado un 11% más que la otra que tengo y 5k € más de lo que pedí en un principio. Cuando todo termine me va a parecer mentira, que suplicio 😅






❌ ¿Quieres saber por que no consigues trabajo en Ciencia de Datos? La mayoría de contenido de Machine Learning con el que te has formado está construido con datasets de juguete. Etiquetas limpias. Tendencias suaves. Clusters perfectos. 🌍 Los datos del mundo real no son así. → Ruido → Nulos → Drift → Solapamiento de clases → Patrones incoherentes → Comportamiento humano Esos son los motivos por los que tus modelos no funcionan fuera del notebook. Construyes un clasificador que funciona de lujo con el dataset Iris, Titanic o MNIST, pero cuando te enfrentes al mundo real, fracasas. Los datasets de juguete están bien para aprender los fundamentos, pero ya está. Lo malo es que te crean falsas ilusiones. En la prática, la mayoría del trabajo es pelear con datos sucios y sistemas inestables, y no tanto encontrar el modelo de ML perfecto. Te dejo abajo 3 ejemplos perfectos de datasets del mundo real y retos de ML en producción 👇 𝗧𝗶𝗺𝗲 𝗦𝗲𝗿𝗶𝗲𝘀 kaggle.com/datasets/shiva… 𝗖𝗹𝗮𝘀𝘀𝗶𝗳𝗰𝗮𝘁𝗶𝗼𝗻 kaggle.com/datasets/uciml… 𝗖𝗹𝘂𝘀𝘁𝗲𝗿𝗶𝗻𝗴 kaggle.com/datasets/shiva…

















