Cuando abres Netflix y te sugiere una serie que terminas viendo entera, o cuando el banco detecta que alguien usó tu tarjeta en otro país y te llama antes de que te enteres, hay un sistema de aprendizaje automático detrás. No es magia ni ciencia ficción, es matemática aplicada a patrones en datos.
El aprendizaje automático, o machine learning en inglés, es una rama de la inteligencia artificial. La diferencia con el software tradicional es importante: en vez de escribir reglas explícitas (si X entonces Y), el sistema aprende esas reglas solo, a partir de ejemplos. Es esa capacidad de aprender lo que lo hace poderoso y, a veces, difícil de explicar incluso para quienes lo usan.
La diferencia entre programar y aprender
En el software tradicional, un programador escribe instrucciones precisas. Para detectar spam, por ejemplo, programaría reglas: si el correo contiene «ganaste un premio» y viene de un dominio desconocido, marcarlo como spam. El problema es que los spammers cambian sus mensajes constantemente, y las reglas manuales no escalan.
Con aprendizaje automático, en vez de escribir esas reglas, le das al sistema miles de correos ya etiquetados (spam o no spam) y dejas que encuentre los patrones por sí solo. El resultado es un modelo que puede detectar spam que nadie había visto antes, porque aprendió las características subyacentes, no solo las frases específicas.
Esa es la idea central: el sistema aprende de datos, no de instrucciones manuales.
Los tres tipos principales de aprendizaje
El campo tiene muchas variantes, pero hay tres categorías que vale la pena conocer:
- Aprendizaje supervisado: el modelo aprende de ejemplos etiquetados. Le muestras fotos de gatos con la etiqueta gato y fotos de perros con perro. Después puede clasificar fotos nuevas. Es el tipo más común en aplicaciones empresariales.
- Aprendizaje no supervisado: el modelo no tiene etiquetas. Encuentra patrones y grupos por sí solo en los datos. Útil para segmentar clientes, detectar anomalías o descubrir estructuras en datos que no sabías que existían.
- Aprendizaje por refuerzo: el modelo aprende probando acciones y recibiendo recompensas o penalizaciones. Es como entrenar a un perro, pero matemático. Se usa en videojuegos, robótica, y en el entrenamiento final de modelos de lenguaje como ChatGPT.
Cómo funciona en la práctica: un ejemplo paso a paso
Imagina que tienes una bodega en Surco y quieres predecir cuántos panes vas a vender mañana para no quedarte corto ni botar. Tienes registros de dos años: fecha, cantidad vendida, si fue fin de semana, si hubo feriado, si llovió, temperatura aproximada.
Con aprendizaje automático, alimentas esos datos históricos a un algoritmo. El algoritmo busca qué variables se relacionan más con la cantidad vendida. Descubre que los sábados se venden 40% más, que los días lluviosos bajan las ventas, que los feriados son impredecibles. Construye un modelo matemático con esas relaciones.
Cuando le preguntas cuánto vas a vender el próximo sábado que además es feriado, usa ese modelo para darte una estimación. No es exacto, pero es mucho mejor que adivinar o usar solo el promedio histórico.
Qué necesitas para usar machine learning
Tres cosas básicas: datos, un objetivo claro y la capacidad de procesarlos.
Los datos son lo más crítico. El modelo aprende de los ejemplos que le das. Si tus datos son incompletos, están mal registrados o tienen errores sistemáticos, el modelo aprende cosas incorrectas. El dicho en la industria es basura entra, basura sale. Una empresa que quiere usar machine learning primero necesita tener sus datos en orden.
El objetivo tiene que ser específico y medible. Mejorar el servicio al cliente es demasiado vago. Predecir qué clientes van a cancelar su suscripción en los próximos 30 días es un objetivo concreto que se puede atacar con machine learning.
La capacidad de procesamiento es menos limitante que antes. Hoy existen servicios cloud de AWS, Google y Azure que ofrecen machine learning como herramienta disponible para empresas medianas sin necesidad de servidores propios ni equipos grandes de científicos de datos.
Cuántos datos necesitas realmente
Depende del problema. Para algunos casos, con unos cientos de ejemplos bien etiquetados alcanza. Para visión artificial o procesamiento de lenguaje, necesitas miles o millones. En general, más datos y mejor calidad siempre ayuda. Si tienes dudas sobre si tienes suficiente, consulta con alguien que conozca el tipo de problema que quieres resolver antes de invertir en desarrollo.
Aplicaciones concretas para empresas peruanas
El machine learning no es solo para las grandes tecnológicas. Hay aplicaciones que ya son accesibles para empresas medianas y pymes en Perú:
- Predicción de demanda: restaurantes, tiendas y distribuidoras que quieren comprar mejor y desperdiciar menos.
- Detección de fraude: financieras y fintechs que procesan pagos con Yape, Plin o tarjetas pueden identificar transacciones sospechosas en tiempo real.
- Clasificación de reclamos: empresas con alto volumen de contacto de clientes pueden enrutar automáticamente los tickets al área correcta sin leer cada uno.
- Recomendaciones personalizadas: tiendas online que quieren mostrar productos relevantes según el historial de compras de cada cliente.
- Precios dinámicos: hoteles, aerolíneas y servicios de delivery que ajustan precios según demanda y disponibilidad.
Machine learning y los modelos de lenguaje
ChatGPT, Claude, Gemini y los demás modelos de lenguaje son, en esencia, sistemas de machine learning muy grandes. Fueron entrenados con el mismo principio: muchos datos, un objetivo (predecir el siguiente token de texto), y un proceso de ajuste iterativo hasta que el modelo aprendió a hacerlo bien.
Entender machine learning ayuda a entender por qué estos modelos son poderosos y también por qué fallan. Sus errores no son bugs de programación: son consecuencias de lo que aprendieron y lo que no. Si los datos de entrenamiento tenían sesgos, el modelo los replica. Si ciertos temas estaban poco representados, el modelo es menos confiable en esos temas.
Si tu empresa está evaluando cómo aprovechar estas herramientas, lo más valioso es empezar con un problema concreto y medible, no con la tecnología. En freelo.pe ayudamos a las empresas a definir ese punto de partida antes de invertir en desarrollo.
Preguntas frecuentes
¿Necesito saber programar para usar machine learning en mi empresa?
No para usarlo como usuario final de herramientas ya construidas. Plataformas como Google Sheets con BigQuery ML, Power BI o Vertex AI ofrecen funciones de machine learning sin necesidad de programar. Para proyectos a medida, sí necesitas un desarrollador o científico de datos, pero tú como dueño de negocio solo necesitas entender el problema que quieres resolver.
¿Cuánto tiempo tarda en dar resultados un proyecto de machine learning?
Depende de la complejidad. Un modelo de clasificación simple con datos ya listos puede tardar semanas en estar operativo. Proyectos más complejos con datos dispersos o modelos de mayor sofisticación pueden tomar meses. Lo más lento suele ser la preparación y limpieza de los datos, no el entrenamiento del modelo en sí.
¿Qué diferencia hay entre machine learning e inteligencia artificial?
La IA es el campo amplio que incluye todo sistema que realiza tareas que normalmente requieren inteligencia humana. El machine learning es una subdisciplina de la IA donde el sistema aprende de datos. Todos los sistemas de machine learning son IA, pero no toda la IA es machine learning. Los sistemas de reglas expertas, por ejemplo, son IA pero no machine learning.
¿Los modelos de machine learning se quedan obsoletos?
Sí, y es un tema práctico importante. Un modelo entrenado con datos de 2022 puede perder precisión en 2025 si los patrones cambiaron. Por eso se necesita re-entrenar o actualizar los modelos periódicamente con datos nuevos. El mantenimiento del modelo es parte del costo total de cualquier proyecto de machine learning en producción.
¿Es ético usar machine learning para tomar decisiones sobre personas?
Es una pregunta válida y cada vez más regulada. Cuando un modelo decide si aprobar un crédito o si un CV pasa al siguiente filtro, puede perpetuar sesgos presentes en los datos históricos. Las buenas prácticas incluyen auditar el modelo en busca de sesgos, mantener humanos en el proceso para decisiones importantes y ser transparente con las personas afectadas.