Hay dos formas de acceder a inteligencia artificial hoy. Una es usar un servicio como ChatGPT, Claude o Gemini: pagas una suscripción o por uso, y el modelo que hace el trabajo está completamente fuera de tu control. La otra es descargar o instalar un modelo de código abierto como Llama, Mistral o Falcon, y ejecutarlo en tu propio entorno. Las implicancias de cada opción son muy distintas, y para un negocio peruano que está evaluando cómo integrar IA, entender la diferencia puede ahorrar dinero y evitar problemas.
Este no es un artículo técnico sobre arquitecturas de modelos. Es una guía práctica para entender qué ganas y qué cedes con cada camino.
Qué es la IA cerrada y cómo funciona
Cuando usas ChatGPT, Claude de Anthropic o Gemini de Google, estás interactuando con modelos propietarios. El código que los hace funcionar no está disponible públicamente. Los datos que ingresas pasan por los servidores de la empresa. Tú no puedes modificar el modelo ni ajustarlo más allá de las opciones que el proveedor te ofrece.
La ventaja principal es que simplemente funciona: no necesitas infraestructura propia, no hay que mantener nada, y los modelos están en constante actualización. Para la gran mayoría de casos de uso en pymes, eso es suficiente y conveniente.
La desventaja es la dependencia. Si el proveedor sube precios, cambia políticas de uso, o simplemente deja de dar el servicio, tu operación se ve afectada. Y los datos que ingresas, incluidos datos de clientes o información confidencial del negocio, viajan y se procesan en servidores de terceros.
Qué es la IA de código abierto
Un modelo de código abierto es uno cuyo código fuente (y en los mejores casos, los pesos del modelo entrenado) está disponible públicamente. Puedes descargarlo, ejecutarlo en tu propio servidor, modificarlo y adaptarlo. Meta con Llama 3, Mistral AI y varios modelos de la comunidad Hugging Face son los ejemplos más conocidos.
La ventaja fundamental es el control. Tus datos no salen de tu entorno. Puedes ajustar el modelo con tu propia información, lo que se llama fine-tuning, para que responda de forma más adecuada a tu industria o contexto. Y no dependes de que una empresa decida qué puedes o no puedes hacer con la herramienta.
El costo no es cero, sin embargo. Ejecutar un modelo de lenguaje de forma local o en servidor propio requiere hardware o servicios de cómputo en la nube, y alguien con capacidad técnica para configurarlo y mantenerlo. Eso implica inversión inicial y conocimiento que no siempre está disponible en una empresa pequeña.
Comparación práctica para un negocio en Lima
Para una empresa de 5 a 20 personas en Lima que quiere usar IA para atención al cliente, redacción de contenido o análisis básico, la IA cerrada es casi siempre la opción más sensata. El costo de operación es bajo, la curva de aprendizaje es manejable y los resultados son inmediatos.
La IA abierta empieza a tener sentido cuando:
- La empresa maneja datos muy sensibles que no pueden enviarse a servidores externos. Pensemos en una clínica con historiales médicos, un estudio legal con documentos confidenciales, o una empresa con contratos que contienen información reservada.
- El volumen de uso es tan alto que las tarifas de los modelos propietarios se vuelven significativas en el presupuesto.
- Existe capacidad técnica interna o presupuesto para contratarla, y se quiere un modelo ajustado específicamente al negocio.
- La empresa quiere independencia total del proveedor por razones estratégicas o contractuales.
El mito de que lo abierto es gratis
Uno de los errores más comunes es pensar que usar un modelo de código abierto no cuesta nada porque no hay licencia. El modelo en sí puede no tener costo, pero ejecutarlo sí lo tiene. Una GPU capaz de correr Llama 3 con 70 mil millones de parámetros en tiempo real puede costar miles de dólares al mes en la nube.
Los modelos más pequeños, de 7 a 13 mil millones de parámetros, sí se pueden ejecutar en hardware más modesto e incluso en algunas laptops de alto rendimiento. Pero su calidad es inferior a los modelos grandes. Para tareas simples puede ser suficiente; para redacción compleja o razonamiento avanzado, la diferencia es notable.
Privacidad y regulación: un factor cada vez más relevante
Con la entrada en vigor del AI Act europeo y la creciente atención regulatoria a cómo las empresas usan datos, la pregunta de dónde se procesan los datos de los clientes se vuelve más importante. En Perú, la Ley 29733 ya establece obligaciones sobre el tratamiento de datos personales.
Si usas un modelo de IA cerrado para procesar información personal de clientes peruanos, debes verificar que el proveedor cumple con los estándares de seguridad y que tienes el consentimiento necesario. Los contratos de términos de servicio de OpenAI, Google y Anthropic son extensos pero incluyen cláusulas de privacidad que conviene leer antes de integrar esos sistemas con bases de datos de clientes.
La IA abierta ejecutada localmente elimina ese riesgo, pero lo transfiere a ti: eres responsable de la seguridad de ese entorno.
Una tercera opción que vale mencionar
Existe un camino intermedio que cada vez más empresas medianas están explorando: usar modelos de código abierto pero a través de proveedores de nube especializados como Together AI, Groq o Replicate. Accedes al modelo sin que tus datos pasen por las empresas que desarrollaron los modelos cerrados, con costos generalmente más bajos, y sin necesidad de manejar infraestructura propia.
No es la solución perfecta para todos los casos, pero para empresas que quieren más control que el que da ChatGPT sin asumir la complejidad de una instalación local, puede ser un punto intermedio razonable.
Cómo decidir
La elección no debería ser ideológica. No es que lo abierto sea mejor porque es abierto, ni que lo cerrado sea más confiable porque tiene marca conocida. La decisión correcta depende de tres preguntas concretas: qué tan sensibles son los datos que vas a procesar, qué capacidad técnica tienes disponible y cuánto volumen de uso planeas tener.
Para la mayoría de negocios peruanos que están empezando con IA, las herramientas cerradas son el punto de partida más práctico. A medida que el uso crece y los requerimientos se vuelven más específicos, tiene sentido explorar alternativas.
Preguntas frecuentes
¿Es legal usar modelos de IA de código abierto para uso comercial en Perú?
En general, sí. Modelos como Llama 3 tienen licencias que permiten uso comercial con ciertas condiciones. Pero cada modelo tiene su propia licencia y debes revisarla. Algunos limitan el uso a empresas con menos de cierto número de usuarios activos o prohíben usos específicos. Leer la licencia antes de integrar el modelo en un producto comercial es indispensable.
¿Puedo usar ChatGPT con datos de clientes peruanos sin problema legal?
Con precauciones sí. OpenAI tiene políticas que en principio no usan los datos que envías para entrenar sus modelos si tienes una cuenta de pago o usas la API. Pero debes informar a tus clientes si procesas su información con herramientas de IA, según la Ley 29733. Revisa los términos actualizados del proveedor antes de integrar datos sensibles.
¿Qué tan buenos son los modelos de código abierto comparados con GPT-4?
Los mejores modelos abiertos, como Llama 3 70B o Mistral Large, son competitivos para muchas tareas de texto. Para razonamiento complejo, código avanzado o análisis muy detallado, los modelos cerrados de última generación siguen teniendo ventaja. Para atención al cliente, resúmenes y redacción general, la diferencia es menor de lo que muchos esperan.
¿Puedo personalizar un modelo de IA cerrado para mi industria?
De forma limitada. Puedes personalizar el comportamiento con instrucciones del sistema y ejemplos, lo que se llama prompt engineering. Algunos proveedores como OpenAI ofrecen fine-tuning con datos propios, pero con restricciones. La personalización profunda, cambiar cómo el modelo entiende tu terminología o procesos, es más factible con modelos abiertos.
¿Qué modelo de IA abierto es más recomendable para empezar?
Llama 3 de Meta en su versión de 8 mil millones de parámetros es un buen punto de partida por su tamaño manejable y su calidad razonable. Si buscas algo más potente sin llegar a los costos de los modelos enormes, Mistral 7B y sus variantes son sólidos. Para ejecutar sin servidores propios, plataformas como Ollama permiten correr estos modelos localmente en una computadora decente.