El 12 de Diciembre del 2024, Microsoft liberó una la IA (Inteligencia Artificial) de nombre Phi-4.
Phi pertenece a una familia de IA Generativa de nombre Small Language Model (SLM). Microsoft Phi SLM se entrena con datos de “calidad de libro de texto”, que incluyen conjuntos de datos sintéticos, conocimientos generales, teoría de la mente, actividades regulares, entre otras. Este es un modelo que se encuentra basado en transformadores con capacidades como un objetivo de predicción de la palabra siguiente. Microsoft anteriormente ha entrenado otras versiones de Phi, entrenamientos que ha logrado realizar con 96 GPUs A100 en un periodo dde 14 días, siendo así un modelo más rentable y fácil de entrenar con datos específicos en comparación con Chat GPT-4. Para ponerlo en perspectiva, Chat GPT-4 tarda en ser entrenado entre 90 y 100 días utilizando decenas de miles de GPU Tensor Core A100.
Los primeros modelos de Phi, como el Phi-2, alcanza a resolver complejas ecuaciones matemáticas y problemas de física, así como identificar errores que haya cometido una persona en un cálculo.
En diferentes tipos de pruebas Phi es un modelo que supera a Llama, Mistral y Gemini Nano 2,
LPhi-4 es un modelo que ya se puede usar directamente desde Azure AI Foundry.
Actualmente existe un benchmark en donde se muestran las capacidades y desempeo superior de Phi-4 comparado con otros modelos tanto SLM como LLM (Large Language Model).
Si buscas implementar una solución de software con IA Generativa, deberías de darle una oportunidad a Phi-4, posiblemente resuelve tus necesidades de una mejor manera en comparación con Chat GPT-4
Fuente: techcommunity.microsoft.com