
Qwen

Detalles de precios
Open Source: Modelos Qwen1.5/Qwen2 disponibles gratuitamente. API: Acceso vía plataforma Alibaba Cloud Tongyi con precios pay-as-you-go (por token).Características
Chat, Generación Texto, Generación Código, Traducción, Resumen, Comprensión Multimodal (Qwen-VL), Ventana Contexto Grande, Modelos Código Abierto (Qwen1.5, Qwen2), Fuerte Rendimiento Chino/Inglés.Integraciones
Integración con Hugging Face, ModelScope, PyTorch, TensorFlow. API para plataforma Alibaba Cloud.Vista previa
Qwen (Tongyi Qianwen) es el ambicioso proyecto de Alibaba Cloud en el espacio de los modelos de lenguaje grandes (LLM), que representa una familia completa de modelos de diversos tamaños y modalidades. Diseñados para una amplia gama de tareas de procesamiento del lenguaje natural y más allá, los modelos Qwen están entrenados en conjuntos de datos masivos y muestran un sólido rendimiento en benchmarks, especialmente en la comprensión y generación de texto en chino e inglés. Los modelos Qwen pueden participar en conversaciones significativas, generar contenido creativo (artículos, historias), escribir y depurar código en varios lenguajes de programación, realizar traducciones, resumir textos y responder preguntas. Un aspecto significativo es el lanzamiento de modelos de código abierto, como Qwen1.5 y Qwen2 (con tamaños que van desde 0.5B hasta 72B parámetros), que están disponibles para investigadores y desarrolladores para uso gratuito y ajuste fino bajo una licencia que permite el uso comercial (para modelos de hasta 72B). Esto fomenta la democratización del acceso a potentes LLM. Más allá de los modelos de texto, existe la versión multimodal Qwen-VL, que puede comprender e interpretar imágenes junto con texto. Alibaba Cloud también proporciona acceso a los modelos Qwen a través de su plataforma en la nube Tongyi y API, ofreciendo soluciones comerciales para empresas. Los modelos Qwen cuentan con grandes ventanas de contexto (hasta 32K tokens en algunas versiones), lo que les permite manejar documentos largos y mantener diálogos más complejos. Qwen se utiliza activamente para construir chatbots, asistentes virtuales, herramientas para desarrolladores y otras aplicaciones de IA.