Wikimedia Lanza un Proyecto para Hacer los Datos de Wikipedia Más Accesibles para la IA

Wikimedia Lanza un Proyecto para Hacer los Datos de Wikipedia Más Accesibles para la IA

Wikimedia Deutschland (el capítulo alemán de Wikimedia) anunció el 1 de octubre de 2025 el lanzamiento del proyecto "Wiki-LLM", destinado a sistematizar y simplificar el acceso a los datos de Wikipedia para los desarrolladores de IA. Aunque Wikipedia es una de las fuentes principales para el entrenamiento de grandes modelos de lenguaje, sus "volcados" de datos estándar son difíciles de procesar debido a un marcado específico y a la falta de una estructura unificada. El nuevo proyecto, según informa TechCrunch, proporcionará conjuntos de datos actualizados regularmente, limpios y estructurados en formatos legibles por máquina (por ejemplo, JSON). Esto no solo simplificará el trabajo técnico para los equipos de IA, sino que también resolverá dos problemas clave: mejorará la calidad de los conjuntos de entrenamiento y garantizará la transparencia de la procedencia de los datos, lo cual es fundamental para el cumplimiento de las licencias y para combatir las "alucinaciones" de los modelos. La iniciativa tiene como objetivo mejorar la fiabilidad y la responsabilidad general en el ecosistema de desarrollo de la IA.

« Volver a la Lista de Noticias