
Google Cloud Speech-to-Text

Detalles de precios
Pago por uso basado en el número de minutos de audio procesados. Hay un nivel gratuito disponible para un número limitado de minutos por mes.Características
Reconocimiento de voz (ASR), transcripción en tiempo real, transcripción por lotes, soporte multilingüe, diarización de hablantes, filtrado de blasfemias, acceso a API.Integraciones
API y SDKs para integración en aplicaciones, servicios web y flujos de trabajo. Integración con otros servicios de Google Cloud (por ejemplo, Cloud Storage, Dataflow).Vista previa
Google Cloud Speech-to-Text es un servicio basado en la nube de Google que utiliza modelos avanzados de aprendizaje automático para convertir audio a texto de forma precisa y rápida. El servicio admite el reconocimiento de voz en tiempo real y el procesamiento por lotes de archivos de audio. Es capaz de reconocer voz en numerosos idiomas y dialectos, detectar automáticamente el idioma, reconocer múltiples hablantes y filtrar blasfemias. Speech-to-Text se utiliza ampliamente para generar subtítulos, transcribir reuniones, habilitar aplicaciones por voz y analizar contenido de audio.