Icono de la herramienta

Google Cloud Speech-to-Text

Clasificación:

4.8 / 5.0

Icono de neurona
Google Cloud Speech-to-Text

Etiquetas

Speech Recognition, ASR, NLP, Cloud Service, Google Cloud, API, Transcription

Detalles de precios

Pago por uso basado en el número de minutos de audio procesados. Hay un nivel gratuito disponible para un número limitado de minutos por mes.

Características

Reconocimiento de voz (ASR), transcripción en tiempo real, transcripción por lotes, soporte multilingüe, diarización de hablantes, filtrado de blasfemias, acceso a API.

Integraciones

API y SDKs para integración en aplicaciones, servicios web y flujos de trabajo. Integración con otros servicios de Google Cloud (por ejemplo, Cloud Storage, Dataflow).

Vista previa

Google Cloud Speech-to-Text es un servicio basado en la nube de Google que utiliza modelos avanzados de aprendizaje automático para convertir audio a texto de forma precisa y rápida. El servicio admite el reconocimiento de voz en tiempo real y el procesamiento por lotes de archivos de audio. Es capaz de reconocer voz en numerosos idiomas y dialectos, detectar automáticamente el idioma, reconocer múltiples hablantes y filtrar blasfemias. Speech-to-Text se utiliza ampliamente para generar subtítulos, transcribir reuniones, habilitar aplicaciones por voz y analizar contenido de audio.