Icono de la herramienta

Yandex SpeechKit

Clasificación:

4.7 / 5.0

Icono de neurona
Yandex SpeechKit

Etiquetas

Speech Recognition, ASR, Speech Synthesis, TTS, NLP, Cloud Service, Yandex Cloud, API

Detalles de precios

Pago por uso basado en el número de minutos de voz reconocida o sintetizada. Hay un nivel gratuito disponible para volúmenes pequeños.

Características

Reconocimiento de voz (ASR), síntesis de voz (TTS), soporte multilingüe, diarización de hablantes, clonación de voz (para empresas), acceso a API.

Integraciones

API y SDKs para integración en aplicaciones, servicios web y flujos de trabajo. Parte de la plataforma Yandex Cloud.

Vista previa

Yandex SpeechKit es una tecnología integral de Yandex que proporciona capacidades de reconocimiento de voz (ASR) y síntesis de voz (TTS). Permite convertir el lenguaje hablado en texto y viceversa, generando voz con sonido natural a partir de texto. SpeechKit admite numerosos idiomas, incluida una profunda optimización para el idioma ruso. El servicio ofrece varias voces para la síntesis de voz y se puede utilizar para crear asistentes de voz, sistemas de control por voz, transcribir grabaciones de audio, doblar contenido y otras tareas relacionadas con el procesamiento de voz. Está disponible a través de la plataforma Yandex Cloud mediante una API.