Truco para ahorrar en transcripciones de audio con IA de OpenAI

Truco para ahorrar en transcripciones de audio con IA de OpenAI

Un desarrollador ha descubierto un método para reducir los costes de transcripción de audio con inteligencia artificial, como la de OpenAI, al acelerar el audio antes de transcribirlo. Este truco permite ahorrar tiempo y dinero al disminuir la cantidad de tokens consumidos durante el proceso. Utilizando la herramienta FFmpeg, se puede acelerar el audio duplicando o triplicando su velocidad, lo que reduce su duración sin afectar significativamente la calidad. Esto es posible porque los modelos de transcripción están diseñados para reconocer patrones de voz, incluso a velocidades más altas.

El truco surgió cuando George Mandis intentó transcribir una charla de IA y encontró que los límites de tiempo de carga eran restrictivos. Al acelerar el audio, logró transcribir más contenido en menos tiempo y con menos coste. Sin embargo, advierte que a partir de una velocidad 4x, la calidad se deteriora y la IA tiene dificultades para entender.

Este método es especialmente útil para profesionales que trabajan con grabaciones de voz, como periodistas e investigadores. Para ponerlo en práctica, se necesita estar familiarizado con el uso de comandos y herramientas como yt-dlp para descargar audio y FFmpeg para acelerarlo. Un ejemplo de comando para aumentar la velocidad sería: `ffmpeg -i audio.mp3 -filter:a «atempo=3.0» audio_3x.mp3`. Después, el audio acelerado se envía a la IA de OpenAI para su transcripción.

Fuente: https://www.genbeta.com/inteligencia-artificial/openai-cobra-cada-minuto-que-transcribe-su-ia-asi-que-alguien-invento-hack-definitivo-para-ahorrar-al-usarla

Contactos Leonardo Network

¿Necesitas asesoramiento? ¿Un presupuesto? ¿Información general? WhatsApp 642 12 29 45 o rellena el formulario de contacto. Te responderemos lo antes posible.

Condividi su...