Macwhisper ha sido durante mucho tiempo una de las mejores maneras y las más simples de transcribir cualquier cosa en una Mac. Lo he completado desde su lanzamiento, y no puedo recomendarlo lo suficiente. Hoy, ha mejorado aún más con una actualización que agrega la gestión del modelo de periquito increíblemente rápido de NVIDIA. Y quiero decir rápido.
Mientras Optai se aleja de Whisper, MacWhisper obtiene un impulso en Perruche
Cuando Operai salió con su familia Whisper de modelos de transcripción de IA, se sintieron como magia. Eran al menos más rápidos y más precisos que cualquier otra cosa, especialmente en el mercado de código abierto.
Sin embargo, mientras Optai ha trasladado su concentración a la mayoría comercialmente viable gpt-4o-transcribe
Modelos, Whisper comenzó a mostrar su edad. Pronto, los nuevos modelos de transcripción han susurrado lo que le había hecho a sus predecesores.
El periquito Nvidia es uno de ellos. Anunciado el mes pasado, prometió transcribir «60 minutos de audio en solo 1 segundo», siempre que tenga el equipo correcto, como las GPU A100, H100, T4 o V100.
El periquito estaba disponible a través de herramientas de código abierto. La captura? No todos se sienten cómodos navegando por interfaces de línea de comandos o administrando las implementaciones de modelos personalizados.
Afortunadamente, cambia hoy: MacWhisper acaba de agregar apoyo al modelo de periquito Nvidia, y es realmente increíblemente increíblemente rápido. Aquí está el desarrollador de aplicaciones Jordi Bruin:
«Gracias a nuestra colaboración con el equipo de Argmax, MacWhisper ahora está apoyando los modelos de periquitos. Para mostrarle cómo es un gran problema, vea el GIF a continuación donde transcribimos y Diaritons un podcast de 30 minutos en menos de 8 segundos!»
Lo probé en mi M2 Pro MacBook Pro utilizando un episodio reciente de 3 horas de 9to5mac Hora felizY terminó el trabajo en solo 1 minuto y 22 segundos, el reconocimiento de los oradores y todo.
Cabe señalar que el modelo de periquito está disponible para Usuarios profesionales Y actualmente admite la transcripción solo en inglés. Bruin dice que la versión multilingüe llegará pronto.