¿Qué es exactamente la locución con inteligencia artificial y cómo afectará a la industria del Voiceover? Anteriormente conocida como TTS, o Texto a Voz, la voz artificial es una parte enorme y creciente de la industria que tiene consecuencias de gran alcance para todos los artistas de voz, agentes y clientes por igual.
Este artículo analiza en profundidad la voz artificial, explica lo que debemos saber y rompe los mitos que hay que desmentir.
Conoceremos:
- La historia de la IA en la voz
- Frases concatenadas
- Concatenación fonémica
- IA algorítmica y el modelo Tacotron 2
- ¿En qué punto se encuentra la voz artificial?
- Los diferentes tipos de VO de IA en la industria
- Contratos de voz con IA
- Tus contratos actuales de VO
- Contratos de VO de IA
- ¿La voz TTS / AI es para siempre?
- ¿Cómo decidir si hacer un trabajo de VO con IA?
- Cómo fijar el precio de los trabajos de VO con IA
- Conclusión
Para ponerte al día y entender el sector actual, primero tenemos que ver lo que ha sucedido antes para que todo quede claro. Así que primero ….
La historia del Voice Over de IA
El VO de AI ha pasado por varias evoluciones en las últimas décadas. Veámoslas en orden cronológico:
Frases concatenadas
La primera iteración de Voice Over de IA fue el fraseo concatenado. La concatenación significa la unión de más de una cosa, en este caso frases vocales. El ejemplo más evidente eran las frases creadas en los sistemas telefónicos o en las estaciones de tren a partir de un banco de material pregrabado:
“El tren que llega al andén – 1 – es el – 13 – 35 – Great Western – Con destino a – Scunthorpe – pasando por – Wembley Stadium – High Wycombe – Princes Risborough…” … y así sucesivamente
Se trataba de una forma eficaz, aunque básica, de crear múltiples frases a partir de material previamente grabado. Es discutible si esto podría describirse como locución con IA en su sentido más estricto, pero este enfoque fue la primera aplicación de la misma en el mundo real.
Concatenación fonémica
El VO de AI avanzó entonces a la Concatenación Fonémica. Pero, ¿qué es un fonema?
Un fonema es el término lingüístico que se usa para describir la unidad más pequeña en que se puede dividir el habla, o por citar la definición del diccionario: “Las unidades de sonido perceptualmente distintas en una lengua específica que distinguen una palabra de otra”
Para dar un ejemplo de estos fonemas en el sentido más simple, tomemos la palabra “Voy”. Los fonemas de Voy son V-o-y. Los fonemas de Baño son B-aa-ñ-o.
La Concatenación Fonémica es el mismo enfoque que la Fraseología Concatenada original, solo que usa fonemas en lugar de frases.
Así que si grabas la B, la Aa, la Ñ, y la O, y luego las pegas todas juntas, obtienes….Baño.
Obviamente, esto es mucho más complicado de hacer y hay muchas más posibilidades de que suene mal, sobre todo si se graban los fonemas individualmente: no funcionaría y sonaría muy forzado.
Así que los primeros maestros de la concatenación fonémica, los gigantes de la tecnología, encontraron formas algorítmicas de grabar grandes conjuntos de diálogos (grabados, por supuesto, por locutores y actores, no por máquinas), dividirlos en fonemas y volver a pegarlos para formar frases. A continuación, aplicaban algoritmos inteligentes de suavización para que el resultado final fuera menos “accidentado”.
Colecciones masivas de datos de voz de IA
Por no aburrir a los lectores, no voy a entrar en los términos lingüísticos de los diafonemas y los alefonemas, basta con decir que estas concatenaciones fonémicas se crearon sobre la marcha y en tiempo real, en cuestión de milisegundos.
Escribes en el sistema “¡Eh, quiero ser un robot!” y en milisegundos, el sistema te lo devuelve en forma de habla.
Pero, ¿cómo lo hicieron?
Lo cierto es que el sistema de concatenación fonémica requiere el registro de grandes cantidades de datos. No solo se trataba de abarcar todas las posibles partes constitutivas de la lengua en cuestión, sino también muchas versiones diferentes para permitir la concatenación de entonaciones, tonos, velocidades, etc.
Las frases grabadas se cortaban en pequeñas partes, listas para pegarlas después.
Así que si estuviéramos haciendo la palabra ‘Robot’, necesitamos:
- El sonido “espacio antes de la R”
- el sonido “R a la O”
- el sonido “O a la B”
- el sonido “B a la O”
- el sonido “O a la T”
- y luego el sonido “T más espacio”.
…tomando solo uno de ellos, por ejemplo, el algoritmo podría tomar los 25 sonidos de la “R a la O” que tiene almacenados en su base de datos, elegir el más apropiado basándose en su tono o prosodia, seleccionarlo, pasar al siguiente y así sucesivamente.
¡Habemus Robot!
Por eso, las sesiones de voz solían durar más de 6 meses, grabando 5 días a la semana. Había que capturar una cantidad tan grande de datos de voz para conseguir una cobertura suficiente para que todo funcionara.
Cuantos más datos tuvieras, menos posibilidades de fallas tendrías. Cuantos menos datos tuvieras, más probable que algo fallara.
¡Lo que dices es lo que recibes!
Una de las cosas más interesantes del método de concatenación fonémica, y de hecho, de la locución AI en general, es que el estilo con el que se introduce el diálogo en el sistema (es decir, cómo se graba) es cómo suena cuando sale por el otro lado.
Si la frase se graba con una intención muy triste, el Voice Over de IA al final sonará triste.
Reproducción del diálogo
Pero aunque los servicios de conversión de texto a voz de los “5 grandes” parezcan fantásticos -los conoces a todos, Amazon, Google, Apple, Samsung, etc.- no todo es lo que parece. A veces escuchabas el resultado y pensabas ….. “¡Dios mío, es impresionante!”.
Pero como ocurre con muchas formas de medios de comunicación y entretenimiento, siempre había (y hay) espejos y humo.
Muchas de las empresas mezclaron la producción de voz de IA con líneas de diálogo grabadas normalmente.
Si se escuchaba realmente impresionante es simplemente porque el actor de voz lo hizo genial.
Para que sus sistemas fueran aún más eficientes, las empresas almacenaban en caché las solicitudes para que hubiera que procesarlas menos. Si recibían una petición de una cadena de caracteres como “¿Qué talla de zapatos usa Hugh Grant?”, ésta se procesaba y almacenaba para que la próxima vez que se solicitara esa cadena, ya estuviera allí para ser entregada.
Esta forma de mezclar las líneas de reproducción con líneas de locución con IA sigue existiendo el día de hoy, y es una de las razones por las que los locutores que se preocupan por perder su trabajo no deben entrar en pánico todavía. Más adelante hablaremos de esto.
En cualquier caso, los costos de producción eran demasiado altos para la producción a gran escala del modelo de concatenación fonémica, debido a la enorme cantidad de datos necesaria; las grandes empresas de tecnología podían permitírselo, pero nadie más podía hacerlo. Así que la siguiente evolución fue ….
Locución con IA algorítmica y “Tachotron 2”
Por muchas razones, principalmente por el costo, pero también por los grandes avances en la tecnología de aprendizaje automático – y fíjate que aquí no usé el término Inteligencia Artificial, porque en realidad no es IA, solo aprendizaje automático-, la industria pasó a un modelo más algorítmico.
El primer modelo ampliamente adoptado fue el llamado modelo Tacotron 2, que utiliza el aprendizaje automático para analizar los datos de voz, crear un “modelo” y luego utilizar ese modelo para producir archivos de voz.
Para quien esté interesado en profundizar un poco más en el Tacotron 2, pueden ver las notas y documentos de Google sobre el tema.
Tacotron 2 tenía sus defectos: tenía una tasa de bits y una profundidad de bits comparativamente bajas, lo que hacía que el sonido tuviera un poco de “pérdidas” y requería mucho tiempo de procesamiento para construir un modelo. Además, su procesamiento era relativamente lento, lo que significaba que la mayoría de las empresas o equipos que lo utilizaban no podían procesar en “tiempo real”, o al menos en un tiempo lo suficientemente real como para que el cliente no notara el retraso que ocurría.
Pero fue un gran salto. Ya no era necesario grabar 500,000 palabras de diálogo; ahora bastaban 50,000. Luego 40,000, y luego 20,000, y así sucesivamente.
Y no solo eso, plataformas como Google lanzaron su plataforma de desarrollo en la nube de Google, haciendo que el aprendizaje automático estuviera disponible comercialmente para cualquiera que quisiera pagarlo.
Ahora estaba disponible para todo el mundo, y esto generó una avalancha de empresas de IA que querían trabajar en el sector de la voz artificial. Según mis propios registros y los informes de Samsung Now AI, en 2018 contábamos con unas 15 empresas que trabajaban en el sector, a mediados de 2020 dejamos de llevar el conteo cuando íbamos en 250, y ahora hay miles en todo el mundo, todas ellas abriendo nuevos caminos y de forma innovadora.
En qué punto está ahora la voz artificial
Los modelos de IA han evolucionado. Algunos siguen utilizando Tacotron, otros han desarrollado sus propios sistemas y algoritmos. Algunos tienen un sonido fantástico, otros son terribles, y hay muchas iteraciones intermedias.
Algunas empresas, como Replica Studios y Veritone, están tratando activamente de involucrar a la comunidad de voces e idear maneras justas de remunerar a los artistas.
Algunas empresas, como Speechelo, están atacando activamente y en contra de la comunidad de voz, pero tienen respaldo y están tratando de interrumpir el mercado en su propio beneficio.
Algunas empresas como Voice123, el sitio pay-to-play, han empezado a tomar un papel activo y han contratado a empresas de locución con IA para que creen modelos para ellos, como pruebas para iniciar el proceso de investigación
Pero basta con decir que la caja de Pandora no puede cerrarse y que la industria de la voz artificial ha llegado para quedarse.
Así que no va a desaparecer. ¿Hasta qué punto debemos preocuparnos los artistas de la voz y cómo nos va a afectar? Pues bien, para entenderlo, primero tenemos que responder a algunas preguntas más. Veamos:
Los diferentes tipos de voz de IA en la industria
Esta sección no se centra en el punto de vista del consumidor, sino en el nuestro, el de los locutores. Hay algunos tipos diferentes de locución con IA que debemos conocer:
- Empresa de locución con IA
- Contrato de locución con IA
- Prospecto de locución con IA
- P2P de locución con IA
- Modelo propio de locución con IA
- Modelo de entrenamiento Trabajos
Hay tantas (y cada vez más) oportunidades para hacer este tipo de trabajo, que puede ser un poco como un campo de minas, y muchos VO simplemente no saben qué aceptar, ni por qué deberían hacerlo. O no deberían.
Así que vamos a revisar cada uno de ellos por separado.
- Empresa de locución con IA
En este caso, una empresa (por ejemplo, Amazon, Google, Apple, etc.) te contrata para que seas la voz de su propia marca de TTS/voz de IA.
Hay que tener en cuenta algunas cosas importantes.
Aspectos positivos:
- Sabes dónde y para quién se va a
- Sabes en qué plataformas se utilizará
- Puedes estimar una vida útil aproximada del producto basándote en la empresa
- Es probable que obtengas una gran exposición
- Es probable que se te pida que grabes más en el futuro
- Puedes cobrar adicionalmente por la exclusividad
- Los procesos de casting son amplios y requieren mucho tiempo; tienes capacidad para negociar una vez que has sido elegido como la voz final
Aspectos negativos:
- La compañía insistirá casi definitivamente en un buyout total, a perpetuidad
- Es posible que no consigas trabajo con competidores directos
- La empresa podría vender tu voz en el futuro, algo que no puedes controlar
Conclusión:
Por lo general, si vas a hacer un trabajo de locución con IA, estas suelen ser las apuestas más seguras. Si sabes en qué te metes, dónde se utilizará la voz y cuál es la remuneración que recibes por ella, puedes tomar una decisión legítima e informada para hacer el trabajo o no.
Contrato de locución con IA
Es bastante similar a una empresa, ya que sabes en qué te estás metiendo. Aparentemente, te contratan para firmar un contrato y cumplirlo con grabaciones de diálogos que luego se convertirán en un modelo de voz para usar en ese contrato.
Un buen ejemplo de esto sería crear un modelo de personaje para un juego, que muy probablemente solo se utilizará para ese juego.
Otro ejemplo podría ser la creación de un modelo para algunas de las nuevas tecnologías de voz a voz, desarrolladas por empresas como Altered AI, en las que se crea un modelo de voz para que otro actor lo interprete, como si llevara puesta una “voz” para una actuación.
Aspectos positivos:
- Sabes dónde y para quién se va a utilizar.
- Sabes en qué plataformas se utilizará
- Puedes estimar una vida útil aproximada del producto basándote en el contrato
- Podrías tener mucha exposición, y de hecho es probable que no estés bajo contrato de confidencialidad, así que podrías poner esto en tu currículum
- Es probable que se te pida que grabes más en el futuro
- Si lo deseas, puede cobrar un suplemento por la exclusividad
- La compra total a perpetuidad puede negociarse hasta la duración y las limitaciones de ese contrato
Aspectos negativos:
- La empresa podría vender tu voz en el futuro, lo que no puedes controlar
Conclusión:
Si se negocia y se contrata adecuadamente, el contrato puede ser una muy buena apuesta y presentar enormes oportunidades para los locutores del sector. A medida que crezca el sector de la locución con IA, estos contratos crecerán y crecerán y estarán cada vez más disponibles.
Esto debe verse como una oportunidad y un gran potencial de futuro para los artistas de la voz que trabajan en el sector.
Prospecto de locución con IA
Si llevas algún tiempo trabajando en el sector de la voz, seguro que ya has visto estos trabajos y probablemente te hayan contactado algunas de las empresas que los realizan.
El proceso es más o menos así. Te contratan para que les grabes la voz. Luego crean un modelo. Luego encuentran un cliente que compre el modelo. Venden el modelo a ese cliente.
Aspectos positivos:
- Tienes un trabajo de voz.
- Podrías tener una gran exposición
Aspectos negativos:
- La empresa venderá tu voz en el futuro, sobre lo que no tienes ningún control. No puedes decidir o votar sobre dónde se vende, si es a una empresa de renombre, o para ser la voz de un sitio porno o una muñeca sexual (no es broma, ambas cosas han sucedido).
- No se sabe en qué plataformas se utilizará
- No se puede estimar una vida útil aproximada del producto basándose en el contrato
- Es poco probable que se te pida que grabes más en el futuro
- No se puede cobrar adicionalmente por la exclusividad si se requiere
- La compra total a perpetuidad será absolutamente necesaria
- Es muy probable que se te excluya de muchos mercados. Por ejemplo, si tu modelo se vende a British Airways, ya no podrás trabajar para ninguna otra aerolínea. Si también te venden a Ford, ya no podrás trabajar para ninguna otra empresa de automóviles, etc.
- Es probable que te encuentres en problemas legales en el futuro cuando te pidan ser exclusivo para una empresa pero no puedas debido a tus modelos en el mercado.
- Se te paga una vez y nunca más, aunque la empresa contratante venderá, y revenderá, y revenderá tu voz
Conclusión:
Ta forma de trabajar es totalmente tu decisión. Sin embargo, no aconsejamos hacer trabajos de prospectos de locución con IA.
Eso, claro, a menos que tengas contratos herméticos que te permitan decidir sobre el uso, dónde se vende, obtener futuros pagos de regalías, etc. ….. al igual que haces ya con tu propia voz.
P2P VO IA
En esta sección de la industria se participa en la creación de un modelo, y la empresa luego vende el diálogo línea por línea, o en paquetes, o suscripciones (con x líneas o líneas ilimitadas por mes), etc.
Se utilizan de forma general, y línea por línea, como hacen empresas como Murf AI, o a veces en paquetes o suscripciones, a veces en juegos, etc.
Aspectos positivos:
- Tienes un trabajo de voz.
- Podrías tener una gran exposición
- Algunas empresas pagarán regalías o cuotas continuas o de uso
Aspectos negativos:
- La empresa venderá tu voz en el futuro, sobre lo que no tienes ningún control. No puedes decidir o votar sobre dónde se vende, si es a una empresa de confianza, como en el modelo de Prospectos.
- No se sabe en qué plataformas se utilizará
- No se puede estimar una vida útil aproximada del producto basándose en el contrato
- Es poco probable que se te pida que grabes más en el futuro
- No se puede cobrar adicionalmente por la exclusividad si se requiere
- La compra total a perpetuidad será absolutamente necesaria
- Es muy probable que se te excluya de muchos mercados.
- No tienes control sobre el tema que se utiliza; puedes ser republicano pero que tu voz se utilice para promocionar a los demócratas, o para publicidad de tabaco, o de alcohol, etc.
- En Internet no se controla dónde se puede utilizar, ni en qué medida.
- Es probable que te encuentres con problemas legales en el futuro cuando te pidan ser exclusivo para una empresa pero no puedas debido a tus modelos existentes en el mercado.
- Se te paga una vez y nunca más, aunque la empresa contratante venderá, y revenderá, y revenderá – se le excluye del uso futuro.
Conclusión:
No aconsejamos hacer trabajos de voz de IA P2P. Con la excepción, de nuevo, de que tengas contratos herméticos que te permitan decidir sobre el uso, dónde se vende, obtener futuros pagos de regalías y así sucesivamente, de la misma manera que en el modelo anterior.
Otro punto a tener en cuenta, sin embargo, es que a menudo hay trabajo de personajes en el género P2P, y si estás haciendo un trabajo de personaje que no suena como tu voz natural, puede ser que no te preocupe ceder los derechos de este personaje en particular, ya que podría no afectarte tanto en el futuro.
Conclusión – Parte 2 – Seguimiento y uso
Una de las principales razones por las que esta parte de la industria es tan difícil es que todavía no hay una forma estándar y global de dar seguimiento o marca de agua en la industria. Sin embargo, estamos viendo cómo se invierten enormes cantidades de dinero de capital riesgo en NFT tokens no fungibles y en la tecnología blockchain, lo que podría dar lugar a una solución a este problema.
Una vez que se resuelva ese problema, el seguimiento, y por tanto el uso, podría convertirse en una parte importante de nuestros ingresos y todo lo aconsejado aquí podría cambiar. Pero ese no es el caso actualmente.
Tu propio modelo de voz AI
Eres humano, tienes que dormir. Pero Internet no duerme y es una industria global 24×7.
Aunque de momento no es nada común, existe la idea de que los locutores podamos crear nuestros propios modelos (probablemente a través de una empresa con la que nos asociemos o pagando por el servicio) y venderlos nosotros mismos de forma permanente o en un mercado.
La idea es que sigas haciendo tu propio trabajo de VO, pero que además tengas a tu modelo trabajando para ti.
Como esto aún no ha despegado, no está muy claro cuáles son los pros y los contras de esta situación.
¿Cuánto costaría crear el modelo? ¿Cuánto trabajo te daría? ¿Valdría la pena? ¿Cuánto control tendrías realmente sobre quién compra, para qué se usa y dónde?
Lo único que está claro es que los contratos van a seguir siendo indispensables, y tan importantes como los contratos en cualquier otra sección de la industria de la locución de la IA.
Modelo de entrenamiento de locución con IA
Este es un poco el punto de partida, ya que no es realmente un género. Pero hay muchos trabajos en la industria en este momento que se centran en esto, y son muy incomprendidos. Así que he pensado en incluirlo aquí.
Cuando se crea un modelo hay muchos componentes y puntos de datos. Está la voz real que se utiliza y se escucha, sí (¡ver los tipos de trabajos anteriores!) pero también hay otros.
Uno de ellos son los patrones de prosodia. La inflexión y el tono de la pronunciación de las frases, a lo largo del tiempo. Tu patrón prosódico natural no es el mismo que el mío. El mío no es el mismo que el de tu mamá. El de tu mamá no es el mismo que el de la maestra de primer grado de mi hijo, y así sucesivamente.
Los trabajos de entrenamiento son solo eso. Tu voz se utiliza como base para entrenar al modelo a hacer otras cosas – no va a utilizar tu voz real para hacerlo, y tu voz no se escuchará en el resultado final.
Evidentemente, es muy importante que revises tu contrato con estos trabajos para asegurarte de que no te están tomando el pelo, pero son trabajos legítimos y no afectan realmente a tu futura carrera, uso, reputación, etc. Pero como no se utiliza tu voz, suelen estar mucho peor pagados.
Contratos de locución con IA
…y aquí es donde empieza a ponerse complicado. No soy abogado, pero he tenido mucha experiencia con los contratos de voz de IA. No te tomes esta sección a la ligera, es decir, no ingieras esta sección de la misma manera que James Michael Collins ingiere langostas…
La propia Bev Standing de GFTB llevó recientemente a Tik Tok a los tribunales por el uso indebido de su modelo de voz, por lo que es muy importante hacer las cosas bien desde el principio.
Tus contratos de voz actuales
Así es. Todavía no hemos llegado a los contratos de voz de IA.
Hace poco pregunté a los asistentes a la Conferencia One Voice si utilizaban contratos de voz en todos sus trabajos. De 100 personas en mi sesión, sólo 3 levantaron la mano. ¡Esto es una locura!
Si no tienes un contrato con tus contratantes, te estás dejando indefenso, y lo que es peor, ¡dejando de ganar en el futuro con esa empresa!
Por favor, revisa tus contratos y los seminarios web sobre contratos en Gravy For The Brain ahora mismo, para protegerte.
Pero, ¿qué tiene esto que ver con la voz artificial?
Se trata de esto. Con todos tus trabajos actuales que no están relacionados con la IA, por ejemplo, el aprendizaje electrónico…. ¿has firmado un contrato de compra, a perpetuidad?
¿O tal vez recuerdes algún texto en un contrato que dijera algo como ….. “en cualquier plataforma, elemento, instancia o dispositivo conocido en el futuro, ya sea conocido o no conocido ahora”?
Si hiciste cualquiera de esas cosas… y seamos sinceros, todos lo hemos hecho…. esa empresa puede ahora legalmente ir y crear un modelo de voz con las grabaciones que hiciste para ellos en el pasado, venderlo a quien ellos quieran y tú no tienes ningún derecho sobre eso.
La moraleja de esta sección
…. no puede ser más claro:
Actualiza todos tus actuales contratos, machotes, lo que sea, para que incluyan un texto que especifique… que las grabaciones para las que eres contratado no pueden ser utilizadas para crear un modelo de voz artificial de ningún tipo, ahora o en el futuro, en cualquier plataforma o dispositivo conocido o aún no conocido….
Ahora es el momento de protegerte en todo lo que haces en tu profesión.
¡Los verdaderos contratos de locución con IA!
Bien, después de haberte dado un susto de muerte con lo de tus contratos actuales, vamos a ver las cosas que podrías tener en cuenta con el contrato de locución con IA cuando lo tengas o cuando lo estés negociando:
- ¿Exactamente cuántos diálogos estás grabando?
- ¿Existe un periodo de exclusividad y, en caso afirmativo, durante cuánto tiempo? ¿Qué ocurre al final de este periodo?
- ¿Qué tarifa estás recibiendo?
- ¿Qué uso está dándosele?
- ¿Para qué tipo de modelo se van a utilizar tus grabaciones?
- ¿Durante cuánto tiempo pueden utilizar tu modelo?
- ¿Dónde pueden utilizar tu modelo?
- ¿En qué plataformas pueden utilizar tu modelo?
- ¿En qué territorios pueden utilizar tu modelo?
- ¿Se pueden vender tus modelos o grabaciones individuales, o líneas individuales? ¿Pueden revenderse? ¿Tienes voz al respecto?
- ¿Qué ocurre si se vende la empresa host? ¿Qué pasa con tu modelo? ¿Tienes voz al respecto?
- ¿Pueden utilizar tu modelo o grabaciones o líneas en medios de difusión, como la televisión, el cine, la radio, los podcasts -0 y, si es así, cómo se te remunera por el uso?
- ¿Pueden utilizarse tus grabaciones para entrenar otros modelos?
- ¿Puede tu modelo ser interpretado por otro ser humano (por ejemplo, speech to speech)?
- ¿Se pueden amalgamar tus grabaciones/modelo con el modelo o las grabaciones de otra persona?
- ¿Se pueden manipular las grabaciones o el modelo, por ejemplo, cambiar el tono, hacer que sea emocional, etc.?
- ¿Cómo va a rastrear o poner una marca de agua a las grabaciones la empresa host, o al modelo?
- ¿Cuáles son específicamente tus derechos, y cuáles son los que se están licenciando o cediendo mediante el contrato?
- ¿Eres contratado por un tercero y no directamente por el cliente? Si no es así, ¿quién es el cliente? ¿Cómo te pondrás en contacto con ellos cuando termine el trabajo?
Está claro que la lista es larga, pero no es en absoluto exhaustiva. Mi consejo es que consultes a una entidad jurídica con experiencia en estas cuestiones y que te afilies a tu sindicato local, como Equity o Sag Aftra, que están trabajando en estos temas por ti.
Google y los consejos de los compañeros también son tus amigos.
¿La voz TTS / IA es para siempre?
A menudo se dice que si firmas un contrato a perpetuidad, las compañías malvadas tienen tu voz para siempre. Y técnicamente, sí es cierto. Pero, ¿cuál es la realidad?
La realidad es que la tecnología y el desarrollo avanzan más rápido ahora que en cualquier otro momento de la historia de la humanidad.
Jon Briggs y Susan Bennett fueron las primeras voces TTS para Siri de Apple, y alcanzaron fama mundial (en gran parte porque ambos participaron en IA de Prospecto, lo que no les dio la remuneración que merecían), y fueron sustituidos como Siri en menos de una década.
Las normas cambian, los enfoques y la metodología cambian. Cambian las voces y las modas.
Una voz que se graba ahora no es muy probable que siga en circulación dentro de 20 años. Esto es algo que hay que tener en cuenta cuando se piensa en aceptar un trabajo de locución con IA.
¿Cómo elegir si hacer un trabajo de locución con IA?
La respuesta a esto es, por supuesto, muy subjetiva. Pero espero que la información en este artículo te ayude.
Piensa en:
- El tipo de trabajo que es
- Las ramificaciones futuras para ti (aunque no sean obvias)
- Si la remuneración vale la pena
¿Cómo te aconsejarías a ti mismo si pudieras mirar atrás dentro de diez años? (Lo siento, soy un trekkie…)
Pero lo más importante es mantener una buena conversación con la parte contratante. Haz preguntas. Todas las preguntas. La lista de consideraciones que he planteado más arriba.
Entra de lleno en los detalles de este proyecto.
Si el cliente no está dispuesto a responder a todas las preguntas de forma abierta y honesta, probablemente sea el momento de agradecerle su tiempo y marcharte.
Si te responden correctamente y se comprometen contigo, obtén toda la información que necesitas y luego toma una decisión educada e informada.
Los buenos trabajos de locución con IA son fantásticos y pueden ser excelentes para tu carrera y tu avance. Los malos… no tanto.
Cómo fijar el precio de los trabajos de locución con IA
Esta es probablemente la pregunta más difícil de responder. La gama de la que tengo experiencia, por mis propios conocimientos y por haber visto otros trabajos ir y venir, oscila entre pocos miles y muchos miles.
Es casi imposible establecer una estructura de precios coherente para los trabajos de locución con IA, ya que, por su propia definición, son muy inconsistentes.
Echa un vistazo a la guía de tarifas de GFTB y busca TTS / IA para obtener más información y te harás una mejor idea.
Lo más importante es ser plenamente consciente del proyecto, su alcance, el uso y el cliente, y luego hablar con tus colegas y encontrar el nivel de compensación adecuado.
Recuerda que, una vez que hayas sido elegido, tienes más influencia de la que crees.
Conclusión
Espero que te haya resultado útil este artículo. Este es un sector que todavía está en pañales y las cosas están cambiando rápidamente. Te invito a que no seas pesimista o un profeta de la desgracia en lo que respecta a los trabajos de locución con IA porque….
Los buenos trabajos de IA son absolutamente fantásticos y mejorarán tu carrera.
Pero ….
Los malos trabajos de IA tienen el potencial de ser muy perjudiciales para ti.
…y hay que considerar cada caso por separado para ver sus méritos, problemas y detalles individuales. Sí, las aguas de aquí suelen estar llenas de tiburones, pero eso no significa que no haya delfines.
Como siempre, en Gravy For The Brain actualizaremos la información sobre este tema, y te deseo la mejor de las suertes.
Hugh Edwards
CEO, Gravy For The Brain
(Director de casting / Director de voz en más de 45 proyectos de voz TTS/IA)
Leave a Reply