Aflorithmic, la start-up SaaS basée à Londres et à Barcelone, a levé 1,3 million de dollars de financement d’amorçage auprès de Crowd Media Holdings, une société australienne spécialisée dans le commerce et le marketing social basés sur les influenceurs.

Selon un communiqué de presse, il prendra une participation de 10% dans Aflorithmic, déclarant que l’investissement stratégique vise à offrir des appels FaceTime aux célébrités grâce à la «meilleure technologie de paiement vocal».

Aflorithmic, âgé de deux ans, n’a peut-être pas choisi un nom déchirant, mais tout est question de parole et d’audio. Il a construit une plate-forme qui offre une production audio entièrement automatisée et évolutive en tirant parti des médias synthétiques basés sur l’IA, du clonage de la parole (« éthique ») et du mastering audio – livrés aux oreilles des gens via des sites Web, des applications mobiles, des haut-parleurs intelligents, etc. via ses API.

« Texte dans une belle sortie audio » est le slogan concis.

Des exemples de clips sur le site Web illustrent l’élément de personnalisation avec des voix off synthétisées (à voix robotique) saluant un client nommé avant de se plonger dans les détails du contenu pour lequel il est programmé.

Certains clients actuels d’Aflorithmic utilisent ses outils pour créer des livres audio pour les enfants, pour une narration personnalisée des programmes de bien-être / nutrition, et même un service de conciergerie avec un majordome robotique, pour n’en nommer que quelques-uns. La proposition commerciale est que la demande audio dépasse de loin la capacité des voix off parlées par l’homme produites en studio.

Par conséquent, on pense que des médias synthétisés seront nécessaires pour combler l’écart de demande – en offrant des permutations infinies d’une piste vocale, chacune personnalisée pour un client particulier de la marque ou de l’entreprise.

Dans le même temps, la popularité des podcasts et de la diffusion vocale en direct ne montre aucun signe de déclin – parlant de la durabilité de l’audio à une ère de vidéo intense.

Elon Musk dépasse la limite du clubhouse, les fans diffusent sur YouTube, il passe à interviewer le PDG de Robinhood

Le nouvel investisseur d’Aflorithmic, Crowd Media Holdings, a des conceptions légèrement plus ambitieuses sur ce que ses outils peuvent aider – et parle de « remodeler complètement la façon dont les consommateurs interagissent avec le commerce électronique ».

La motivation spécifique de son investissement dans Aflorithmic (alias ALFR) est un plan visant à combiner voix et vidéo synthétisées pour permettre aux fans de s’engager dans des chats vidéo « immersifs » présentant des versions simulées de leurs célébrités préférées.

LIRE  Webflow lève 140 millions de dollars, portant sa valorisation à 2,1 milliards de dollars

En prenant une participation dans la startup audio pour collaborer sur ce projet, cela peut réduire ce plan, a-t-il déclaré.

«ALFR apporte la technologie audio qui imite l’accent, le ton et les manières d’une célébrité comme si la célébrité était à l’autre bout d’une conversation», écrit Crowd Media, notant que «le contenu réel» adoucit la (future) célébrité clonée chuchotera à votre visage sera «alimenté par» sa technologie propriétaire de chatbot alimentée par l’IA – basée sur une base de connaissances de réponses construites à partir de la réponse à plus de 180 millions de questions soumises par les utilisateurs («en utilisant uniquement du texte»).

En convertissant tout ce texte en voix synthétisée apaisante, Aflorithmic entre en jeu. Alors que la vidéo du plan de célébrité cloné comprend l’imagerie 3D – avec la technologie fournie par trois autres sociétés de médias synthétiques (Forever Holdings basée au Royaume-Uni, créateurs humains numériques Zoe01 et Uneeq).

L’application vidéo Deepfake Reface vient de commencer à changer la culture du selfie

Plus généralement, Crowd Media a déclaré qu’il intégrera la technologie d’Aflorithmic dans d’autres de ses applications de commerce social, y compris son chatbot basé sur l’IA (CM8) – ciblant les cas d’utilisation du service client dans des secteurs tels que le marketing, l’éducation et la santé.

Pour sa part, Aflorithmic affirme utiliser le nouveau financement de la R&D pour son moteur de production audio API, le clonage de voix et l’acquisition de talents.

Il propose son service audio en tant que service basé sur une API à une gamme de clients, en notant des cas d’utilisation tels que « des newsletters et podcasts hyper-personnalisés » et le clonage de voix pour des applications marketing.

Il recommande également une bibliothèque vocale « étendue » permettant aux clients de choisir un haut-parleur robotique. Mais cela leur permet également d’enregistrer un extrait de leur propre voix pour créer un contenu audio personnalisé via l’IA de clonage de voix.

«Les utilisateurs peuvent composer des pièces de qualité professionnelle, y compris de la musique et une ingénierie audio complexe, puis livrer le produit final à n’importe quel appareil ou plate-forme, comme des sites Web, des applications mobiles ou des haut-parleurs intelligents, le tout sans aucune expérience de production préalable», écrit-il.

Timo Kunz, mede-oprichter en CEO van Aflorithmic, zei in een verklaring over de financiering: “We zijn verheugd om te leren van Crowd’s ervaring om bedrijven in staat te stellen massamarkten te bereiken, en zijn verheugd hen te begeleiden bij het bepalen van de futur. du commerce social. Nous pensons que la création audio telle que nous la connaissons cède la place à des expériences audio automatisées, évolutives et dynamiques – et des entreprises comme la nôtre sont à l’avant-garde. «

LIRE  La start-up SpaceTech ConstellR, qui peut suivre les températures de surface des terres, lève 1 million d'euros pour un tour de semences

«La production audio synthétique a une gamme apparemment infinie de fonctions – le potentiel des seules applications marketing est stupéfiant», a-t-il ajouté. «Imaginez Kim Kardashian en tant que personal shopper pour chacun de ses 200 millions d’abonnés, ou Lewis Hamilton expliquant pourquoi VOUS avez personnellement besoin du nouveau Pirelli P Zero Rosso. Tout cela est à portée de main grâce à notre technologie. «

Les deux autres co-fondateurs d’Alforithmic sont Peadar Coyle et Björn Ühss.

La revendication de la start-up de clonage de voix «éthique» met en évidence les défis inhérents à toutes les entreprises travaillant sur des outils commerciaux pour piloter la production de médias synthétisés.

Bien qu’être une célébrité clonée puisse sembler amusante, il existe un énorme potentiel d’abus et d’abus à travers le clonage de voix individuelles – du phishing et du vol d’identité à la manipulation émotionnelle et au chantage.

Dans une section éthique de son site Internet, Alforithmic fait un bref clin d’œil aux risques de «rendre l’audio personnalisé évolutif».

«Une grande innovation s’accompagne d’une grande responsabilité», écrit-il, ajoutant: «Nous nous engageons pour une IA éthique, juste et transparente en suivant les directives éthiques du Royaume-Uni et de l’Union européenne pour une intelligence artificielle digne de confiance. Les modèles et algorithmes de travail et de parole ne sont formés que sur et avec la pleine conformité et l’approbation du propriétaire individuel des données. »(Nous avons demandé plus de détails sur la façon dont se produit l’utilisation abusive de la technologie de clonage vocal.)

Sur le plan concurrentiel, la startup pointe vers Descript, qui a levé 30 millions de dollars le mois dernier – et a acquis une autre startup de clonage de votes, Lyrebird, en 2019 – bien que les outils couvrent à la fois la vidéo et l’audio, tandis qu’Alforithmic est plus concentré. automatisation. tout le processus de production audio.

Descript lève 30 millions de dollars pour créer la prochaine génération d’outils d’édition vidéo et audio

Lyrebird est un imitateur de voix pour l’ère des fausses nouvelles