Fabriquer des textes à partir de vos données : combien ça coûte ?

Olivier Mégeanpar Olivier Mégean

Beaucoup de sites e-commerce, de banques ou de médias produisent automatiquement des textes à partir de leur données. Combien ça coûte ?

Data is pain (en général)

Le point de départ incontournable est le jeu de données à partir duquel vous allez produire vos textes. Comme pour toutes les solutions d’intelligence artificielle, les automates de génération de textes nécessitent un solide jeu de données.

Qu’ils s’agisse de données météo, financières, sportives, politiques, immobilières ou bien de vos fiches produits, il est impératif de disposer de données propres pour générer efficacement des textes. Par données propres, il faut comprendre un jeu de données complet et correctement structuré. Il faut évidemment disposer d’un droit d’utilisation des données dans le respect du RGPD.

Reconnaissons qu’il est toujours possible de traiter des cas de figure atypiques dans le cadre du paramétrage (si la donnée est manquante par exemple); mais il faut considérer que ce type “d’anomalies” va alourdir le code et contribuer à créer au fil du temps une sorte de fouillis inextricable qu’il faut éviter à tout prix.

En conclusion, il faut privilégier une approche maîtrisée de la donnée (et donc de l’ambition) afin de disposer d’un outil stable, fiable et efficace de génération de textes.

Dans ce domaine, comme dans beaucoup d’autres, l’approche itérative est de rigueur.

La création des textes doit également être abordée sous l’angle du pragmatisme. Le but est générer une information factuelle, fiable et efficace afin de couvrir des territoires d’expression vastes pour lesquels une donnée est disponible et utilisable.

Un professionnel du data-journalisme ou du marketing doit contribuer à l’élaboration des structures de texte qui seront utilisées par la machine. Cet exercice intellectuel nécessite une compréhension de la logique du code et une connaissance des formes de narration spécifiques à la data-écriture.

Il faut privilégier des textes simples avec des variantes de format.

Vient ensuite le paramétrage d’un espace cloud qui servira à manipuler la donnée et à distribuer les textes produits sur une plateforme SaaS spécialisée.

Il existe plusieurs plateformes très efficaces de génération de textes.

Tout ceci est très intéressant mais … combien ça coûte ?

Prenons l’exemple de la génération de 10 articles par jour, d’une longueur moyenne de 150 mots (une demi-page), tous les jours de l’année pendant trois ans. Il s’agit donc de produire 10 800 articles pour un total de plus de 1 600 000 mots.

Vous allez devoir supporter des coûts de set-up puis des coûts d’exploitation. Le budget de set-up vous coûtera, en fonction de la complexité de votre projet, de quelques milliers à quelques dizaines de milliers d’euros.

Dans notre exemple, le coût total d’exploitation par article sera d’environ à 1,6 euros (environ 1 centime par mot).

Un projet tel que celui-ci sera mené en plus ou moins 8 semaines pour peu que vous disposiez des données….

Les applications sont innombrables : asset management, e-commerce, médias, contrôle de gestion, banque, assurance, immobilier, compte-rendus de visite, bilan d’activité…. autant de candidats à ces technologies.

Si vous souhaitez en savoir plus, vous pouvez contacter demain.ai : hello@demain.ai ou suivre ce lien : découvrez l’offre de demain.ai dans la génération automatique de textes

NEWSLETTER

Votre briefing sur les tendances principales, menaces et opportunités, ainsi que les outils de l’intelligence artificielle.

VOIR LA DERNIÈRE NEWSLETTER »

Intégrez l’intelligence artificielle dans votre entreprise

demain.ai offre une gamme de services permettant à toutes les entreprises de saisir les opportunités business de l’IA.

Séminaires de formation, diagnostic IA des données, identification et analyse de cas d’usages, réalisation concrète d’un P.O.C., mise en production, nos équipes peuvent vous accompagner dans chacune des étapes de l’intégration concrète de l’intelligence artificielle.

L'EQUIPE DEMAIN.AI »