Créer de la valeur sur des données non structurées

Dans le secteur du e-commerce, la gestion efficace des données est cruciale pour offrir permettre aux équipes marketing de gérer et optimiser leurs processus métier.

Classifier, enrichir, corriger... Tels sont les tâches quotidiennes des équipes data. Des tâches récurrentes mais essentielles pour valoriser un catalogue.

Nos équipes ont cherché à mettre en place des processus automatisés afin de recentrer les équipes métier sur l’analyse et l’optimisation de leurs business.

C’est dans ce contexte que Langchain, un framework permettant d’orchestrer des modèles de langage, peut jouer un rôle en facilitant ces processus tout en optimisant les coûts et les performances grâce à des solutions hybrides, mêlant infrastructure on-premise et services cloud comme OpenAI.

Cas d’usage : Enrichissement de données brutes issues de ventes aux enchères

FTPROD a mis en place une solution utilisant Langchain pour optimiser plusieurs la non structurée de catalogue de produits :

1.        Classification automatisée des produits

Langchain nous a permis de combiner des modèles de langage avancés avec nos algorithmes propriétaires pour automatiser la classification des produits. Grâce à l’analyse des descriptions et caractéristiques, les produits sont correctement catégorisés dans notre catalogue, réduisant ainsi le besoin d’intervention manuelle et augmentant la cohérence des données sur l’ensemble de la plateforme.

2.        Enrichissement des descriptions produits

En utilisant les capacités de génération de texte d’OpenAI via Langchain, nous avons enrichi automatiquement les descriptions produits avec des détails supplémentaires, comme les caractéristiques techniques, des recommandations d’usage ou encore des produits complémentaires.

3.        Recherche optimisée par synonymes et mots-clés

Pour améliorer l’expérience de recherche, nous utilisons Langchain pour enrichir notre moteur de recherche. En se connectant à des modèles génératifs via des API, la solution comprend mieux les variations de termes employés par les utilisateurs. Par exemple, un client cherchant “ordinateur portable léger” trouvera les résultats pertinents, même si les produits sont classés sous “ultrabook”. Cette approche a amélioré la pertinence et l’efficacité des recherches.

4.        Approche hybride pour l’optimisation des coûts

Afin de maximiser l’efficacité tout en réduisant les coûts, nous avons adopté une infrastructure hybride :

                 • Les tâches intensives comme la classification des produits sont traitées localement sur nos serveurs on-premise, garantissant des coûts contrôlés et des performances constantes.

                 • Les processus nécessitant une puissance de calcul plus élevée, tels que l’enrichissement des descriptions via OpenAI, sont exécutés dans le cloud. Langchain gère l’orchestration entre ces deux environnements, assurant un équilibre optimal entre coûts et performances.

On pense à demain

CHez ftprod on a mis Une petite charte RSE en place mais on la respecte !

Pas facile de tout faire (surtout dans la tour CIT), mais on a mis collégialement  5 règles à respecter dans les bureaux.