
Mon histoire avec le Text Mining
Avant de connaître le Text Mining, je ne connaissais pas la Data Science. Ce domaine m’a donné envie de devenir Data Scientist. Mon histoire avec le Text Mining a débuté à mon stage de fin d’étude d’ingénieur informatique. En qualité d’ingénieur d’assurance qualité logicielle, j’avais pour mission de développer un système de test fonctionnel de l’outil de veille stratégique commercialisé par mon entreprise d’accueil. Ce test doit couvrir toutes les fonctionnalités de l’outil, notamment les plus nouvelles, et rendre un rapport détaillé sur les erreurs ou les bugs qui peuvent survenir.
Avec le temps, j’ai appris que pour faire de la veille stratégique sur un sujet donné, il est d’abord nécessaire de disposer d’une large collection de documents (des articles de blogs, des publications sur les réseaux sociaux, des commentaires sur les forums, etc.) et ensuite, d’utiliser des techniques d’analyse de texte pour synthétiser en grandes thématiques toute l’information contenue dans ces documents. A ce moment-là, j’ai compris l’importance d’exploitation et d’analyse de données textuelles. Il y a presque de l’or qui se cache derrière ces milliers de lignes qui n’attend qu’à être miner. Ce n’est pas pour rien que l’on appelle Text Mining. Ainsi, ce domaine vise à extraire de la connaissance et de la valeur à partir de données textuelles brutes que l’on peut trouver abondamment sur internet.
Entre devenir ingénieur logiciel ou poursuivre dans la Data Science, j’ai pris le pari de la deuxième option en poursuivant mes études en Master. Un pari qui s’avère gagnant car ce domaine est en plein essor ces dernières années. A ceux qui me demandent pourquoi j’ai fait deux Masters, en voici la réponse et toute l’histoire derrière.
Mon expérience dans le Text Mining
Ma première expérience en Data Science était, vous l’avez compris, dans le Text Mining. J’ai commencé ma carrière dans une agence de publicité d’un grand groupe. Au côté des créatifs et des publicitaires talentueux, nous essayions tous les jours de mieux comprendre l’univers des consommateurs et des marques pour leur proposer des campagnes de publicité à chaque fois amusantes, décalées et surtout adaptées à leur besoin. Éric, Sid, Matthieu (alias LLLLITL), Eva, Chloé et bien d’autres, j’ai adoré travailler avec vous.
Avec l’expansion continue de l’univers digital, le texte est devenu une source formidable pour comprendre ce que pensent les consommateurs sur une marque ou un produit particulier. Il est non seulement la façon la plus naturelle d’encoder le savoir humain mais aussi la forme la plus expressive que peut avoir l’information. Dans ce contexte, le travail de Data Scientist consiste à s’approprier la problématique métier et à s’appuyer sur son bagage technique pour apporter des réponses aux questions qui peuvent se poser à ce sujet. En voici quelques exemples :
– Que dit le consommateur sur les réseaux sociaux ? Quelles sont les thématiques les plus importantes ?
– Quelle est la polarité des conversations ? Le consommateur porte-t-il un avis positif ou négatif sur le sujet ? Quels sont les points de frictions ?
– Le consommateur parle-t-il d’une marque concurrente ? Quelle est la part des conversations positives par marque ? Quelles sont les thématiques abordées par marque ?
– A quel moment le consommateur en parle-t-il ? C’est un avis spontané ou bien est-t-il influencé par un événement donné (par exemple, une campagne publicitaire, un challenge sur les réseaux sociaux ou encore le lancement d’un nouveau produit) ?
– L’opinion du consommateur évolue-t-elle dans le temps ? Quelles sont les thématiques en tendance ?
Parfois le texte tout seul ne suffit pas à répondre à toutes les questions. On est amené à le croiser avec d’autres sources de données. Connaître l’opinion des consommateurs c’est bien, l’associer à un profil socio-démographique ou une zone géographique l’est encore plus. Le Text Mining, que l’on appelle parfois Text Data Mining peut être conjointement utilisé avec des analyses de données structurées ou encore du Data Mining. Attendez nos prochains articles qui traiteront bientôt de ce sujet en détail…
