You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Les mots clés soumis par les utilisateurs dans le moteur de recherche de la communauté dépassent souvent le seul cadre des QR des forums publics. L'objectif est d'identifier la soumission de termes connus pour suggérer des renvois vers d'autres produits du GIP.
Par exemple : croix rouge marseille, mulhouse, MSA Sud Champagne, eureka montfort sur meu ou Association initiative éco
Les types d'entités nommées à identifier sont :
les organisations : Croix Rouge, MSA, Les jardins de Noemie
les villes, codes postaux, départements
les accronymes de l'insertion : PMSMP, CDDI, ASP, PASS IAE (abbréviations et nom complet)
les métiers : jardinier, agent d'accuel
Les sources de données sont :
api data insertion
les emplois
le glossaire de la commu
Un outillage candidat est spacy pour la reconnaissance d'entités nommées.
Out of the box, le modele fr_core_news_sm rend :
>>> doc=nlp('marseille')
>>> [(ent.text, ent.label_) for ent in doc.ents]
[('marseille', 'LOC')]
>>> doc=nlp('croix rouge marseille')
>>> [(ent.text, ent.label_) for ent in doc.ents]
[('croix rouge marseille', 'ORG')]
Après reentrainement, l'objectif est d'obtenir
>>> doc=nlp('marseille')
>>> [(ent.text, ent.label_) for ent in doc.ents]
[('marseille', 'LOC')]
>>> doc=nlp('croix rouge marseille')
>>> [(ent.text, ent.label_) for ent in doc.ents]
[('croix rouge', 'ORG', 'marseille', LOC')]
The text was updated successfully, but these errors were encountered:
Les mots clés soumis par les utilisateurs dans le moteur de recherche de la communauté dépassent souvent le seul cadre des QR des forums publics. L'objectif est d'identifier la soumission de termes connus pour suggérer des renvois vers d'autres produits du GIP.
Par exemple :
croix rouge marseille
,mulhouse
,MSA Sud Champagne
,eureka montfort sur meu
ouAssociation initiative éco
Les types d'entités nommées à identifier sont :
Les sources de données sont :
Un outillage candidat est
spacy
pour la reconnaissance d'entités nommées.Out of the box, le modele
fr_core_news_sm
rend :Après reentrainement, l'objectif est d'obtenir
The text was updated successfully, but these errors were encountered: