Analysez des données

已关闭 已发布的 7 年前 货到付款
已关闭 货到付款

Bonjour,

Je cherche a réaliser un site comparateur d'un type produit en particulier;

J'ai scrappé un certain nombre de sites internet pour alimenter mon data feed et ainsi atteindre un bon millier de produits à comparer via une vingtaine de sites.

La problématique que je rencontre aujourd'hui est la suivante : je ne dispose ni de moyen de reconnaissance ni d'analyse syntaxique automatique pour regrouper un même produit et ainsi comparer les différents prix.

J'ai bien essayer de nettoyer mes données avec Google Refine mais le travail est long et fastidieux.

Je recherche donc une solution automatique et évolutive pour assigner un ID unique pour chaque produit identique.

La solution devra, suivant une marge d'erreur durant la reconnaissance, ajouter le produit dans une "liste d'attente" pour une validation manuelle.

Elle peut fonctionner sous Talend Open Studio ou autre.

Merci d'avance pour vos propositions

Cordialement

数据处理

项目ID: #11771186

关于项目

3个方案 远程项目 活跃的7 年前

有3名威客正在参与此工作的竞标,均价€545/小时

WebDevPro007

Bonjour Monsieur J'ai 7 ans d'expérience sur le traitement de données. Nous avons une licence Talend, Qlikview et SAP Business Objects. Le problème que vous posé est très fréquent lorsqu'on a à faire aux données 更多

€555 EUR 在10天内
(0条评论)
0.0
zlmembre

Bonjour ; J'ai lu votre projet et j'avoue qu'il n'est pas facile à réaliser. La bonne nouvelle est qu'il est réalisable... j'ai déjà fait des scripts semblables (qui extraient par exemple des offres du site leboncoi 更多

€555 EUR 在10天内
(0条评论)
0.0