Analysez des données

  • 状态 关闭的
  • 预算 €250 - €750 EUR
  • 总竞标 4

项目描述

Bonjour,

Je cherche a réaliser un site comparateur d'un type produit en particulier;

J'ai scrappé un certain nombre de sites internet pour alimenter mon data feed et ainsi atteindre un bon millier de produits à comparer via une vingtaine de sites.

La problématique que je rencontre aujourd'hui est la suivante : je ne dispose ni de moyen de reconnaissance ni d'analyse syntaxique automatique pour regrouper un même produit et ainsi comparer les différents prix.

J'ai bien essayer de nettoyer mes données avec Google Refine mais le travail est long et fastidieux.

Je recherche donc une solution automatique et évolutive pour assigner un ID unique pour chaque produit identique.

La solution devra, suivant une marge d'erreur durant la reconnaissance, ajouter le produit dans une "liste d'attente" pour une validation manuelle.

Elle peut fonctionner sous Talend Open Studio ou autre.

Merci d'avance pour vos propositions

Cordialement

获得类似项目的报价
要求的技能

想赚钱吗?

  • 设置你的预算和期限
  • 列出你的提案
  • 获得工资

雇用同样在该项目上竞标的威客

    • Forbes
    • The New York Times
    • Time
    • Wall Street Journal
    • Times Online