Skip to content
Last updated

Plugin EAN Image Sourcing (EL)

English version | Versione italiana

Αυτή η σελίδα τεκμηριώνει το plugin Jersey ean-image-sourcing και την pipeline που εκτελεί.

Κύρια endpoints

  • POST /webrobot/api/ean-image-sourcing/{country}/upload (CSV upload)
  • POST /webrobot/api/ean-image-sourcing/{country}/execute
  • POST /webrobot/api/ean-image-sourcing/{country}/schedule
  • POST /webrobot/api/ean-image-sourcing/{country}/query (query του dataset)
  • POST /webrobot/api/ean-image-sourcing/{country}/images (εικόνες, προαιρετικό base64)
  • GET /webrobot/api/ean-image-sourcing/{country}/status
  • GET /webrobot/api/ean-image-sourcing/info

Stage-set που χρησιμοποιείται από την pipeline

Συνήθως:

  • load_csv
  • searchEngine
  • visit
  • iextract
  • imageSimilarity

CloudCredentials: provider + δυναμική injection

Απαιτούμενοι providers (auto-discovery αν δεν περαστούν ρητά):

  • GOOGLE_SEARCHGOOGLE_SEARCH_API_KEY, GOOGLE_SEARCH_ENGINE_ID
  • TOGETHERAITOGETHERAI_API_KEY
  • STEEL_DEVSTEEL_DEV_API_KEY

Τρόπος:

  • στο body μπορείτε να περάσετε cloudCredentialIds (λίστα) ή cloudCredentialId (legacy)
  • αν δεν υπάρχουν, το plugin αναζητά ενεργοποιημένες διαπιστευτήριες για provider (πρώτα org-specific, μετά global, μετά πρώτη διαθέσιμη)
  • κατά την υποβολή Spark, οι διαπιστευτήριες ενέχονται ως env σε driver/executor
  • αν τα πεδία είναι κρυπτογραφημένα, μπορείτε να περάσετε X-Encryption-Key στα headers του plugin

Λήψη dataset + εικόνων για training / fit

Το plugin EAN χρησιμοποιείται συχνά για τη δημιουργία dataset vision+text (catalog enrichment) που καταναλώνονται σε training/fit.

1) Λήψη γραμμών από το dataset (API)

Δεν υπάρχει ξεχωριστό endpoint “download file” μέσα στο plugin. Για λήψη δεδομένων χρησιμοποιήστε:

  • POST /webrobot/api/ean-image-sourcing/{country}/query

Είναι ο προτεινόμενος τρόπος για φιλτραρισμένα subsets (π.χ. λίστα EAN, εμπλουτισμένες στήλες, top-N).

2) Λήψη εικόνων (URL ή base64)

Χρησιμοποιήστε:

  • POST /webrobot/api/ean-image-sourcing/{country}/images

Key fields:

  • eans: λίστα EAN
  • limit: μέγιστες εικόνες ανά EAN
  • includeBase64: true για ενσωμάτωση base64 (χρήσιμο για training/fit χωρίς εξωτερικό fetch)

Παράδειγμα (1 καλύτερη εικόνα με base64 ανά EAN):

curl -X POST "${WEBROBOT_BASE_URL}/webrobot/api/ean-image-sourcing/italy/images" \
  -H "Content-Type: application/json" \
  -d '{
    "eans": ["5901234123457", "5901234123458"],
    "includeBase64": true,
    "limit": 1
  }'

3) Λήψη πλήρους dataset (storage path)

Για πλήρες dataset ως αρχείο χρησιμοποιήστε τα γενικά endpoints:

  • GET /webrobot/api/datasets
  • GET /webrobot/api/datasets/{datasetId} (επιστρέφει storagePath / filePath / format)

Έπειτα κατεβάστε από MinIO/S3 με υποδομικές διαπιστευτήριες.