English version | Versione italiana
Αυτή η σελίδα τεκμηριώνει το plugin Jersey ean-image-sourcing και την pipeline που εκτελεί.
POST /webrobot/api/ean-image-sourcing/{country}/upload(CSV upload)POST /webrobot/api/ean-image-sourcing/{country}/executePOST /webrobot/api/ean-image-sourcing/{country}/schedulePOST /webrobot/api/ean-image-sourcing/{country}/query(query του dataset)POST /webrobot/api/ean-image-sourcing/{country}/images(εικόνες, προαιρετικό base64)GET /webrobot/api/ean-image-sourcing/{country}/statusGET /webrobot/api/ean-image-sourcing/info
Συνήθως:
load_csvsearchEnginevisitiextractimageSimilarity
Απαιτούμενοι providers (auto-discovery αν δεν περαστούν ρητά):
GOOGLE_SEARCH→GOOGLE_SEARCH_API_KEY,GOOGLE_SEARCH_ENGINE_IDTOGETHERAI→TOGETHERAI_API_KEYSTEEL_DEV→STEEL_DEV_API_KEY
Τρόπος:
- στο body μπορείτε να περάσετε
cloudCredentialIds(λίστα) ήcloudCredentialId(legacy) - αν δεν υπάρχουν, το plugin αναζητά ενεργοποιημένες διαπιστευτήριες για provider (πρώτα org-specific, μετά global, μετά πρώτη διαθέσιμη)
- κατά την υποβολή Spark, οι διαπιστευτήριες ενέχονται ως env σε driver/executor
- αν τα πεδία είναι κρυπτογραφημένα, μπορείτε να περάσετε
X-Encryption-Keyστα headers του plugin
Το plugin EAN χρησιμοποιείται συχνά για τη δημιουργία dataset vision+text (catalog enrichment) που καταναλώνονται σε training/fit.
Δεν υπάρχει ξεχωριστό endpoint “download file” μέσα στο plugin. Για λήψη δεδομένων χρησιμοποιήστε:
POST /webrobot/api/ean-image-sourcing/{country}/query
Είναι ο προτεινόμενος τρόπος για φιλτραρισμένα subsets (π.χ. λίστα EAN, εμπλουτισμένες στήλες, top-N).
Χρησιμοποιήστε:
POST /webrobot/api/ean-image-sourcing/{country}/images
Key fields:
eans: λίστα EANlimit: μέγιστες εικόνες ανά EANincludeBase64:trueγια ενσωμάτωση base64 (χρήσιμο για training/fit χωρίς εξωτερικό fetch)
Παράδειγμα (1 καλύτερη εικόνα με base64 ανά EAN):
curl -X POST "${WEBROBOT_BASE_URL}/webrobot/api/ean-image-sourcing/italy/images" \
-H "Content-Type: application/json" \
-d '{
"eans": ["5901234123457", "5901234123458"],
"includeBase64": true,
"limit": 1
}'Για πλήρες dataset ως αρχείο χρησιμοποιήστε τα γενικά endpoints:
GET /webrobot/api/datasetsGET /webrobot/api/datasets/{datasetId}(επιστρέφειstoragePath/filePath/format)
Έπειτα κατεβάστε από MinIO/S3 με υποδομικές διαπιστευτήριες.