Les données sont transférées dans et hors d'Emarsys dans un format de fichier séparé par des virgules (.csv). Afin de s'assurer que les bonnes valeurs arrivent dans les bons champs de la base de données, voici un aperçu des conventions que nous utilisons.
Étant donné que les fichiers de données de produits et les fichiers de données de ventes utilisés pour Predict et Smart Insight doivent suivre les conventions décrites ci-dessous, nous vous conseillons vivement de faire de même pour vos importations de données de contact régulières, ainsi que pour vos exportations, car il s'agit de normes sectorielles qui vous permettront aussi de profiter de notre fonction de validation des fichiers d'importation.
Introduction
Tous les fichiers de données entrants doivent être des fichiers .csv (valeurs séparées par des virgules), codés en UTF-8 Unicode.
Si vous utilisez Predict ou Smart Insight, vous voudrez peut-être aussi confirmer avec le support Emarsys que votre structure de données correspond aux exigences de votre configuration particulière, notamment en ce qui concerne les champs personnalisés.
La règle la plus importante pour le téléchargement des données est que le format de tous les fichiers téléchargés doit rester cohérent. Une fois qu'il a été convenu d'un format, il ne doit plus être modifié par la suite. Si c'est le cas, veuillez contacter le support Emarsys avant que les changements ne prennent effet.
Syntaxe CSV
Voici nos règles de base pour les fichiers .csv :
- Le délimiteur est toujours la virgule. (Le caractère de séparation des champs.)
- Les valeurs contenant des virgules peuvent être mises entre guillemets doubles.
- Aucun champ ne peut contenir de caractères de retour à la ligne (même s'ils sont entre guillemets).
- Les guillemets peuvent être échappés à l'intérieur des champs en les doublant :
""
. - La première ligne doit être la ligne de l'en-tête contenant les noms des champs ; les lignes suivantes contiennent les champs dans l'ordre défini dans l'en-tête.
- Les espaces vides redondants (au début et à la fin) sont automatiquement supprimés sauf s'ils sont entre guillemets (par ex.
1, 2, 3
est pareil à1,2,3
).
Sensibilité à la casse
Tenez compte du fait que les valeurs sont sensibles à la casse. Les identifiants example@address.com
et EXample@address.com
sont traités différemment.
Encodage
Afin de maximiser la prise en charge des langues étrangères et de garantir l'affichage correct du contenu, Emarsys insiste sur la norme de codage UTF-8.
Aucun caractère UTF-8 de 4 octets, tels que les emojis, n'est autorisé. L'inclusion de ces éléments pourrait empêcher l'importation des fichiers dans leur intégralité.
- Pour les flottants, vous devez toujours utiliser un point (.) comme séparateur décimal, même dans les pays qui utilisent un caractère différent tel que la virgule.
- Les fichiers importés doivent comporter un caractère de contrôle de nouvelle ligne dans les 265 premiers Ko. Cette mesure est nécessaire pour éviter le téléchargement accidentel de fichiers binaires. Le téléchargement de fichiers sans ce caractère entraînera une notification d'erreur et le fichier ne sera pas téléchargé.

Modifier l'encodage
La plupart des éditeurs de textes standard offrent la possibilité de modifier l'encodage de votre contenu ou vous permettent de sélectionner l'encodage d'un fichier lorsque vous l'enregistrez (par exemple dans le cadre de la boîte de dialogue Enregistrer sous).
Encodage de l'URL
Les URL (par exemple, dans le champ link
du catalogue produit) doivent être correctement codées URL, à l'exception des champs utilisés dans Predict, qui sont codés automatiquement et que vous ne devez donc pas coder. Les caractères tels que les espaces (`) ou les crochets (
[,
]`) ne doivent pas être présents dans ces valeurs.
Les URL doivent inclure le protocole, qui peut être http://
, https://
ou le protocole relatif //
.
Champs à valeurs multiples
Valeurs multiples dans le fichier de données de contact
Lorsque vous préparez un fichier CSV pour l'importation de données de contact, assurez-vous que chaque valeur d'un champ à choix multiples possède sa propre colonne.
L'en-tête de la colonne doit contenir le nom du champ et la valeur, séparés par deux points (:), comme dans : field_name:field_value
.
Par exemple, si vous avez un champ Interested_in
et les options Sports, Gaming, Film, Musique et Alimentation, votre fichier pourrait ressembler à ceci :
Pour chacune des colonnes de valeurs à choix multiples, utilisez soit le nom de la valeur (pour inclure cette valeur dans l'enregistrement de la base de données du contact), soit une valeur vide (pour omettre cette valeur pour le contact en question).
Valeurs multiples dans le fichier de données produit
Certains champs du catalogue produit, tels que author
, peuvent avoir plusieurs valeurs, qui doivent être séparées par le caractère barre verticale (|
), par exemple :
item, title, author BOOK0012, Best essays of 1908, Charles Dickens | Oscar Wilde | Douglas Adams
Valeurs multiples dans le fichier de données de vente
Smart Insight ne prend en charge les valeurs multiples que dans un seul champ : category
(voir ci-dessous).
Pour tous les autres champs, les valeurs multiples séparées par des barres verticales seront stockées par Smart Insight sous la forme d'une chaîne unique, par exemple : Charles Dickens|Oscar Wilde|Douglas Adams
.
Format de catégorie
Le chemin de la catégorie de produits est une série d'ensembles toujours plus affinés, qui décrivent le produit. Par exemple, Le Guide du voyageur galactique pourrait être classé comme Literature > Fiction > Sci-Fi
. Notez que les éléments du chemin de la catégorie sont séparés par le caractère >
dans le fichier du catalogue produit. Dans une librairie, tous les produits se trouveraient dans la catégorie Literature
. S'il existe une catégorie qui comprend tous les articles, nous l'appelons la catégorie racine. Le champ category
ne doit pas inclure la racine.
Certains articles peuvent appartenir à plusieurs catégories. Par exemple, Le Guide du voyageur galactique pourrait également être classé dans Literature > British literature > Contemporary
. Les catégories multiples doivent être séparées par la barre verticale, |
.
Dans cet exemple, la valeur correcte pour le champ catalog
serait la suivante :
Fiction > Sci-Fi | British literature > Contemporary
Il n'y a pas de limite au nombre de hiérarchies de catégories dans Predict, mais Smart Insight, qui utilise également le catalogue produit, n'accepte que les cinq premiers niveaux et ignore le reste. Pour plus de détails sur la gestion des catégories dans Predict, voir Catégories de produits.
Vous trouverez quelques exemples ci-dessous. Seules les catégories marquées en gras seraient disponibles dans Smart Insight (c'est-à-dire les cinq premières catégories), tandis que les autres catégories ne seraient pas disponibles dans Smart Insight.
Par exemple, le café instantané aromatisé au chocolat apparaîtrait dans la même catégorie que le café instantané ordinaire dans Smart Insight. Cependant, Predict prendrait en compte les différences lors du calcul des recommandations.
Format de la date
Lorsque vous utilisez des champs de date, les formats suivants sont pris en charge par Emarsys pour l'importation et l'exportation de données :
Format de la date | Type de données |
---|---|
AAAA-MM-JJ | Données sur les contacts, les ventes et les produits. |
Horodatage (Timestamp)
Lorsque vous utilisez un champ d'horodatage, par exemple pour identifier des achats individuels, vous devez utiliser le format UTC suivant :
- AAAA-MM-JJTHH:MM:SSZ
Mise entre guillemets
Si les données elles-mêmes contiennent le caractère séparateur, vous devez indiquer au mécanisme d'importation que ceci fait partie de la valeur du champ et qu'il ne doit pas l'interpréter comme une consigne de démarrage d'une nouvelle ligne de données. Pour ce faire, vous devez mettre toute la valeur du champ entre guillemets doubles. Dans l'exemple ci-dessous, le séparateur apparaît dans le texte de la deuxième valeur du champ. Par conséquent, lorsque ce champ est importé, la valeur entière est placée entre guillemets.
Valeur dans la base de données | Valeur en CSV | Commentaires |
---|---|---|
Notebooks | ,Notebook computers, | Les guillemets ne sont pas nécessaires. |
Ordinateurs portables, notebooks | ,"Laptops, notebooks", | Les guillemets sont nécessaires. |
Échappement
Comme pour le caractère séparateur, si le texte importé contient le caractère guillemet, il faut également l'indiquer au mécanisme d'importation, cette fois en l'échappant. L'échappement se fait en ajoutant un autre caractère de guillemet au caractère existant et en mettant la valeur entière entre guillemets. Dans le premier exemple ci-dessous, le caractère guillemet est utilisé dans le texte comme abréviation de la mesure "pouce". Dans le deuxième exemple, les guillemets sont utilisés comme échappement du symbole des pouces, mais aussi pour indiquer que la valeur comprend également le séparateur :
Valeur dans la base de données | Valeur en CSV | Commentaires |
---|---|---|
21 moniteurs | ,"21"" monitors", | Le guillemet a été échappé. |
21 moniteurs, écrans plats | ,"21"" monitors, flat screens", | Des guillemets et des séparateurs sont utilisés. |
Remarque : Le séparateur et les guillemets peuvent être personnalisés, mais dans chaque cas, le caractère utilisé doit être choisi avec soin.
Valeurs vides
Les champs sans valeur doivent toujours être exportés sous la forme d'une valeur vide sans aucun guillemet, afin que la structure des données ne soit pas affectée.
Exemple
Valeur dans la base de données | Valeur en CSV | Commentaires |
---|---|---|
NULL | ,, | L'importation reconnaît un champ vide. |
Exemples de fichiers
Vous trouverez ci-dessous des fichiers d'exemple contenant une sélection de champs courrants que vous pouvez télécharger et adapter à votre propre usage :
Modification des fichiers CSV en cours d'utilisation
Modifier la structure d'un fichier CSV utilisé dans un environnement de travail est toujours une tâche complexe qui demande beaucoup d'attention. La modification des colonnes dans les fichiers CSV de contact, de produits ou de vente peut facilement entraîner la corruption ou la perte de données.
La meilleure pratique et le choix le plus sûr consistent à préparer et à effectuer un rechargement complet des données.
Si vous tentez de modifier la structure des colonnes d'un fichier CSV en cours d'utilisation sans le recharger complètement, gardez les points suivants à l'esprit :
- La suppression et l'ajout de colonnes sont les seules actions valides.
- La suppression d'une colonne entraîne des pertes de données et l'ajout de données dans une nouvelle colonne peut entraîner la disparition de données antérieures. La suppression et l'ajout de données peuvent tous deux nuire à la qualité des données.
Les actions suivantes entraîneront une perte de données :
- changer le nom d'une colonne existante
- modifier l'ordre des colonnes existantes
- ajouter une nouvelle colonne avant ou entre les colonnes existantes
- suppression de colonnes existantes
Vous pouvez ajouter des colonnes à vos fichiers CSV à la fin sans rechargement complet et sans corruption des données. Consultez Ajouter des colonnes à un fichier de données de vente fonctionnel.
S'il est vrai qu'il n'y a pas de perte de données si des colonnes supplémentaires sont ajoutées après la dernière colonne existante, les données ne seront pas rétro-remplies dans les nouvelles colonnes pour les données de ventes antérieures déjà téléchargées. Les nouvelles colonnes commenceront à enregistrer des données dès le lendemain de leur création.