Exporter vers ADLS à l’aide de Python
- Dernière mise à jour
- Enregistrer en tant que PDF
Aperçu
Ce guide fournit des instructions détaillées pour la configuration et l’utilisation du package d’intégration Delta Sharing sur un système d’exploitation Windows afin d’intégrer de manière transparente les données dans vos flux de travail avec Procore Analytics. Le package prend en charge plusieurs options d’exécution, ce qui vous permet de choisir la configuration et la méthode d’intégration souhaitées.
Conditions préalables
Assurez-vous d’avoir les éléments suivants avant de continuer :
- Référence SKU Analytique Procore 2.0
- Delta Sharing pofile fichier :
Obtenez votre fichier *.share contenant les informations d’identification Delta Sharing. Pour plus de commodité, copiez-le dans le répertoire du paquet. - Environnement Python : Installez Python 3 et pip sur votre système.
- Téléchargez Python.
- Vous pouvez également utiliser le Microsoft Store.
Étapes
- Préparer le colis
- Installer les dépendances
- Générer la configuration
- Configurer les tâches cron et l’exécution immédiate
- Exécution et maintenance
Préparer le colis
- Créez un nouveau fichier nommé config.share avec vos informations d’identification Delta Share au format JSON.
{
« shareCredentialsVersion » : 1,
« bearerToken » : « xxxxxxxxxxxxx »,
« endpoint » : « https://nvirginia.nuage. databricks.c... astores/xxxxxx"
}
- Obtenir les champs obligatoires.
Remarque : Ces détails peuvent être obtenus à partir de l’application Web Procore Analytics.- ShareCredentialsVersion : numéro de version (actuellement 1).
- BearerToken : votre jeton d’accès Delta Share.
- Point de terminaison : URL de votre point de terminaison Delta Share.
- Téléchargez et extrayez le package.
- Décompressez le paquet dans un répertoire de votre choix.
- Copiez le fichier de profil *.share Delta Sharing dans le répertoire du package pour y accéder facilement.
Installer les dépendances
- Ouvrez un terminal dans le répertoire des paquets.
- Exécutez la commande suivante pour installer les dépendances :
- pip install -r requirements.txt
Générer la configuration
- Générez le fichier config.yaml en exécutant python user_exp.py:
Ce script permet de générer le fichier config.yaml qui contient les informations d’identification et les paramètres nécessaires. - Lors de la configuration de la source de données, il vous sera demandé de fournir les informations suivantes :
- Liste des tableaux (séparés par des virgules).
- Laisser en blanc pour synchroniser tous les tableaux.
Exemple : 'table1, table2, table3'. - Chemin d’accès à votre fichier « config.share » fichier.
- Pour la première fois, vous fournirez vos informations d’identification telles que l’emplacement de configuration de la source Delta Share, les tables, la base de données, l’hôte, etc.
Remarque : Par la suite, vous pouvez réutiliser ou mettre à jour la configuration manuellement ou par l’user_exp.py python en cours d’exécution.
Configurer les tâches cron et l’exécution immédiate (facultatif)
- Décidez s’il faut configurer une tâche cron pour l’exécution automatique.
- Fournissez un échéancier cron :
- Format : * * * * * (minute, heure, jour du mois, mois, jour de la semaine).
- Exemple d’exécution quotidienne à 2 heures du matin : 0 2 * * *
- Pour vérifier les journaux de planification, le fichier 'procore_scheduling.log' sera créé dès que la planification est configurée.
Vous pouvez également vérifier la planification en exécutant la commande du terminal :
Pour Linux et MacOS :
Pour modifier/supprimer - modifiez le cron de l’échéancier en utilisant :
'''bash
EDITOR=nano crontab -e
```
- Après avoir exécuté la commande ci-dessus, vous devriez voir quelque chose de similaire à :
- 2 * * * * /users/your_user/snowflake/venv/bin/python /users/your_user/snowflake/sql_server_python/connection_config.py 2>&1 | while ligne lue ; do echo « $(date) - $line » ; done >> /Users/your_user/snowflake/sql_server_python/procore_scheduling.log # procore-data-import
- Vous pouvez également ajuster le cron de l’échéancier ou supprimer la ligne entière pour l’empêcher de fonctionner selon l’échéancier.
Pour Windows :
- Vérifiez que la tâche de l’échéancier est créée :
'''Powershell
schtasks /query /tn « ProcoreDeltaShareScheduling » /fo LIST /v
``` - Pour modifier/supprimer - tâche d’échéancier :
Ouvrez le planificateur de tâches :- Appuyez sur Win + R, tapez taskschd.msc, et appuyez sur Entrée.
- Accédez aux tâches planifiées.
- Dans le volet gauche, développez la bibliothèque du planificateur de tâches.
- Recherchez le dossier dans lequel votre tâche est enregistrée (par exemple, la bibliothèque du planificateur de tâches ou un dossier personnalisé).
- Trouvez votre tâche :
- Recherchez le nom de la tâche ProcoreDeltaShareScheduling.
- Cliquez dessus pour afficher ses détails dans le volet inférieur.
- Vérifiez son échéancier :
- Vérifiez l’onglet Déclencheurs pour voir quand la tâche est définie pour s’exécuter.
- Consultez l’onglet Historique pour confirmer les exécutions récentes.
- Pour supprimer la tâche :
- Supprimer la tâche de l’interface graphique.
Question relative à l’exécution immédiate :
- Possibilité d’exécuter un script pour copier les données immédiatement après la configuration.
- Après avoir généré le fichier config.yaml, l’interface de ligne de commande est prête à être exécutée à tout moment indépendamment, en exécutant un script pour copier les données, en fonction de votre package. Voir des exemples ci-dessous :
python delta_share_to_azure_panda.py
OU
python delta_share_to_sql_spark.py
OU
python delta_share_to_azure_dfs_spark.py
Exécution et maintenance
Problèmes courants et solutions
- Configuration de la tâche Cron :
- Assurez-vous que les permissions système sont correctement configurées.
- Vérifiez les journaux système si la tâche échoue à s’exécuter.
- Vérifiez que le script delta_share_to_azure_panda.py dispose des autorisations d’exécution.
- Fichier de configuration :
- Assurez-vous que le fichier config.yaml se trouve dans le même répertoire que le script.
- Sauvegardez le fichier avant d’apporter des modifications.
Soutien
Pour obtenir de l’aide supplémentaire :
- Consultez les journaux de script pour obtenir des messages d’erreur détaillés.
- Vérifiez que le fichier config.yaml ne contient pas d’erreurs de configuration.
- Contactez votre administrateur système pour les problèmes liés aux permissions.
- Contactez le support Procore pour les problèmes liés à l’accès à Delta Share.
- Examiner le journal pour les tables ayant échoué : failed_tables.log.
Remarques
- Sauvegardez toujours vos fichiers de configuration avant d’apporter des modifications.
- Testez de nouvelles configurations dans un environnement hors production pour éviter les interruptions.