Méthodologie
Les différents traitements ont été réalisés dans Power Query. Une fois les données nettoyées et triées au niveau des compilations mensuelles, celles-ci sont ensuite compilées dans le bilan annuel. Ce qui permet limiter les jeux de données et les connexions dans Power Bi.
Retenir les colonnes pertinentes
Dans le premier filtre, les codes 01 (Transvoirie) et 04 (Metawaste) dans la colonne [TIERS_A_FACTURER] correspondent aux dépôts Sogetri et sont filtrés pour éviter des doublons. Dans le second, ce sont les lignes qui ne correspondent pas aux unités m3 et T qui sont supprimées.
Cette initiative n’est qu’une étape de plus dans notre parcours vers une amélioration continue. En ouvrant nos données, nous favorisons la transparence, mais nous affirmons aussi notre volonté de progresser, de manière mesurable, vers des pratiques plus durables et une meilleure optimisation des ressources. Nous croyons fermement que la technologie et l’analyse des données sont des leviers puissants pour un avenir plus propre et plus respectueux de l’environnement.
Harmoniser les données entre les séries
Avant de pouvoir combiner nos différents jeux de données sur a base d’attributs commun, il était nécessaire d’harmoniser ces derniers pour le faire correspondre.
Certaines données des codes produit et prestation ayant été entrées dans FACTLIG avec des « 0 » supplémentaires, il a fallu les supprimer. Convertir la colonne en nombre entier a permis de régler ce problème. Dans une deuxième phase, les variables Site_Code et tiers_code de l’extraction SITE ont dû être harmonisée et rendues unique afin d’éviter les doublons et confusions (ex : entre les codes « 1 » et « 01 »). Ce qui a nécessité les deux opérations suivantes.
La première opération consiste en l’ajout de « 0 » dans un ensemble de 8 caractères pour les données Site_Code dont la longueur est égale ou supérieur à 6 caractères. Les valeurs sont ensuite concaténées avec le Tiers_Code pour créer un identifiant unique. Ce dernier permettra de géoréférencer les différents lieux de collecte des déchets en ajoutant par la suite les coordonnées géographique et les codes postaux.
Conversion des unités
Etant donné les grandes étendues des variations pouvant survenir dans les masses volumiques des déchets, les coefficients de conversion suivants ont été estimés sur la base de valeurs moyennes trouvées dans la littérature scientifique.
| Matériaux | Coeff.M3/T |
|---|---|
| Biocarburants | 0.883 |
| Bois | 0.5 |
| Organiques (Huiles/Lavures) | 0.917 |
| Organiques (Fumier/Compost) | 0.5 |
| Inertes | 0.991 |
| Déchets Mélangés | 0.528 |
| Papier Carton | 0.3 |
Sources : Lu, W., Yuan, L., & Xue, F. (2021). Investigating the bulk density of construction waste: A big data-driven approach. Resources, Conservation and Recycling, 169, Huile d'olive LIGNOCELLULOSIQUES, R. (2007). ECOLE DOCTORALE Science–Technique–Santé Faculté des Sciences et Techniques (Doctoral dissertation, Université de Limoges)
Les données inscrites sous forme de m3 ont ensuite été multipliées par le coefficient pour obtenir la masse en T.