Des scripts de détection de doublons que j'utilise pour ranger mon souk...
dotpercent-dirs.py | ||
dotpercent-files.py | ||
README | ||
unhide-dotpercent.py | ||
updatehash.py | ||
updatehash.sql |
Attention ! Lisez le code source des scripts avant de les utiliser ! Normalement aucun d'eux ne supprime de fichiers sans une forte confirmation, mais on ne sait jamais… Utilisation ----------- 1. Mettre à jour la base de donnée des hash (le script peut être interrompu avec `ctrl-C` et il reprendra là où il s'était arrêté, à quelques secondes près (au dernier message `commit!` en fait): updatehash.py ./documents-hash.db ./documents 2. Puis cacher les fichiers qui sont dans ./documents/vrac et qui ont une copie dans ./documents/tri (les deux ensembles de fichiers ne doivent pas se chevaucher): dotpercent-files.py ./documents-hash.db --vrac ./documents/vrac --tri ./documents/tri > "undo-dotpercent-files-$(date).sh" 3. Puis cacher automatiquement les dossiers qui ne contiennent que des fichiers dont le nom commence par `.%` (et aussi les dossiers vides). dotpercent-dirs.py ./documents/vrac > "undo-dotpercent-dirs-$(date).sh" 4. Ensuite déplacer à la main ce que vous voulez depuis `./documents/vrac` vers `./documents/tri` 5. Puis nettoyer les quelques fichiers et dossiers préfixés par `.%` qui ont pu être déplacés dans `./documents/tri`: unhide-dotpercent.py ./documents/tri > "undo-unhide-dotpercent-tri-$(date).sh" 6. Recommencer à l'étape 1 jusqu'à satisfaction. 7. Puis quand vous avez fini, ou que vous en aveez marre, vous pouvez ré-afficher les fichiers et dossiers préfixés par `.%` qui restent dans `./documents/vrac` unhide-dotpercent.py ./documents/vrac > "undo-unhide-dotpercent-vrac-$(date).sh"