2010-detection-doublons/README

31 lines
1.5 KiB
Plaintext

Attention !
Lisez le code source des scripts avant de les utiliser ! Normalement aucun d'eux ne supprime de fichiers sans une forte confirmation, mais on ne sait jamais…
Utilisation
-----------
1. Mettre à jour la base de donnée des hash (le script peut être interrompu avec `ctrl-C` et il reprendra là où il s'était arrêté, à quelques secondes près (au dernier message `commit!` en fait):
updatehash.py ./documents-hash.db ./documents
2. Puis cacher les fichiers qui sont dans ./documents/vrac et qui ont une copie dans ./documents/tri (les deux ensembles de fichiers ne doivent pas se chevaucher):
dotpercent-files.py ./documents-hash.db --vrac ./documents/vrac --tri ./documents/tri > "undo-dotpercent-files-$(date).sh"
3. Puis cacher automatiquement les dossiers qui ne contiennent que des fichiers dont le nom commence par `.%` (et aussi les dossiers vides).
dotpercent-dirs.py ./documents/vrac > "undo-dotpercent-dirs-$(date).sh"
4. Ensuite déplacer à la main ce que vous voulez depuis `./documents/vrac` vers `./documents/tri`
5. Puis nettoyer les quelques fichiers et dossiers préfixés par `.%` qui ont pu être déplacés dans `./documents/tri`:
unhide-dotpercent.py ./documents/tri > "undo-unhide-dotpercent-tri-$(date).sh"
6. Recommencer à l'étape 1 jusqu'à satisfaction.
7. Puis quand vous avez fini, ou que vous en aveez marre, vous pouvez ré-afficher les fichiers et dossiers préfixés par `.%` qui restent dans `./documents/vrac`
unhide-dotpercent.py ./documents/vrac > "undo-unhide-dotpercent-vrac-$(date).sh"