Skip to content

rasdehya/aquarelles

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 

Repository files navigation

🎨 CLAUDE.md : Projet ARCHIVISTE-AQUARELLE

📝 1. VISION & OBJECTIF

Transformer une collection de 10 000+ aquarelles physiques numérisées en une base de données intelligente et sémantique. L'outil doit apprendre le style spécifique de l'artiste (reportage, étude, carnet) et automatiser le catalogage via une boucle de rétroaction itérative (Human-in-the-loop).


🛠 2. STACK TECHNIQUE CIBLE (2026)

  • Langage : Python 3.10+
  • IA Vision (Local) : * Modèle Principal : OpenCLIP (ex: ViT-bigG-14-CLIPA-336) pour le "Zero-shot tagging".
    • Modèle de Description : Llava-v1.6 ou Moondream2 pour l'analyse textuelle détaillée (VLM).
  • Bases de Données :
    • SQL (SQLite) : Métadonnées froides (chemins, dates, EXIF, tags validés).
    • Vectorielle (ChromaDB) : Stockage des embeddings pour la recherche par similarité et le clustering.
  • Interface : Streamlit (Backend-to-Web local).

🔍 3. LOGIQUE D'ANALYSE (L'ONTOLOGIE)

L'IA ne doit pas produire de tags vracs. Elle doit remplir quatre axes systématiques pour chaque image :

  1. Axe SUJET : [Paysage, Portrait, Architecture, Nature Morte, Animalier, Abstrait]
  2. Axe LIEU : [Intérieur, Extérieur, Ville, Campagne, Côte/Mer, Montagne]
  3. Axe TECHNIQUE : [Lavis, Sec sur Sec, Crayon Apparent, Humide sur Humide, Reportage/Rapide]
  4. Axe AMBIANCE : [Couleurs Chaudes/Froides, High-Key, Low-Key, Saison, Moment du jour]

🔄 4. WORKFLOW ITÉRATIF (LE "CERVEAU")

Phase A : Ingestion & Premier Tri

  • Scan du disque dur externe.
  • Classement physique auto : /Aquarelles/ANNEE/MOIS/image.jpg.
  • Génération des "Empreintes Digitales" (Embeddings).

Phase B : La "Passe à Vide" (Tagging Probabiliste)

  • L'IA assigne des tags avec un Score de Confiance (0.0 à 1.0).
  • Seuil de validation automatique : > 0.85.
  • Zone d'incertitude : [0.5 - 0.85] -> Mise en attente pour "Interview".

Phase C : L'Interview de l'Artiste

  • L'IA regroupe les incertitudes par similarité (Clustering).
  • Exemple d'interaction : "J'ai 150 images d'oliviers. S'agit-il de ta série 'Palestine' ou 'Provence' ?"
  • Correction : Une réponse de l'utilisateur sur une image se propage à tout le cluster visuel.

🚀 5. FONCTIONNALITÉS AVANCÉES

  • Recherche par Similarité : "Trouver des peintures ayant la même atmosphère que image_01.jpg".
  • Détection de Reportage : Identification automatique des séries de voyage via la cohérence temporelle et stylistique.
  • Analyse de Pigments : Extraction de la palette chromatique (K-Means) pour filtrer par couleur dominante.

⚠️ 6. DIRECTIVES POUR LE DÉVELOPPEUR (LLM)

  1. Confidentialité : Tout doit tourner en local. Pas d'API Cloud (OpenAI/Google) sans validation explicite.
  2. Modularité : Séparer strictement le moteur d'IA (Inference) de la gestion de fichiers (OS/Shutil).
  3. Apprentissage : Toujours privilégier la suggestion à l'imposition. L'IA doit demander confirmation avant de renommer ou taguer massivement.
  4. Optimisation GPU : Utiliser torch.device("cuda") pour NVIDIA ou torch.device("mps") pour Mac Pro.

📅 7. ROADMAP

  • Étape 1 : Script de scan, renommage et initialisation SQLite/ChromaDB.
  • Étape 2 : Pipeline d'inférence CLIP (Première passe de tags).
  • Étape 3 : Interface Streamlit de visualisation et filtrage.
  • Étape 4 : Boucle de rétroaction (Interface de correction et propagation des tags).

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors