Ce fichier sert de référence unique avec les caractéristiques de chaque machine. Les autres documents (SESSION.md, CHANGELOG, runbooks) font des liens vers ce fichier.
| Paramètre | Valeur |
|---|---|
| IP | 192.168.202.101 |
| Type | Physical (ancien PC gamer) |
| ID Proxmox | — (c'est l'hôte) |
| CPU | 28 cores |
| RAM | 62 Go |
| GPU | NVIDIA GeForce RTX 2060 (6 Go VRAM) |
| Driver NVIDIA | 550.163.01 (⚠️ NE PAS METTRE À JOUR sans check) |
| CUDA | 12.4 |
| Disques | NVMe 200 Go + SSD 1 To (LVM) + 2×8 To ZFS + SSD 256 Go boot (31% wear) |
| Rôle | Hyperviseur toutes les VMs/LXCs, GPU passthrough vers lxc-llm |
| Monitoring | node_exporter :9100, nvidia-gpu-metrics (textfile collector) |
| Services spéciaux | Script nvidia-gpu-metrics.sh (service systemd, toutes les 15s) |
| Alertes actives | GPUTempCritical >82°C, GPUTempWarning >75°C, VRAMCritical >5800 MiB, FanHigh >85% |
| SSH | ssh root@192.168.202.101 (depuis infra-mgmt) |
| Points d'attention | SSD boot 31% wear (remplacement à prévoir), drivers NVIDIA stables depuis 68j+ |
| Mécanisme | Seuil | Action | Statut |
|---|---|---|---|
| Alerte warning Prometheus | Temp > 75°C (3 min) | Notification admin | ✅ Actif |
| Alerte critique Prometheus | Temp > 82°C (1 min) | Notification + kill charge | ✅ Actif (kill à connecter via N8N) |
| Alerte VRAM | > 5800 MiB (2 min) | Ne pas charger 2ème modèle | ✅ Actif |
| Alerte fan | > 85% (5 min) | Vérifier ventilation | ✅ Actif |
| Throttle hardware NVIDIA | > 83°C | Le GPU réduit sa fréquence automatiquement | Natif (pas configurable) |
| Kill automatique Ollama | À connecter (Alertmanager → N8N → restart ollama) | Libère GPU immédiatement | 🔲 À faire |
| Planification heures creuses | 22h-06h par défaut | Tâches lourdes IA uniquement la nuit | 🔲 À faire |
| Paramètre | Valeur |
|---|---|
| IP | 192.168.202.14 |
| Type | LXC |
| ID Proxmox | 113 |
| Cores | 2 |
| RAM | Non renseigné (à vérifier) |
| Disque | 69 Go (29 Go utilisés, 43%) |
| Rôle | LLM local (Ollama) — cerveau IA de l'infrastructure |
| GPU | RTX 2060 via passthrough (depuis pve-main) |
| Ollama | v0.30.11 |
| Modèles | qwen2.5:7b (principal, 4.7 Go), llama3:8b (backup), mistral-nemo:12b (option) |
| API | http://192.168.202.14:11434 |
| Monitoring | node_exporter :9100 |
| SSH | ssh root@192.168.202.14 (depuis infra-mgmt) |
| Points d'attention | Température GPU visible uniquement depuis pve-main (pas depuis le LXC). Ne pas toucher au driver NVIDIA. |
| Paramètre | Valeur |
|---|---|
| IP | 192.168.202.56 |
| Type | LXC |
| ID Proxmox | 126 |
| Cores | 4 (scalable à chaud : pct set 126 -cores X sans reboot) |
| RAM | 4 Go |
| Disque | 20 Go (17 Go libres) |
| Rôle | Tâches IA CPU : OCR (Tesseract), hashing photos (pHash), extraction PDF/Word/Excel, pipeline documents |
| Outils | Tesseract 5.5.0 (fra+eng), pymupdf, imagehash, pillow, python-docx, openpyxl, watchdog |
| Montage Synology | /mnt/synology-scan (bind mount depuis pve-main, lecture seule) |
| Source Synology | //192.168.150.181/home/Scan |
| Accès Ollama | http://192.168.202.14:11434 (API réseau vers lxc-llm) |
| Monitoring | node_exporter :9100 (target Prometheus ajoutée manuellement) |
| SSH | ssh root@192.168.202.56 (depuis infra-mgmt) |
| Playbook | ansible-playbook playbooks/03-worker-ia.yml -l worker-ia |
| Recréation | pct destroy 126 → clone template 9000 → onboard → playbook = 5 min |
| Points d'attention | LXC non-privilégié : mount SMB/NFS impossible en interne (bind mount via pve-main). Onboarding partiel (Uptime Kuma et git push à corriger). |
| Paramètre | Valeur |
|---|---|
| IP | 192.168.202.50 |
| Type | LXC |
| ID Proxmox | 120 |
| Cores | 2 (à augmenter à 4-6 pour OCR/batch si nécessaire) |
| RAM | 4 Go |
| Rôle | Ansible, Prometheus, Grafana, Wiki.js — point d'entrée SSH pour toute l'infra |
| Services | Prometheus :9090, Grafana :3000, Wiki.js :3002, node_exporter :9100 |
| Repo Git | /opt/ansible/repo (clone GitHub sylexozorus/infrastructure) |
| SSH | ssh root@192.168.202.50 ou pct enter 120 depuis pve-main |
| Points d'attention | Prometheus n'a pas de reload (utiliser restart). Git user pas configuré (warning committer). |
| Paramètre | Valeur |
|---|---|
| IP | 192.168.202.9 |
| Type | VM |
| ID Proxmox | 106 |
| Cores | 8 |
| RAM | 8 Go |
| Rôle | N8N (orchestration workflows), Rustdesk, TeamSpeak |
| Services | N8N :5678, cAdvisor :8080, node_exporter :9100 |
| Docker | Oui (network_mode: host pour N8N) |
| SSH | ssh loic@192.168.202.9 (sudo) |
| Points d'attention | N8N utilise NODE_TLS_REJECT_UNAUTHORIZED=0. Clé SSH N8N donne accès root à toute l'infra. |
| Paramètre | Valeur |
|---|---|
| IP | 192.168.150.181 |
| Type | Physical (NAS) |
| Modèle | DS720+ |
| Rôle | Stockage documents multi-entreprises, photos, dossier Scan, CloudSync |
| Protocoles | SMB, NFS (à activer si besoin) |
| Accès | Interface web DSM, SMB depuis réseau interne |
| Montage actuel | Bind mount via pve-main vers worker-ia (//192.168.150.181/home/Scan) |
| Points d'attention | Sécuriser (désactiver QuickConnect, UPnP, ports non nécessaires). Pas de SSH configuré. |
| Machine | Dashboard Grafana | Prometheus Target |
|---|---|---|
| pve-main | GPU RTX 2060 | 192.168.202.101:9100 |
| lxc-llm | Node Exporter | 192.168.202.14:9100 |
| worker-ia | Node Exporter | 192.168.202.56:9100 |
| infra-mgmt | Node Exporter | 192.168.202.50:9100 |
| vm-rustdesk-n8n | Node Exporter + cAdvisor | 192.168.202.9:9100 |