Date de l'audit : 2026-06-30
Auteur : Kiro (audit automatique)
Périmètre : Documentation, cohérence, services, workflows, scripts
| Machine | IP | Type | Rôle | État |
|---|---|---|---|---|
| pve-main | .101 | Physical | Hyperviseur principal (GPU RTX 2060) | ✅ |
| pve-nuc | .150.249 | Physical | Hyperviseur secondaire/backup | ✅ |
| pfSense | .150.254 | Physical | Firewall/routeur | ✅ |
| PBS | .150.10 | Physical | Proxmox Backup Server | ✅ |
| Synology NAS | .150.181 | Physical | Stockage NAS | ✅ |
| infra-mgmt | .50 | LXC 120 | Ansible, Prometheus, Grafana, Wiki.js, LiteLLM, Alertmanager | ✅ |
| uptime-monitor | .51 | LXC 121 | Uptime Kuma (32 monitors) | ✅ |
| netbox | .52 | LXC 122 | NetBox (créé, service pas installé) | ⚠️ |
| lxc-llm | .14 | LXC 113 | Ollama (GPU passthrough RTX 2060) | ✅ |
| worker-ia | .56 | LXC 126 | OCR, tri mails, traitement batch IA | ✅ |
| vm-rustdesk-n8n | .9 | VM 106 | N8N, Rustdesk, TeamSpeak, Rack-builder | ✅ |
| vm-hestiacp | .12 | VM 110 | Mail HestiaCP (scijoly.fr) | ✅ |
| nginx-proxy-manager | .10 | LXC 101 | Reverse proxy + SSL | ✅ |
| wireguard | .26 | LXC 104 | VPN WireGuard + WG-Dashboard | ✅ |
| vm-adguard | .24 | VM 103 | DNS + filtrage AdGuard | ✅ |
| home-assistant | .20 | VM 102 | Domotique | ✅ |
| Service | Machine | Port | État |
|---|---|---|---|
| Prometheus | infra-mgmt | 9090 | ✅ 11 targets UP |
| Grafana | infra-mgmt | 3000 | ✅ Dashboards Node Exporter + GPU |
| Alertmanager | infra-mgmt | 9093 | ✅ Webhook → N8N |
| Uptime Kuma | uptime-monitor | 3001 | ✅ 32 monitors |
| Node Exporter | 8 machines | 9100 | ✅ |
| cAdvisor | vm-rustdesk-n8n | 8080 | ✅ Métriques Docker |
| LiteLLM | infra-mgmt | 4000 | ✅ Métriques Prometheus |
| Service | Machine | Port | Rôle | État |
|---|---|---|---|---|
| service-action-server | infra-mgmt | 8888 | Webhook restart/status/digest/préférences | ✅ |
| mail-review-server | worker-ia | 8889 | Tri mail intelligent par groupes avec IA | ✅ |
| mail-auto-clean (timer) | worker-ia | — | Nettoyage auto selon rétention | ✅ |
| Script | Rôle | État |
|---|---|---|
audit-infra.sh |
Audit complet infrastructure (rapport Markdown) | ✅ |
daily-digest.py |
Rapport HTML quotidien (infra/services/budget/sécu) | ✅ |
gpu_throttle.py |
Module régulation GPU (protection surchauffe) | ✅ |
mail-assistant.py |
Ordres mail en langage naturel via IA | ✅ |
mail-agent.py |
Agent autonome tri mail (confiance IA + rapport) | ✅ |
mail-auto-clean.py |
Nettoyage auto par patterns appris | ✅ |
mail-review-server.py |
Serveur HTTP tri mail v3 | ✅ |
purge-mail.py |
Purge Gmail (whitelist/blacklist) | ✅ |
rescue-trash.py |
Récupère mails importants de la corbeille via IA | ✅ |
service-action-server.py |
Micro-serveur webhook port 8888 | ✅ |
onboard-machine.sh |
Onboarding nouvelle VM/LXC | ✅ (bugs connus) |
| Workflow | Déclencheur | État |
|---|---|---|
| Send Email (Webhook) | POST /webhook/send-email | ✅ |
| Alertes Intelligentes | POST /webhook/alertmanager | ✅ |
| Daily Digest | Cron 06h | ✅ |
| Service Action | GET /webhook/service-action | ✅ |
| Preferences Notifications | Formulaire web | ✅ |
| Onboard New Machine | Formulaire web | ⚠️ (bugs connus) |
| Email Sorter IA | Email Trigger IMAP | ⚠️ (importé, à finaliser) |
| Règle | Seuil | Fichier |
|---|---|---|
| TargetDown | 1 min | infra-alerts.yml |
| HighCPU | >90% 5min | infra-alerts.yml |
| HighMemory | >90% 5min | infra-alerts.yml |
| DiskSpaceLow | >80% | infra-alerts.yml |
| DiskSpaceCritical | >90% | infra-alerts.yml |
| GPUTemperatureCritical | >82°C | gpu-protection.yml |
| GPUTemperatureWarning | >75°C | gpu-protection.yml |
| GPUVRAMCritical | >5800 MiB | gpu-protection.yml |
| GPUFanSpeedHigh | >85% | gpu-protection.yml |
| Budget LiteLLM 50% | >10€ | litellm-alerts.yml |
| Budget LiteLLM 80% | >16€ | litellm-alerts.yml |
--skip-ansible)git push rejeté si le remote a avancé (manque git pull --rebase)daily-digest.py fonctionne avec les sections infra, services, budget, securiteemails (résumé des mails importants reçus dans les 24h)docker dans daily-digest.py/preferences-form)mail-accounts.json supporte le multi-boîtes, mail-review-server.py le gèreDescription : Une page unique d'accès à tous les services (Grafana, N8N, Uptime Kuma, Wiki, LiteLLM, etc.)
Justification : Actuellement 8+ URLs à retenir. Un portail type Homepage/Dashy réduirait la friction.
Effort : Faible (container Docker, 1h de config)
Priorité : Moyenne
Description : Lire le contenu des mails (pas juste sujet/expéditeur), scoring temporel (ancienneté), détection d'interactions (mails envoyés = garder les réponses)
Justification : Le tri actuel se base surtout sur l'expéditeur. L'analyse du contenu + contexte temporel serait plus précise.
État : Partiellement implémenté dans mail-review-server.py v3
Effort : Moyen (déjà amorcé, continuer l'itération)
Priorité : Haute
Description : Monitorer le NAS Synology via SNMP ou API DSM : espace disque, SMART, température, état RAID, utilisation CPU/RAM
Justification : Le NAS contient des données critiques (Scan, photos, backups CloudSync) mais n'est pas supervisé
Effort : Moyen (SNMP exporter ou script Python DSM API → Prometheus)
Priorité : Haute
Description : Configurer les proxy hosts NPM : grafana.dev13.fr, wiki.dev13.fr, uptime.dev13.fr, n8n.dev13.fr
Justification : Accès HTTPS propre aux services internes, certificats Let's Encrypt, URLs mémorisables
Effort : Faible (NPM déjà en place, juste ajouter les proxy hosts)
Priorité : Basse (confort)
Description : Surveiller l'expiration des certificats SSL (NPM, HestiaCP, Proxmox) et alerter 30j avant expiration
Justification : Éviter les interruptions de service par certificat expiré
Effort : Faible (Uptime Kuma le supporte nativement, ou blackbox_exporter)
Priorité : Moyenne
Description : Intégrer dans le Daily Digest un résumé IA des mails importants reçus dans les 24h
Justification : Permet de ne rien rater sans lire chaque mail individuellement
Effort : Moyen (IMAP scan + Ollama résumé → section digest)
Priorité : Haute (lié au point B.2)
Description : Script/workflow inverse de l'onboarding : retire une machine de Prometheus, Uptime Kuma, inventory, services.yml, commit+push
Justification : Actuellement fait manuellement et des oublis surviennent (machines fantômes)
Effort : Moyen (symétrique de l'onboarding)
Priorité : Moyenne
Description : Installer NetBox sur le LXC .52 déjà créé, importer l'inventaire
Justification : Visualisation topologie réseau interactive, gestion IPAM propre
Effort : Moyen à élevé (installation + import + intégration)
Priorité : Basse (nice-to-have pour l'instant)
n8n-alertes-intelligentes.json) doit utiliser local/qwen2.5 via LiteLLM (http://192.168.202.50:4000). Vérifier que le workflow actif dans N8N n'utilise PAS un modèle cloud par erreur.model: "local/qwen2.5"n8n-daily-digest.json est exporté mais est-il bien ACTIF dans N8N ? Le cron 06h tourne-t-il ?service-action-server (port 8888) et mail-review-server (port 8889) ne sont PAS dans docs/inventaire/services-restart.ymlservice-action-server, mail-review-server, mail-auto-clean, LiteLLM, Alertmanager ne sont pas listés comme services dans services.ymlmail-agent.py, mail-auto-clean.py, et le fichier mail-accounts.json ne sont pas documentés dans docs/wiki/scripts.mddocs/wiki/services/home.md à la racine (utilisé par Wiki.js comme page d'accueil) ne mentionne pas : les rapports d'audit, LiteLLM, Alertmanager, worker-ia, les workflows récents, les nouvelles pages wikidocs/wiki/home.md ne mentionne pas mail-review-server (port 8889), mail-agent.py, mail-auto-clean.py, LiteLLM (port 4000)design.md liste encore vm-jitsi (.13), vm-veeam (.107), workertest (.111) dans l'inventaire machinesdocs/tasks.md sont marquées [ ] alors qu'elles sont FAITES :
| Fichier | Action |
|---|---|
docs/inventaire/services.yml |
Ajout service-action-server, mail-review-server, LiteLLM, Alertmanager |
docs/inventaire/services-restart.yml |
Ajout service-action-server, mail-review-server, litellm, alertmanager |
docs/wiki/home.md |
Mise à jour complète (micro-services, scripts, LiteLLM) |
docs/wiki/services/mail-review.md |
Nouvelle page (système tri mail) |
docs/wiki/scripts.md |
Ajout mail-agent.py, mail-auto-clean.py, mail-accounts.json |
SESSION.md |
Section "À FAIRE" nettoyée et enrichie |
home.md (racine) |
Mise à jour avec nouveaux services/pages |
Document généré automatiquement — audit du 2026-06-30