Un système n’est pas “résilient” parce qu’il a des retries. Il est résilient quand il survit à ses propres conditions réelles sans qu’un humain soit requis pour recoller les morceaux.

La plupart des architectures se vendent comme solides, mais elles reposent sur une chose : la capacité des humains à compenser ce qui n’a pas été rendu explicite.

La résilience commence quand tu refuses la phrase : “on verra en prod”.

Résilience = redémarrage normalisé
+ échec explicite
+ invariants stables
+ continuité sans runbook