Guida Operativa per i Contributori
This translation was generated using artificial intelligence and has not been reviewed by a human translator. It may contain inaccuracies or errors and should not be relied upon.
Questa guida descrive le attività operative continuative per la manutenzione dei DoubleZero Device (DZD), inclusi gli aggiornamenti degli agent, gli aggiornamenti di dispositivi/interfacce e la gestione dei link.
Prerequisiti: Prima di utilizzare questa guida, assicurati di aver:
- Completato la Guida al Provisioning dei Dispositivi
- Il tuo DZD è completamente operativo con entrambi gli agent Config e Telemetry in esecuzione
Aggiornamenti del Dispositivo
Usa doublezero device update per modificare le impostazioni del dispositivo dopo il provisioning iniziale.
doublezero device update --pubkey <DEVICE_PUBKEY> [OPTIONS]
Opzioni di aggiornamento comuni:
| Opzione | Descrizione |
|---|---|
--device-type <TYPE> |
Cambia modalità operativa: hybrid, transit, edge (vedi Tipi di Dispositivo) |
--location <LOCATION> |
Sposta il dispositivo in una posizione diversa |
--metrics-publisher <PUBKEY> |
Cambia la metrics publisher key |
Aggiornamenti delle Interfacce
Usa doublezero device interface update per modificare le interfacce esistenti. Questo comando accetta le stesse opzioni di interface create.
doublezero device interface update <DEVICE> <NAME> [OPTIONS]
Per l'elenco completo delle opzioni dell'interfaccia incluse le impostazioni CYOA/DIA, vedi Creazione delle Interfacce.
Esempio - Aggiungere impostazioni CYOA a un'interfaccia esistente:
doublezero device interface update lax-dz001 Ethernet1/2 \
--interface-cyoa gre-over-dia \
--interface-dia dia \
--bandwidth 10000 \
--cir 1000
Elenca le Interfacce
doublezero device interface list # All interfaces across all devices
doublezero device interface list <DEVICE> # Interfaces for a specific device
Aggiornamento del Config Agent
Quando viene rilasciata una nuova versione del Config Agent, segui questi passaggi per aggiornare.
1. Scarica la versione più recente
switch# bash
$ sudo bash
# cd /mnt/flash
# wget AGENT_DOWNLOAD_URL
# exit
$ exit
2. Spegni l'agent
switch# configure
switch(config)# daemon doublezero-agent
switch(config-daemon-doublezero-agent)# shutdown
switch(config-daemon-doublezero-agent)# exit
switch(config)# exit
3. Rimuovi la vecchia versione
Prima, trova il nome del file della vecchia versione:
switch# show extensions
Esegui i seguenti comandi per rimuovere la vecchia versione. Sostituisci <OLD_VERSION> con la versione precedente dall'output sopra:
switch# delete flash:doublezero-agent_<OLD_VERSION>_linux_amd64.rpm
switch# delete extension:doublezero-agent_<OLD_VERSION>_linux_amd64.rpm
4. Installa la nuova versione
switch# copy flash:AGENT_FILENAME extension:
switch# extension AGENT_FILENAME
switch# copy installed-extensions boot-extensions
5. Riavvia l'agent
switch# configure
switch(config)# daemon doublezero-agent
switch(config-daemon-doublezero-agent)# no shutdown
switch(config-daemon-doublezero-agent)# exit
switch(config)# exit
6. Verifica l'aggiornamento
Lo stato dovrebbe essere "A, I, B".
switch# show extensions
7. Verifica l'Output del Log del Config Agent
show agent doublezero-agent log
Aggiornamento del Telemetry Agent
Quando viene rilasciata una nuova versione del Telemetry Agent, segui questi passaggi per aggiornare.
1. Scarica la versione più recente
switch# bash
$ sudo bash
# cd /mnt/flash
# wget TELEMETRY_DOWNLOAD_URL
# exit
$ exit
2. Spegni l'agent
switch# configure
switch(config)# daemon doublezero-telemetry
switch(config-daemon-doublezero-telemetry)# shutdown
switch(config-daemon-doublezero-telemetry)# exit
switch(config)# exit
3. Rimuovi la vecchia versione
Prima, trova il nome del file della vecchia versione:
switch# show extensions
Esegui i seguenti comandi per rimuovere la vecchia versione. Sostituisci <OLD_VERSION> con la versione precedente dall'output sopra:
switch# delete flash:doublezero-device-telemetry-agent_<OLD_VERSION>_linux_amd64.rpm
switch# delete extension:doublezero-device-telemetry-agent_<OLD_VERSION>_linux_amd64.rpm
4. Installa la nuova versione
switch# copy flash:TELEMETRY_FILENAME extension:
switch# extension TELEMETRY_FILENAME
switch# copy installed-extensions boot-extensions
5. Riavvia l'agent
switch# configure
switch(config)# daemon doublezero-telemetry
switch(config-daemon-doublezero-telemetry)# no shutdown
switch(config-daemon-doublezero-telemetry)# exit
switch(config)# exit
6. Verifica l'aggiornamento
Lo stato dovrebbe essere "A, I, B".
switch# show extensions
7. Verifica l'Output del Log del Telemetry Agent
show agent doublezero-telemetry log
Monitoraggio
⚠️ Importante:
- Per gli esempi di configurazione di seguito, prestare attenzione a se i propri agent utilizzano un VRF di gestione.
- Il configuration agent e il telemetry agent utilizzano la stessa porta di ascolto (:8080) per il loro endpoint delle metriche per impostazione predefinita. Se si abilitano le metriche su entrambi, usare il flag
-metrics-addrper impostare porte di ascolto univoche per ciascun agent.
Metriche del Config Agent
Il configuration agent sul dispositivo DoubleZero ha la capacità di esporre metriche compatibili con prometheus impostando il flag -metrics-enable nella configurazione del daemon doublezero-agent. La porta di ascolto predefinita è tcp/8080 ma può essere modificata per adattarsi all'ambiente tramite -metrics-addr:
daemon doublezero-agent
exec /usr/local/bin/doublezero-agent -pubkey $PUBKEY -controller $CONTROLLER_ADDR -metrics-enable -metrics-addr 10.0.0.11:2112
no shutdown
Le seguenti metriche specifiche di DoubleZero sono esposte insieme alle metriche di runtime go-specific:
$ curl -s 10.0.0.11:2112/metrics | grep doublezero
# HELP doublezero_agent_apply_config_errors_total Number of errors encountered while applying config to the device
# TYPE doublezero_agent_apply_config_errors_total counter
doublezero_agent_apply_config_errors_total 0
# HELP doublezero_agent_bgp_neighbors_errors_total Number of errors encountered while retrieving BGP neighbors from the device
# TYPE doublezero_agent_bgp_neighbors_errors_total counter
doublezero_agent_bgp_neighbors_errors_total 0
# HELP doublezero_agent_build_info Build information of the agent
# TYPE doublezero_agent_build_info gauge
doublezero_agent_build_info{commit="4378018f",date="2025-09-23T14:07:48Z",version="0.6.5~git20250923140746.4378018f"} 1
# HELP doublezero_agent_get_config_errors_total Number of errors encountered while getting config from the controller
# TYPE doublezero_agent_get_config_errors_total counter
doublezero_agent_get_config_errors_total 0
Errori ad Alto Segnale
up- Questa è la metrica timeseries generata automaticamente da prometheus se l'istanza di scraping è integra e raggiungibile. In caso contrario, l'agent non è raggiungibile o non è in esecuzione.doublezero_agent_apply_config_errors_total- La configurazione che l'agent sta tentando di applicare è fallita. In questa situazione, gli utenti non saranno in grado di eseguire l'onboarding sul dispositivo e le modifiche alla configurazione on-chain non verranno applicate finché questo non viene risolto.doublezero_agent_get_config_errors_total- Questo segnala che il configuration agent locale non riesce a comunicare con il controller DoubleZero. Nella maggior parte dei casi, ciò può essere dovuto a un problema con la connettività di gestione sul dispositivo. Analogamente alla metrica sopra, gli utenti non saranno in grado di eseguire l'onboarding sul dispositivo e le modifiche alla configurazione on-chain non verranno applicate finché questo non viene risolto.
Metriche del Telemetry Agent
Il telemetry agent sul dispositivo DoubleZero ha la capacità di esporre metriche compatibili con prometheus impostando il flag -metrics-enable nella configurazione del daemon doublezero-telemetry. La porta di ascolto predefinita è tcp/8080 ma può essere modificata per adattarsi all'ambiente tramite -metrics-addr:
daemon doublezero-telemetry
exec /usr/local/bin/doublezero-telemetry --local-device-pubkey $PUBKEY --env $ENV --keypair $KEY_PAIR -metrics-enable --metrics-addr 10.0.0.11:2113
no shutdown
Le seguenti metriche specifiche di DoubleZero sono esposte insieme alle metriche di runtime go-specific:
$ curl -s 10.0.0.11:2113/metrics | grep doublezero
# HELP doublezero_device_telemetry_agent_build_info Build information of the device telemetry agent
# TYPE doublezero_device_telemetry_agent_build_info gauge
doublezero_device_telemetry_agent_build_info{commit="4378018f",date="2025-09-23T14:07:45Z",version="0.6.5~git20250923140743.4378018f"} 1
# HELP doublezero_device_telemetry_agent_errors_total Number of errors encountered
# TYPE doublezero_device_telemetry_agent_errors_total counter
doublezero_device_telemetry_agent_errors_total{error_type="peer_discovery_program_load"} 7
doublezero_device_telemetry_agent_errors_total{error_type="submitter_failed_to_write_samples"} 8
doublezero_device_telemetry_agent_errors_total{error_type="collector_submit_samples_on_close"} 0
doublezero_device_telemetry_agent_errors_total{error_type="peer_discovery_getting_local_interfaces"} 0
doublezero_device_telemetry_agent_errors_total{error_type="peer_discovery_finding_local_tunnel"} 0
doublezero_device_telemetry_agent_errors_total{error_type="peer_discovery_link_tunnel_net_invalid"} 0
doublezero_device_telemetry_agent_errors_total{error_type="submitter_failed_to_initialize_account"} 0
doublezero_device_telemetry_agent_errors_total{error_type="submitter_retries_exhausted"} 0
# HELP doublezero_device_telemetry_agent_peer_discovery_not_found_tunnels Number of local tunnel interfaces not found during peer discovery
# TYPE doublezero_device_telemetry_agent_peer_discovery_not_found_tunnels gauge
doublezero_device_telemetry_agent_peer_discovery_not_found_tunnels{local_device_pk="8PQkip3CxWhQTdP7doCyhT2kwjSL2csRTdnRg2zbDPs1"} 0
Errori ad Alto Segnale
up- Questa è la metrica timeseries generata automaticamente da prometheus se l'istanza di scraping è integra e raggiungibile. In caso contrario, l'agent non è raggiungibile o non è in esecuzione.doublezero_device_telemetry_agent_errors_totalcon unerror_typedisubmitter_failed_to_write_samples- Questo è un segnale che il telemetry agent non riesce a scrivere i campioni on-chain, che potrebbe essere dovuto a problemi di connettività di gestione sul dispositivo.
Gestione dei Link
Drenaggio dei Link
Il drenaggio dei link consente ai contributori di rimuovere gradualmente un link dal servizio attivo per manutenzione o risoluzione dei problemi. Ci sono due stati di drenaggio:
| Stato | Comportamento IS-IS | Descrizione |
|---|---|---|
soft-drained |
Metrica impostata a 1.000.000 | Il link viene depriorizzato. Il traffico utilizzerà percorsi alternativi se disponibili, ma utilizzerà comunque questo link se è l'unica opzione. |
hard-drained |
Impostato a passivo | Il link viene completamente rimosso dal routing. Nessun traffico attraverserà questo link. |
Transizioni di Stato
Le seguenti transizioni di stato sono consentite:
activated → soft-drained ✓
activated → hard-drained ✓
soft-drained → hard-drained ✓
hard-drained → soft-drained ✓
soft-drained → activated ✓
hard-drained → activated ✗ (must go through soft-drained first)
⚠️ Nota: Non è possibile passare direttamente da
hard-drainedadactivated. Devi prima passare asoft-drained, poi adactivated.
Soft Drain di un Link
Il soft drain depriorizza un link impostando la sua metrica IS-IS a 1.000.000. Il traffico preferirà percorsi alternativi ma può comunque utilizzare questo link se necessario.
doublezero link update --pubkey <LINK_PUBKEY> --status soft-drained
Hard Drain di un Link
L'hard drain rimuove completamente il link dal routing impostando IS-IS in modalità passiva. Nessun traffico attraverserà questo link.
doublezero link update --pubkey <LINK_PUBKEY> --status hard-drained
Ripristino di un Link all'Attivo
Per riportare un link drenato al normale funzionamento:
# From soft-drained
doublezero link update --pubkey <LINK_PUBKEY> --status activated
# From hard-drained (must go through soft-drained first)
doublezero link update --pubkey <LINK_PUBKEY> --status soft-drained
doublezero link update --pubkey <LINK_PUBKEY> --status activated
Override del Ritardo
La funzionalità di override del ritardo consente ai contributori di modificare temporaneamente il ritardo effettivo di un link senza modificare il valore di ritardo misurato effettivo. Questo è utile per declassare temporaneamente un link da percorso primario a secondario.
Imposta un Override del Ritardo
Per sovrascrivere il ritardo di un link (rendendolo meno preferito nel routing):
doublezero link update --pubkey <LINK_PUBKEY> --delay-override-ms 100
I valori validi sono da 0.01 a 1000 millisecondi.
Cancella un Override del Ritardo
Per rimuovere l'override e tornare a utilizzare il ritardo misurato effettivo:
doublezero link update --pubkey <LINK_PUBKEY> --delay-override-ms 0
⚠️ Nota: Quando un link è in soft-drain, sia
delay_mschedelay_override_msvengono sovrascritti a 1000ms (1 secondo) per garantire la depriorizzazione.