Concetti base di affidabilità dei sistemi

In questa lezione introduciamo alcuni concetti e termini molto usati in tutte le materie ingegneristiche in cui i sistemi necessitano di un certo grado di affidabilità. La lingua italiana manca di distinguere alcuni termini presenti invece in inglese. Ad esempio reliability e dependability sono concetti diversi che in italiano si traducono entrambi con affidabilità; per questo motivo utilizzeremo i termini inglesi.

lezione
lezione
Concetti base di affidabilità dei sistemi
Tipo di risorsa Tipo: lezione
Materia di appartenenza Materie:
Avanzamento Avanzamento: lezione completa al 100%

Proprietà del sistema

modifica

Il concetto più generale è la dependability, che rappresenta il concetto più generale per tutti i sistemi critici:

(EN)

«Dependability is that property of a computer system such that reliance can justifiably be placed on the service it delivers.»

(IT)

«La dependability è la proprietà di un sistema tale che la sua affidabilità può giustificare la sua messa in servizio.»

(J. C. Laprie)

La dependability rappresenta quindi il grado di fiducia che l'utente pone nel sistema, cioè il grado con cui è confidente che il sistema funzioni come previsto.

Come detto la dependability è composta da varie proprietà più specifiche, ma comunque non funzionali, che dipendono non solo dal singolo sottosistema, ma anche dall'interoperazione e dalle relazioni (volute o meno) tra essi. Analizzeremo questo proprietà nelle sezioni seguenti.

Reliability

modifica

Definiamo la reliability come:

(EN)

«The ability of a system or component to perform its required functions under stated conditions for a specified period of time.»

(IT)

«L'abilità di un sistema o di un componente di eseguire le sue funzioni richieste sotto certe condizioni per un definito periodo di tempo.»

(IEEE 610[1])

La reliability è quindi legata alle condizioni in cui il sistema opera e da un periodo di tempo: un sistema viene garantito sempre per questi due aspetti, limiti entro il quale può operare e tempo di vita.

Introdotta ora informalmente, definiamo in formule la reliability di un sistema:

 

assunto che funzioni al tempo  .

Specularmente definiamo unreliability come:  

Si noti che   è una funzione non decrescente, assume valori nell'intervallo   e   a mostrare che prima o poi, il sistema si guasterà.

Availability

modifica

Definiamo l'availability come:

(EN)

«The degree to which a system or component is operational and accessible when required for use.»

(IT)

«Il grado con il quale il sistema è funzionante e accessibile quando ne viene richiesto l'uso.»

(IEEE 610[1])

Introdotta ora informalmente, definiamo in formule l'availability di un sistema:

 

e si può calcolare la disponibilità media come:

 

Specularmente definiamo unavailability come:  

Si noti che se il sistema non è riparabile  , altrimenti  .

Maintainability

modifica

La maintainability (manutenibilità) è l'abilità di un sistema di essere riparato o modificato. In formule è definito come:

 

Come per la reliability   è una funzione non decrescente, assume valori nell'intervallo   e  . Se così non fosse, il sistema è considerato non riparabile.

Altri concetti

modifica

Altre proprietà del sistema, solitamente meno usate, sono brevemente mostrate in questa sezione. Troviamo:

  • performability:   probabilità che le prestazioni di un sistema siano almeno a un certo livello   al tempo  ;
  • integrity: assenza di impropri stati di un sistema; comprende l'abilità di un sistema di rilevare i guasti e disattivarsi o comunque segnalare il problema;
  • safety: assenza di catastrofiche conseguenze sull'utente o l'ambiente operativo;
  • security: abilità del sistema di resistere a interferenze esterne, comprese intrusioni accidentali o deliberate e azioni errate degli attori coinvolti.
  • survivability: abilità del sistema di continuare a offrire il proprio servizio durante attacchi accidentali o delibrati e in caso del fallimento di alcuni componenti (resilienza);
  • testability: abilità del sistema di essere testato per certe proprietà.

Definiamo introltre graceful degradation (degradazione graduale, poco usato in italiano) come l'abilità di un sistema di dimuire gradualmente il suo livello di performance a seguito di guasti.


Terminologia accessoria

modifica

Fault - Error - Failure

modifica

Spesso i tre termini nel titolo vengono confusi e non utilizzati propriamente, inoltre la lingua italiana non aiuta. Provvediamo a definirli in modo corretto:

  • Fault: un difetto del sistema (non rilevabile dall'output del sistema).
  • Error: una deviazione dal normale funzionamento del sistema (rilevabile, ma non necessariamente rilevato).
  • Failure: il sistema smette di eseguire la funzione per il quale è stato studiato.

Si noti che i 3 valori sono in ordine cronologico di avvenimento e successivamente è possibile aggiungere:

  • Hazard: stato del sistema nel quale è considerato rischioso, con potenziali danni.
  • Accident: incidente vero e proprio.

Rischio

modifica

Il rischio è definito come potenzialità che un guasto porti a un danno o ad un evento indesiderabile. Può essere definito come:

 

Spesso nelle applicazioni ingegneristiche si preferisce usare degli indici "Mean time ...". In questa sezione analizzeremo in particolare i più importanti e citeremo altri indici spesso usati.

MTTF, MTBF e MTTR

modifica
  • L'MTTF (Mean Time To Failure) è, come dice l'acronimo, il tempo medio al primo fallimento del sistema.
  • L'MTBF (Mean Time Between Failure) è, come dice l'acronimo, il tempo medio tra un guasto e il successivo.
  • L'MTTR (Mean Time To Repair) è, come dice l'acronimo, il tempo medio tra il guasto e la rimessa in funzione del sistema.

Inoltre definiamo:

  • MUP (Mean UP time): tempo medio di funzionamento del sistema
  • MDT (Mean Down Time): tempo medio di non funzionamento del sistema

Si noti che   perché   comprende anche il tempo di detection, identificazione del guasto e rimessa in servizio dopo la riparazione.

L'MTBF può essere calcolato come   (dove   è il rateo di guasto). Se inoltre assumiamo che se avviene un secondo guasto il sistema lo riconosce, allora:  

Spesso l'MTBF è anche indicato come FIT ovvero il numero di guasti per milione di ore di funzionamento.

Altri indici

modifica
  • MTBMA: Mean Time Between Maintainance Actions
  • MTSM: Mean Time for Scheduled Maintanance
  • MTLA: Mean Time for Logistic Actions (es. trovare il componente sostitutivo in magazzino)
  • MTBMA (alternativa): Mean Time Between Mission Abort
  1. 1,0 1,1 IEEE Standard Glossary of Software Engineering Terminology, IEEE Std 610.12-1990 (R2002).