Poster une réponse 
 
Note de cette discussion :
  • Moyenne : 0 (0 vote(s))
  • 1
  • 2
  • 3
  • 4
  • 5
Disque dur en rouge
05-10-2019, 14:38:07
Message : #1
Disque dur en rouge
Bonjour,

Je viens de recevoir un mail d'alerte de mon NAS, en me rendant sur la portail, la petite cloche m'annonce qu'un disque est absent de ma grappe, et effectivement il apparait en rouge (voir photo) pourtant l'état SMART est SAIN.

Je fais quoi, je le change ou je redémarre ?

Merci

[Image: raid_510.png]

VHS 4 Home Édition
OS: 6.1.4
4 x 3To Raid 5
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
05-10-2019, 16:28:42
Message : #2
RE: Disque dur en rouge
Bonjour Jean83,

A part le mail et le rouge, ton serveur fonctionne normalement ?

L'état SMART est plus détaillé via "Surveillance du serveur" / Carroussel "disques durs" / "S.M.A.R.T." et regarde tous les disques (même si c'est le premier en rouge)

On tente de diagnostiquer ? Ton ''ssh'' est actif ?
Si Ok, retourne ici les résultats:
  • Etat des grappes md0(système) et md3(data):
    Code :
    sudo cat /proc/mdstat
  • Etat de l'ensemble des disques dans la grappe data
    Code :
    sudo mdadm --examine /dev/sd[a,b,c,d]3
  • Etat smart détaillé (mais là "c'est pour le fun" et voir si quelque chose saute au yeux - un disque qui ne sort rien par exemple). Perso je sais pas bien interpréter...
    Code :
    sudo smartctl -a /dev/sda  ## ici disque a, à faire idem avec b, c et d

Si c'est "juste" le 1ier disque qui est fatigué (peut-être normal selon l'âge qu'il a), il suffira peut-être simplement de le changer en effet, et reconstruction de grappe automatique... et longue... et sans redémarrer (à chaud, c'est fait pour çà).
... En principe !

@suivre
PS: je suis pas convaincu qu'un arrêt/relance apporte quelque chose. Celà dit, je pense pas que ça augmente le risque non plus...

VHS-4 VX "sesame"
* Intel® Core i7 4770s @ 3.9 GHz | 16 Go DDR3
* 4x4To WD40EFRX - RAID 5 | OS VHT v 6.1.4
[Image: wiki:favicon-32.png]Le wiki
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
05-10-2019, 17:27:02
Message : #3
RE: Disque dur en rouge
Ola,

Merci de ton aide
Alors, dans l'ordre, en passant par le carousel, seul le DD1 n'est pas complément en vert

[Image: smart_10.png]

Et les commandes SSH

Code :
admin@vhs-4:~$ sudo cat /proc/mdstat
[sudo] password for admin:
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md3 : active raid5 sdb3[7] sda3[4](F) sde3[6] sdc3[5]
      8774653632 blocks super 1.0 level 5, 64k chunk, algorithm 2 [4/3] [UUU_]
      
md0 : active raid1 sda2[6] sde2[4] sdc2[7] sdb2[5]
      4883776 blocks super 1.0 [4/4] [UUUU]
      
unused devices: <none>
admin@vhs-4:~$ sudo mdadm --examine /dev/sd[a,b,c,d]3
/dev/sda3:
          Magic : a92b4efc
        Version : 1.0
    Feature Map : 0x0
     Array UUID : ee2c6195:c32d843d:25e72dfa:5fa09b88
           Name : VHS-4:3
  Creation Time : Tue Mar  8 17:49:22 2011
     Raid Level : raid5
   Raid Devices : 4

Avail Dev Size : 5849769184 (2789.39 GiB 2995.08 GB)
     Array Size : 8774653632 (8368.16 GiB 8985.25 GB)
  Used Dev Size : 5849769088 (2789.39 GiB 2995.08 GB)
   Super Offset : 5849769440 sectors
          State : active
    Device UUID : 475d8950:be6bc7a7:65d84238:d7d7b0dd

    Update Time : Sat Oct  5 10:10:02 2019
       Checksum : fb2b501f - correct
         Events : 3066263

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 3
   Array State : AAAA ('A' == active, '.' == missing)
/dev/sdb3:
          Magic : a92b4efc
        Version : 1.0
    Feature Map : 0x0
     Array UUID : ee2c6195:c32d843d:25e72dfa:5fa09b88
           Name : VHS-4:3
  Creation Time : Tue Mar  8 17:49:22 2011
     Raid Level : raid5
   Raid Devices : 4

Avail Dev Size : 5849769184 (2789.39 GiB 2995.08 GB)
     Array Size : 8774653632 (8368.16 GiB 8985.25 GB)
  Used Dev Size : 5849769088 (2789.39 GiB 2995.08 GB)
   Super Offset : 5849769440 sectors
          State : active
    Device UUID : 5b495f0e:0679d2e6:1d0f099a:d328b3a9

    Update Time : Sat Oct  5 17:24:33 2019
       Checksum : 25d5f697 - correct
         Events : 3077113

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 0
   Array State : AAA. ('A' == active, '.' == missing)
/dev/sdc3:
          Magic : a92b4efc
        Version : 1.0
    Feature Map : 0x0
     Array UUID : ee2c6195:c32d843d:25e72dfa:5fa09b88
           Name : VHS-4:3
  Creation Time : Tue Mar  8 17:49:22 2011
     Raid Level : raid5
   Raid Devices : 4

Avail Dev Size : 5849769184 (2789.39 GiB 2995.08 GB)
     Array Size : 8774653632 (8368.16 GiB 8985.25 GB)
  Used Dev Size : 5849769088 (2789.39 GiB 2995.08 GB)
   Super Offset : 5849769440 sectors
          State : clean
    Device UUID : 34e0bf49:0855ee83:3c06bdb5:a83eb033

    Update Time : Sat Oct  5 17:24:33 2019
       Checksum : a4037664 - correct
         Events : 3077114

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 1
   Array State : AAA. ('A' == active, '.' == missing)
admin@vhs-4:~$ sudo smartctl -a /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.16.0-31-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (AF)
Device Model:     WDC WD30EFRX-68EUZN0
Serial Number:    WD-WCC4N5EUU8RH
LU WWN Device Id: 5 0014ee 2631edfb4
Firmware Version: 82.00A82
User Capacity:    3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sat Oct  5 17:25:02 2019 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (39900) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 400) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x703d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       255
  3 Spin_Up_Time            0x0027   177   177   021    Pre-fail  Always       -       6141
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       6
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7544
10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       6
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       118
194 Temperature_Celsius     0x0022   114   108   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

admin@vhs-4:~$ sudo smartctl -a /dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.16.0-31-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (AF)
Device Model:     WDC WD30EFRX-68EUZN0
Serial Number:    WD-WCC4N1EA7NFC
LU WWN Device Id: 5 0014ee 20c9b8106
Firmware Version: 82.00A82
User Capacity:    3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sat Oct  5 17:25:09 2019 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (39120) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 393) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x703d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   179   179   021    Pre-fail  Always       -       6025
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       11
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7648
10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       11
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       5
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       134
194 Temperature_Celsius     0x0022   114   107   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

admin@vhs-4:~$ sudo smartctl -a /dev/sdc
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.16.0-31-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (AF)
Device Model:     WDC WD30EFRX-68EUZN0
Serial Number:    WD-WCC4N5SUDT76
LU WWN Device Id: 5 0014ee 2b8439668
Firmware Version: 82.00A82
User Capacity:    3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sat Oct  5 17:25:14 2019 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (39900) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 400) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x703d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   176   176   021    Pre-fail  Always       -       6191
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       8
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7537
10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       8
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       117
194 Temperature_Celsius     0x0022   114   108   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

admin@vhs-4:~$ sudo smartctl -a /dev/sdd
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.16.0-31-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

/dev/sdd: Unknown USB bridge [0x13fe:0x3100 (0x100)]
Please specify device type with the -d option.

Use smartctl -h to get a usage summary

admin@vhs-4:~$

VHS 4 Home Édition
OS: 6.1.4
4 x 3To Raid 5
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
05-10-2019, 18:18:54
Message : #4
RE: Disque dur en rouge
Hello,

Zut, les disques se suivent pas ! C'est pas a,b,c,d mais a priori a,b,c,e (d doit être ta clé)
Donc, peux-tu donner les retours de :
  • Code :
    lsblk -o name,model,type,size,fstype,state,mountpoint
  • Code :
    /opt/vht/bin/storage/hddDevToChassisNum.sh /dev/sda  ## puis sdb, sdc, sde
    Va donner la position de chaque disque.
  • De nouveau
    Code :
    sudo mdadm --examine /dev/sd[a,b,c,e]3
    mais avec 'e' à la fin
  • Et le smart de sde:
    Code :
    sudo smartctl -a /dev/sde
Là, manque un disque dans la grappe, indiqué par:
- [4/3] [UUU_] dans la commande sudo cat /proc/mdstat (au lieu de [UUUU]
- Array State : AAA. ('A' == active, '.' == missing) pour chaque disque dans sudo mdadm --examine ... (au lieu de AAAA)
- l'IHM dit que c'est sda a priori: Il s'est passer quelque chose vers 10h10 ce matin (heure de dernière synchro de sda) ?

@+

VHS-4 VX "sesame"
* Intel® Core i7 4770s @ 3.9 GHz | 16 Go DDR3
* 4x4To WD40EFRX - RAID 5 | OS VHT v 6.1.4
[Image: wiki:favicon-32.png]Le wiki
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
05-10-2019, 18:38:06
Message : #5
RE: Disque dur en rouge
Un grand merci pour ta réactivité:

Voici le retour demandé
Code :
Last login: Sat Oct  5 17:23:10 2019 from *******
admin@vhs-4:~$ lsblk -o name,model,type,size,fstype,state,mountpoint
NAME    MODEL            TYPE    SIZE FSTYPE STATE   MOUNTPOINT
sda     WDC WD30EFRX-68E disk    2.7T        running
├─sda1                   part  486.4M                [SWAP]
├─sda2                   part    4.7G                
│ └─md0                  raid1   4.7G                /
└─sda3                   part    2.7T                
  └─md3                  raid5   8.2T                /mnt/data
sdb     WDC WD30EFRX-68E disk    2.7T        running
├─sdb1                   part  486.4M                [SWAP]
├─sdb2                   part    4.7G                
│ └─md0                  raid1   4.7G                /
└─sdb3                   part    2.7T                
  └─md3                  raid5   8.2T                /mnt/data
sdc     WDC WD30EFRX-68E disk    2.7T        running
├─sdc1                   part  486.4M                [SWAP]
├─sdc2                   part    4.7G                
│ └─md0                  raid1   4.7G                /
└─sdc3                   part    2.7T                
  └─md3                  raid5   8.2T                /mnt/data
sdd     USB DISK 2.0     disk    3.8G        running
└─sdd1                   part    3.8G                
sde     WDC WD30EFRX-68E disk    2.7T        running
├─sde1                   part  486.4M                [SWAP]
├─sde2                   part    4.7G                
│ └─md0                  raid1   4.7G                /
└─sde3                   part    2.7T                
  └─md3                  raid5   8.2T                /mnt/data
admin@vhs-4:~$ /opt/vht/bin/storage/hddDevToChassisNum.sh /dev/sda
1
admin@vhs-4:~$ /opt/vht/bin/storage/hddDevToChassisNum.sh /dev/sdb
2
admin@vhs-4:~$ /opt/vht/bin/storage/hddDevToChassisNum.sh /dev/sdc
3
admin@vhs-4:~$ /opt/vht/bin/storage/hddDevToChassisNum.sh /dev/sde
4
admin@vhs-4:~$ sudo mdadm --examine /dev/sd[a,b,c,e]3
[sudo] password for admin:
/dev/sda3:
          Magic : a92b4efc
        Version : 1.0
    Feature Map : 0x0
     Array UUID : ee2c6195:c32d843d:25e72dfa:5fa09b88
           Name : VHS-4:3
  Creation Time : Tue Mar  8 17:49:22 2011
     Raid Level : raid5
   Raid Devices : 4

Avail Dev Size : 5849769184 (2789.39 GiB 2995.08 GB)
     Array Size : 8774653632 (8368.16 GiB 8985.25 GB)
  Used Dev Size : 5849769088 (2789.39 GiB 2995.08 GB)
   Super Offset : 5849769440 sectors
          State : active
    Device UUID : 475d8950:be6bc7a7:65d84238:d7d7b0dd

    Update Time : Sat Oct  5 10:10:02 2019
       Checksum : fb2b501f - correct
         Events : 3066263

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 3
   Array State : AAAA ('A' == active, '.' == missing)
/dev/sdb3:
          Magic : a92b4efc
        Version : 1.0
    Feature Map : 0x0
     Array UUID : ee2c6195:c32d843d:25e72dfa:5fa09b88
           Name : VHS-4:3
  Creation Time : Tue Mar  8 17:49:22 2011
     Raid Level : raid5
   Raid Devices : 4

Avail Dev Size : 5849769184 (2789.39 GiB 2995.08 GB)
     Array Size : 8774653632 (8368.16 GiB 8985.25 GB)
  Used Dev Size : 5849769088 (2789.39 GiB 2995.08 GB)
   Super Offset : 5849769440 sectors
          State : clean
    Device UUID : 5b495f0e:0679d2e6:1d0f099a:d328b3a9

    Update Time : Sat Oct  5 18:35:48 2019
       Checksum : 25d60e29 - correct
         Events : 3078872

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 0
   Array State : AAA. ('A' == active, '.' == missing)
/dev/sdc3:
          Magic : a92b4efc
        Version : 1.0
    Feature Map : 0x0
     Array UUID : ee2c6195:c32d843d:25e72dfa:5fa09b88
           Name : VHS-4:3
  Creation Time : Tue Mar  8 17:49:22 2011
     Raid Level : raid5
   Raid Devices : 4

Avail Dev Size : 5849769184 (2789.39 GiB 2995.08 GB)
     Array Size : 8774653632 (8368.16 GiB 8985.25 GB)
  Used Dev Size : 5849769088 (2789.39 GiB 2995.08 GB)
   Super Offset : 5849769440 sectors
          State : clean
    Device UUID : 34e0bf49:0855ee83:3c06bdb5:a83eb033

    Update Time : Sat Oct  5 18:35:48 2019
       Checksum : a4038df5 - correct
         Events : 3078872

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 1
   Array State : AAA. ('A' == active, '.' == missing)
/dev/sde3:
          Magic : a92b4efc
        Version : 1.0
    Feature Map : 0x0
     Array UUID : ee2c6195:c32d843d:25e72dfa:5fa09b88
           Name : VHS-4:3
  Creation Time : Tue Mar  8 17:49:22 2011
     Raid Level : raid5
   Raid Devices : 4

Avail Dev Size : 5849769184 (2789.39 GiB 2995.08 GB)
     Array Size : 8774653632 (8368.16 GiB 8985.25 GB)
  Used Dev Size : 5849769088 (2789.39 GiB 2995.08 GB)
   Super Offset : 5849769440 sectors
          State : clean
    Device UUID : 8bf5de2e:6107707e:ff2dfe84:daea7408

    Update Time : Sat Oct  5 18:35:48 2019
       Checksum : 27aa299b - correct
         Events : 3078872

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 2
   Array State : AAA. ('A' == active, '.' == missing)
admin@vhs-4:~$ sudo smartctl -a /dev/sde
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.16.0-31-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (AF)
Device Model:     WDC WD30EFRX-68EUZN0
Serial Number:    WD-WCC4N1354749
LU WWN Device Id: 5 0014ee 25fa1df77
Firmware Version: 80.00A80
User Capacity:    3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sat Oct  5 18:36:14 2019 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (38160) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 383) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x703d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   179   179   021    Pre-fail  Always       -       6033
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       7
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7567
10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       7
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       117
194 Temperature_Celsius     0x0022   114   108   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

admin@vhs-4:~$

VHS 4 Home Édition
OS: 6.1.4
4 x 3To Raid 5
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
05-10-2019, 21:10:48
Message : #6
RE: Disque dur en rouge
Bonsoir,

Donc sdd est bien une clé USB: tu as dû ajouter le dernier disque plus tard dans le temps ?
Et c'est bien le premier disque qui est fautif car la commande
Code :
sudo cat /proc/mdstat
retourne "sda3[4](F)" comme "Fault".

Bon...
Alors ci-dessous, à prendre avec des pincettes car très théorique et issu seulement de lectures...
(ben on va bien être obligé de se dépatouiller tout seul maintenant... Confused)

Les 3 derniers disques sd[bce] sont synchrones et toujours dans la grappe, qui reste active et opérationnelle, car RAID 5 et perte d'un disque (sda) possible.
Ce qui veut dire que c'est le moment de faire une sauvegarde !! Sleepy

Lorsque tu regardes le détail, pour chaque disque examiné, ils disposent tous d'un compteur d'évènements (Event) valorisés à 3078872, sauf pour sda qui a 3066263.
Tu peux recompter ces évènements en passant la commande:
Code :
sudo mdadm --examine /dev/sd[abce]3 | egrep 'Event|/dev/sd'

Tous les disques sont donc synchronisés, sauf sda qui a eu un problème vers 10h10 apparemment et "a pris du retard" depuis.

Les évènements sont des écritures dans la grappe. Si l'écart n'est pas important on peut forcer l'assemblage de la grappe sans trop de risques.
Au-delà de 50 de différence en nombre d'évènements, on considère (c'est ce que j'ai lu) que l'écart est trop important et présente un risque pour les données.
Ici le seuil semble largement dépassé, ce qui veut dire que le disque a été trop longtemps hors de la grappe et ne devrait pas être inclus dans l'assemblage.

Question: As-tu fait des écritures sur ton NAS disons depuis hier ? Beaucoup ?

Dans le cas d'une désynchronisation légère - ca ne semble pas être ton cas, donc sans doute ne pas faire - on peut tenter de stopper l'array et de le réassembler de façon forcée:
Code :
sudo mdadm --stop /dev/md3
sudo mdadm --assemble --force --run /dev/md3 /dev/sd[abce]3

Dans le cas d'une désynchronisation plus importante, il faut retirer le disque fautif, il faut assembler la grappe sans le disque "en retard", puis l'y ajouter...
Code :
sudo mdadm --manage --set-faulty /dev/md3 /dev/sda3          # Positionner le disque comme en faute
sudo mdadm --stop /dev/md3                                   # Arrêter la grappe
sudo mdadm --assemble --force --run /dev/md3 /dev/sd[bce]3   # Réassembler la grappe sans le disque fautif sda
sudo mdadm --manage /dev/md3 --add /dev/sda3                 # l'ajouter à nouveau

Et là, reconstruction de la grappe, dont tu peux suivre l'avancement avec:
Code :
sudo cat /proc/mdstat

ATTENTION: Ce n'est que ma compréhension du truc, hein ! C'est risqué comme toutes les opérations de cette nature (sauvegarde impérative !), y a peut-être plus simple, c'est pas ça du tout, etc...

Finalement, tu as tenté un reboot ? Si tu le fais, re-commande
Code :
sudo cat /proc/mdstat
pour voir si changement.

S'il me vient d'autres idées dans la nuit...Angel
Des forumeurs ont d'autres pistes ?
@+

VHS-4 VX "sesame"
* Intel® Core i7 4770s @ 3.9 GHz | 16 Go DDR3
* 4x4To WD40EFRX - RAID 5 | OS VHT v 6.1.4
[Image: wiki:favicon-32.png]Le wiki
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
05-10-2019, 21:37:46
Message : #7
RE: Disque dur en rouge
Cram est devenu expert en grappes RAID ! Bravo

Est-ce que le disque en rouge ne serait pas tout simplement en train de claquer ? Ça peut claquer à des âges très variés

S'il est possible de refaire la grappe avec les 3 disques comme le dit Cram pour être sûr qu'elle soit en état de se reconstruire, je suggère de changer le disque 1 après cette étape et de l'ajouter à la grappe. Cela va pas mal solliciter les 3 autres, il faut donc les surveiller ausssi (et avoir une sauvegarde à jour!)

VHS4 Xtreme II - AMD Athlon II X2 240e
OS: v6.1.3 / RAM: 6 Go / Stockage: 4x 3 To

Wiki de la COMMUNAUTÉ
Qu'est-ce que GNU/Linux
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
05-10-2019, 23:53:47
Message : #8
RE: Disque dur en rouge
(05-10-2019 21:37:46)Epy a écrit :  Cram est devenu expert en grappes RAID !

Hélas, pas encore !! mais j'y travaille, faut bien...Rolleyes

Il y a des dates à 2011 qui trainent dans les infos sur la grappe:
Code :
Creation Time : Tue Mar  8 17:49:22 2011

Ca commence à être vieux, et ce ne serait pas étonnant que les autres disques soient également "fragiles"...

A moins que ce soit juste la date de la toute première installation. Jean83: date d'achat ? pas de changement de disques depuis ?

@surveiller donc en effet.

VHS-4 VX "sesame"
* Intel® Core i7 4770s @ 3.9 GHz | 16 Go DDR3
* 4x4To WD40EFRX - RAID 5 | OS VHT v 6.1.4
[Image: wiki:favicon-32.png]Le wiki
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
06-10-2019, 09:09:25
Message : #9
RE: Disque dur en rouge
Ola.

Alors je vais essayer de répondre à tout Smile

Ce NAS ne me sert qu’à stocker mes Films et Séries, le dernier truc que j’ai mis dessus remonte à plusieurs jours.
Les disques ne sont pas vieux, je les aient tous remplacés quand j’ai eu mon problème de RAID (dont j’ai parlé sur le forum) en début d’année il me semble.
Je veux prendre aucuns risques avec mon RAID, surtout que maintenant la société est en liquidation, donc si le plus sage est de changer de DD, je le change

VHS 4 Home Édition
OS: 6.1.4
4 x 3To Raid 5
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
06-10-2019, 09:33:43
Message : #10
RE: Disque dur en rouge
Tu as des backups de toutes façons ? ^_^

VHS4 Xtreme II - AMD Athlon II X2 240e
OS: v6.1.3 / RAM: 6 Go / Stockage: 4x 3 To

Wiki de la COMMUNAUTÉ
Qu'est-ce que GNU/Linux
Trouver tous les messages de cet utilisateur
Citer ce message dans une réponse
Poster une réponse 


Aller à :




Contact | Ve-hotech | Retourner en haut | Retourner au contenu | Version bas-débit (Archivé) | Syndication RSS