Skip to main content

zfs-discuss

  • From: < >
  • To:
  • Subject:
  • Date: Tue, 26 Mar 2013 00:14:16 +0000 (GMT)

Hi,

I am writing a new course that is called Fault Analysis and
Troubleshooting that will be offered internally as well as internally.
There is a two-day workshop in the course where "faults" are inserted
into the system by the instructor and the student fixes them. The
faults are of a wide variety - everything from OBP to Zones to AI/IPS
to ZFS. I would like to have more ZFS-specific faults in this course so
that customers can become more familiar with fixing their own zpool/zfs
issues. If you have an idea, please send it my way and I will include
it in the course. The fault should be fairly simple to input, either
with a few short commands or simple script and it's best if the fault
causes some easily seen errors and then is fixed by one or more common
solutions. 

Thanks for your help - see sample below.
-Kristi

Fault: System hangs during boot with MMU error.

Initial Customer Description:
System hangs during boot with an error message containing last trap.

Error Messages or Symptoms:
Boot device: /pci@9/pci@0/pci@0/pci@1,2/LSTLogic,sad@2/disk0,0:a File
and args:
ERROR: Last Trap: Fast Data Access MMU Miss

Probable Causes and Fixes:

    Incorrect OBP settings
    Corrupt or missing boot block on disk
    Corrupt or missing boot archive
    SMF boot-archive not running

Actual Fault Insertion:
# touch /platform/`uname -i`/boot_archive
# reboot

Possible Fixes:

    Check the OBP settings for anything incorrect as in previous
faults.
    Compare the boot block with known good one as in previous faults.
    Check that the service responsible for boot archive is up and
running properly.
    Set the diag-switch variable to true to show the last file loaded
during the boot process to see what might be causing the error:
    ok setenv diag-switch? true
    diag-switch = true
    ok boot
    . . .
    Boot device: /pci@9/pci@0/pci@0/pci@1,2/LSTLogic,sad@2/disk0,0:a
File and args:
    zfs-file-system
    Loading: /platform/SUNW,Sun-Fire-T200/boot_archive
    ERROR: Last Trap: Fast Data Access MMU Miss
    Based on the last file loaded, boot to single user mode, import the
most recent root pool, mount the BE, and remove the boot_archive file
and reboot:
    ok boot:dhcp -s
    # zpool import
    pool: rpool
    id: 15107514267910786750
    state: ONLINE
    status: The pool is formatted using an older on-disk version.
    action: The pool can be imported using its name or numeric
identifier, though
    some features will not be available without an explicit 'zpool
upgrade'.config:

    rpool ONLINE
    mirror-0 ONLINE
    c3t0d0s2 ONLINE
    c3t1d0s0 ONLINE

    pool: rpool
    id: 779908555753120486
    state: ONLINE
    action: The pool can be imported using its name or numeric
identifier.
    config:

    rpool ONLINE
    c3t0d0s0 ONLINE
    # zpool import 779908555753120486
    # mkdir /a
    # beadm list
    be_find_current_be: failed to find current BE name
    BE Active Mountpoint Space Policy Created
    -- ------ ---------- ----- ------ -------
    solaris R - 9.42G static 2000-01-03 03:56
    solaris.orig - - 1.17M static 2000-01-03 06:05
    # beadm mount solaris /a
    # rm /a/platform/`uname -i`/boot_archive
    # reboot
    # reboot

Learning:
Students should learn all about the boot_archive - updating and
rebuilding it, the service that runs it, and its interaction with the
boot process. Also, students should learn about importing the rpool so
that they can mount the boot environment while in single user mode. The
rpool can be mounted with the -f and -F options and students should
learn when to use those options as well as why using zpool import rpool
will not work if a previous rpool exists on the system and must be
specified with the numeric id.


[no subject]

kristi.herd 03/26/2013
 
 
Close
loading
Please Confirm
Close