Bug 22265

Summary: Проблемы с контроллером HDD на новых ядрах.
Product: Branch 5.1 Reporter: Ben Aceler <aceler>
Component: kernel-image-std-defAssignee: Michail Yakushin <silicium>
Status: CLOSED WONTFIX QA Contact: QA 5.1 <qa-5.1>
Severity: normal    
Priority: P3 CC: aen, grenka, kharpost
Version: unspecified   
Hardware: all   
OS: Linux   
Bug Depends on:    
Bug Blocks: 19564    

Description Ben Aceler 2009-11-12 16:05:33 MSK
Проблема впервые наблюдалась в ядре 2.6.31 на другом дистрибутиве (https://bugs.launchpad.net/ubuntu/+source/linux/+bug/445852), и я честно подумал, что 30-е ядро в Альте от этого избавлено, но нет...

Симптомы у меня проявляются на SSD, но есть сообщения, что проявляются и на USB и SATA HDD (напр. http://juick.com/aim/349551). Выглядит это так — из системы внезапно исчезают жёсткие диски. Все операции ввода-вывода останавливаются, курсор продолжает ходить, кнопки нажимаются. Если это произошло при загрузке, могут не загрузиться какие-то компоненты системы. На Ext4 ещё и возможны потери данных, на JFS потерь вроде не было.

В dmesg при этом происходит следующее:

[ 1852.992070] ata2: lost interrupt (Status 0x58)
[ 1852.996029] ata2: drained 2048 bytes to clear DRQ.
[ 1853.000217] ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[ 1853.000225] ata2.00: BMDMA stat 0x4
[ 1853.000244] ata2.00: cmd c8/00:08:ef:78:0b/00:00:00:00:00/e0 tag 0 dma 4096 in
[ 1853.000248]          res 58/00:08:ef:78:0b/00:00:00:00:00/e0 Emask 0x2 (HSM violation)
[ 1853.000257] ata2.00: status: { DRDY DRQ }
[ 1853.000305] ata2: soft resetting link
[ 1853.168405] ata2.00: configured for UDMA/66
[ 1853.168427] ata2: EH complete
[ 3653.000085] ata2: lost interrupt (Status 0x58)
[ 3653.004029] ata2: drained 16384 bytes to clear DRQ.
[ 3653.057356] ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[ 3653.057364] ata2.00: BMDMA stat 0x4
[ 3653.057384] ata2.00: cmd c8/00:40:1a:92:d2/00:00:00:00:00/e0 tag 0 dma 32768 in
[ 3653.057389]          res 58/00:40:1a:92:d2/00:00:00:00:00/e0 Emask 0x2 (HSM violation)
[ 3653.057399] ata2.00: status: { DRDY DRQ }
[ 3653.057448] ata2: soft resetting link
[ 3653.228414] ata2.00: configured for UDMA/66
[ 3653.228436] ata2: EH complete


Сейчас два часа гонял ноутбук с ядром 2.6.28 (Ubuntu 9.04) — проблем нет. Т.е. это не проблема оборудования, это бага в ядре.
Comment 1 Ben Aceler 2009-11-12 22:53:02 MSK
Дополнительная информация: оставил машину ничего не делать на день, обнаружил, что сообщения в dmesg появляются ровно раз в полчаса. Из приведённого лога это тоже видно.
Comment 2 Ben Aceler 2009-11-12 23:58:55 MSK
Баг в апстриме:

http://bugzilla.kernel.org/show_bug.cgi?id=14583
Comment 3 Grigory Ustinov 2018-06-29 19:28:13 MSK
Ну раз апстрим WONTFIX, то и мы тоже=)

Проверьте в p8, если актуально.