W lutym pisałem o problemach z transferem między hostami z ESXi a macierzami. Link
Po zamknięciu zgłoszenia zapomniałem dopisać jak się cała sprawa zakończyła[: Oficjalna odpowiedź od inżyniera drugiego lub trzeciego stopnia jest dość ciekawa.
W przypadku środowisk, w których występują urządzenia posiadające interfejsy FC z różnymi dopuszczalnymi prędkościami należy ustawić na wszystkich urządzeniach maksymalną prędkość równą wartości najwolniejszego interfejsu.
Można też stworzyć zony tak by urządzenia końcowe z szybszym HBA nie miały dostępu do urządzeń posiadających wolniejsze HBA.
W innym przypadku mogą nastąpić problemy z transferem między urządzeniami.
W moim środowisku tworzenie zone nie było możliwe. Obecnie wszystkie hosty z kartami FC 4G i 8G są w jednym klastrze i muszą mieć dostęp do macierzy FC z int. 4G i 8G. Dlatego ostatecznie na wszystkich hostach prędkość interfejsów FC zostało ograniczone do 4G. Podczas dodatkowych testów udało się ustalić, że obniżenie prędkości interfejsów po stronie nowszych macierzy FC nie było wymagane. Obecnie po czterech – pięciu tygodniach od zamknięcia zgłoszenia całe środowisko działa stabilnie.
Czasem zdarzają się sytuacje, w których przy stosunkowo małym ruchu występują spore opóźnienia lub problemy w dostępie do macierzy. Sama diagnostyka zazwyczaj zaczyna się od analizy wykresów dostępnych w vCenter lub sprawdzenia wyników esxtop na konkretnym hoście. Na podstawie zebranych danych często próbujemy przenieść cześć maszyn na inne LUNy czy optymalizować konfigurację kontrolerów dostępnych na określonych macierzach. Podczas procesu optymalizacji warto lub nawet trzeba przeglądnąć log vmkernel. W logu tym zapisywane są komunikaty scsci device NMP error, które mogą nam ułatwić analizę problemów występujących w naszym środowisku.
Jak analizować błędy NMP?
Każdy wpis dotyczący błędów NMP zawiera kilka istotnych elementów:

-
Data i godzina wystąpienia błędu, tutaj warto pamiętać, że hosty (ESXi) korzystają z czasu UTC.
-
Identyfikator problematycznego LUNu (naaID). W celu pozyskania dodatkowych informacji na temat określonego urządzenia możemy skorzystać z vClienta lub narzędzi CLI. Np. esxcli storage core path list -d <naaID> zwróci nam dokładniejsze informacje o LUNie o okreslonym naaID.
-
Status code – ogólny identyfikator problemu określający, który komponent/urządzenie zwróciło błąd:
-
H – błąd po stronie hosta
-
D – błąd zwrócony przez host docelowy
-
P – błąd wygenerowany przez plugin NMP
Kod 0×0 jest zwracany gdy nie zaobserwowano, żadnego błędu. Przykładowo H: 0×0 mówi nam, że po stronie hosta wszystko działa poprawnie. W zależności od problemów, możemy zaobserwować różne numery błędów:
-
0×2 – nieudane wykonanie określonej komendy, więcej informacji znajdziemy analizując dodatkowy numer (4)
-
0×8 – określone urządzenie jest zajęte i nie akceptuje komend SCSI.
Więcej informacji na temat najczęściej występujących statusów możemy znaleźć bezpośrednio na stronie vmware [
KB1030381].
-
Valid sense data: dodatkowe informacje na temat błędu zwróconego przez określone urządzenie. Przykładowo jeśli urządzenie docelowe zwróci nam status 0×2 oznaczający błędne wykonanie określonej komendy to Valid sense data pozwoli nam określić powód błędu.
-
Pierwszy numer w ciągu to Sense Key, którego opis możemy znaleźć na stronie [
t10.org]
-
pozostałe dwa numery to Additional Sense Code/ ASC Qualifier. Dokładny ich opis można znaleźć na stronie [
t10.org]. Przy czym postać 0xX 0xY zapisana jest w postaci X/Y
Przykładowa analiza
Na wyżej zamieszczonym zrzucie można zobaczyć, że na lunie o id naa.600cf….. wystąpił błąd o identyfikatorze H:0×0 D:0×2 P:0×0 – problem po stronie urządzenia docelowego. Status 0×2 – nie udało się poprawnie wykonać komendy po stronie macierzy. Dodatkowy kod 0×0 0×47 0×0 zgodnie z opisem na stronie [t10.org] wskazuje:
-
sense code 0×0 – brak jakiegoś specyficznego błędu, wymagane sprawdzenie dodatkowych pól
-
additinal sense code 0×47 / ACS 0×0 – 47/00 SCSI PARITY ERROR – w zależności od konfiguracji problem może być związany nie z samym kontrolerem lecz z kablami lub urządzeniami występującymi między hostem a macierzą.
Konkluzje
Tak, wiem, po co analizować tak głęboko logi i studiować dokumentacje? Przecież od tego jest wsparcie techniczne.
Primo – warto wiedzieć gdzie mamy zgłosić błąd (H: 0×0 D:0×2 P:0×0 – błąd po stronie macierzy, otwarcie zgłoszenia w na stronie VMware zakończy się odbiciem do producenta macierzy[: ) Zamiast marnować czas na odbijanie piłeczki, warto wiedzieć gdzie pisać w pierwszej kolejności.
Secundo – jeśli skończy się nam wsparcie lub proces rozwiązania zgłoszenia będzie zbyt długi, warto mieć podstawowe informacje na temat problemu. Będziemy wiedzieli kiedy konsultant gra na zwłokę, a może własnymi siłami uda się rozwiązać problem.
Jest nowa infrastruktura SAN, w której Blade HP mają nowe karty HBA QMH2652. Wszystko fajnie, wreszcie dostęp do macierzy po 2x8GB. Niby miało być szybciej, niby wydajniej a w statystykach opóźnienie większe niż na macierzach iSCSI. Wymian gibików, kabli, switchy czy uaktualnienie firmware dalej nie pomaga.
Jeśli jakimś cudem na sporej ilości serwerów, które korzystają z LUNów rozrzuconych po różnych macierzach, otrzymujecie w logu vmkernel powiadomienia H:0×02 D:0×0 P:0×0 lub H:0×0 D:0×47 P:0×0 to czasem jedynym rozwiązaniem może być ograniczenie przepustowości na danym porcie z 8Gb na 4Gb. A i tutaj warto pamiętać, że na kartach dwuportowych obniżenie prędkości może być konieczne tylko na jednym z portów. Swoja drogą na razie nie dotarłem do prawidłowego rozwiązania tego problemu, tak więc cdn…
Kilka tygodni temu VMware wypuścił na rynek nową wersję vSphere 5.0. Jak to zwykle bywa trzeba się będzie uaktualnić w kwestii certyfikacji. W związku z tym (ku pamięci) podrzucam trochę informacji na temat nowych limitów, które udało mi się wykopać na stronie vmware.com
Co nowego niesie Virtual Machine Hardware 8?
VMware jeszcze bardziej przygotowujemy się pod wspieranie modnej “chmury”. Obecnie możemy stworzyć maszynę wirtualną, która:
-
ma do 32 wirtualnych procesorów
-
korzysta z 1011GB pamięci operacyjnej <- pozostałe resztki z 1TB wykorzystywane są przez hypervisor (aktualnie ESXi 5.0) na potrzeby zarządzania maszyną.
-
posiada wsparcie dla USB 3.0 <- na obecną chwilę urządzenie musi być podpięte za pomocą klienta vmware. Urządzenia USB 3.0 podpięte bezpośrednio do serwera, na którym zainstalowany jest ESXi 5.0 nie jest wspierane.
-
podczas startu maszyna wirtualna może wykorzystać UEFI
-
wykorzystywać programowe wsparcie 3D
Co nowego niesie VMFS-5?
-
Panowie z VMware zrezygnowali z obsługi kilku różnych wielkości bloków (1,2,4,8MB). Wcześniej aby utworzyć maszyny z odpowiednio dużym pojedynczym dyskiem musieliśmy zdecydować jaką wielkość bloku chcemy obsługiwać. Obecnie, niezależnie od wielkości obsługiwanego pliku, zawsze wykorzystywany jest blok 1MB.
-
W wcześniejszej wersji vmfs pojedynczy wolumen rozszerzony mógł mieć maksymalną wielkość poniżej 2TB. Obecnie maksimum jest w okolicach ~60TB. Maksymalna wielkość VMDK nadal pozostaje równa 2TB – 512B.
-
Zmniejszenie wielkości sub-bloków z 64KB do 8KB. Przydatne w przypadku plików mniejszych od 8KB.
-
Zwiększenie ilości obsługiwanych plików > 100,000.
-
Poprawiono obsługę blokad zakładanych na plikach maszyn wirtualnych.
-
Maksymalna wielkość passthru RDMs zwiększyła się do ~60TB.
W przypadku aktualizacji VMFS z 3.0 do 5.0 warto pamiętać, że datastore nadal będzie obsługiwał różne wielkości bloku, subblock zostaje na poziomie 64KB a limit ilości plików nie zostanie zwiększony. VMFS 5.0 po aktualizacji nadal będzie wykorzystywał MBR, dopiero gdy wolumen wzrośnie powyżej 2TB system sam przełaczy się na GPT. Samo przełączenie nie będzie miało wpływu na maszyny wirtualne. Zaktualizowana partycja będzie zaczynać się od 128 sektora (nowe od 2048).
Na forum vmware jak i w KB różne osoby zalecają tworzenie nowych partycji i migrację na nie działających maszyn. Oczywiście nie zawsze możemy sobie na to pozwolić:/
[EDIT] Trochę więcej o limitach VMFS-5, które opisałem powyżej mamy na blogu vmware
Jak doszukam się czegoś więcej o limitach to postaram się o tym napisać. Z pewnych względów limity trzeba znać
Jakoś od kilku miesięcy co pewien czas zastanawiam się nad kolejnym postem ale z braku czasu jakoś nie mogę się zmobilizować do napisania czegoś więcej. Na początek, czy też koniec sierpnia podrzucam trochę informacji na temat konwersji kluczy licencyjnych
Ostatnio popełniłem kolejny błąd i na szybko zainstalowałem stanowiska na sale laboratoryjne z pierwszej płyty z w7, którą miałem pod ręką. Po rozklonowaniu maszyn okazało się, że dziwnym trafem systemy nie chcą się przypiąć do serwera KMS. Z względu na spore zmęczenie, zszedłem z diagnozą do pakietów sieciowych, które powinien otrzymać serwer. Jak się okazało, przez przypadek zainstalowałem systemy z wersji retail. Po pewnym czasie dokopałem się do sposobu konwersji wersji retail na wersje vlk.
O dziwo konwersja jest banalna. Wystarczy do systemu wklepać nowy klucz produktu, który został opublikowany na technecie:
Windows 7 Professional FJ82H-XT6CR-J8D7P-XQJJ2-GPDD4
Windows 7 Professional N MRPKT-YTG23-K7D7T-X2JMM-QY7MG
Windows 7 Enterprise 33PXH-7Y6KF-2VJC9-XBBR8-HVTHH
Windows 7 Enterprise N YDRBP-3D83W-TY26F-D46B2-XCKRJ
Windows 7 Enterprise E C29WB-22CC8-VJ326-GHFJW-H9DH4
Windows Server 2008 R2 HPC Edition FKJQ8-TMCVP-FRMR7-4WR42-3JCD7
Windows Server 2008 R2 Datacenter 74YFP-3QFB3-KQT8W-PMXWJ-7M648
Windows Server 2008 R2 Enterprise 489J6-VHDMP-X63PK-3K798-CPX3Y
Windows Server 2008 R2 for Itanium-Based Systems GT63C-RJFQ3-4GMB6-BRFB9-CB83V
Windows Server 2008 R2 Standard YC6KT-GKW9T-YTKYR-T4X34-R7VHC
Windows Web Server 2008 R2 6TPJF-RBVHG-WBW2R-86QPH-6RTM4
Windows Vista Business YFKBB-PQJJV-G996G-VWGXY-2V3X8
Windows Vista Business N HMBQG-8H2RH-C77VX-27R82-VMQBT
Windows Vista Enterprise VKK3X-68KWM-X2YGT-QR4M6-4BWMV
Windows Vista Enterprise N VTC42-BM838-43QHV-84HX6-XJXKV
Windows Server 2008 Datacenter 7M67G-PC374-GR742-YH8V4-TCBY3
Windows Server 2008 Datacenter without Hyper-V 22XQ2-VRXRG-P8D42-K34TD-G3QQC
Windows Server 2008 for Itanium-Based Systems 4DWFP-JF3DJ-B7DTH-78FJB-PDRHK
Windows Server 2008 Enterprise YQGMW-MPWTJ-34KDK-48M3W-X4Q6V
Windows Server 2008 Enterprise without Hyper-V 39BXF-X8Q23-P2WWT-38T2F-G3FPG
Windows Server 2008 Standard TM24T-X9RMF-VWXK6-X8JC9-BFGM2
Windows Server 2008 Standard without Hyper-V W7VD6-7JFBR-RX26B-YKQ3Y-6FFFJ
Windows Web Server 2008 WYR28-R7TFJ-3X2YQ-YCY4H-M249D
Oczywiście wykorzystując, skrypt slmgr.vbs, można taką czynność zautomatyzować:
slmgr.vbs /ipk <Klucz produktu>
Super, wreszcie mniej przycisków, mniej okien, mniej miejsca na zakładki, tylko czy aby nie za bardzo pousuwano wszystkie opcje?? IE 8 wprowadziło dość prosty interfejs, potem Firefox uprościł swoje belki, następnie wpadło chrome z kartami na pasku górnym i innymi uproszczeniami. Teraz wyszło IE 9 i niby wygląda prosto i ładnie, dużo przestrzeni na wyświetlanie treści stron. Niestety brak niektórych opcji może czasem denerwować użytkownika.
Czy ktoś kojarzy może checkbox “Pytaj przy każdym otwarciu pliku”, który występował w Internet Explorer 8 podczas próby dostępu do pliku? Tak, rzadko kto go odznacza, ponieważ 90% użytkowników chce być każdorazowo pytanym co zrobić z plikiem. Obecnie w IE 9 ta opcja się nie pojawia:/
Obejściem problemu jest dodanie odpowiednich kluczy do rejestru w lokalizacji HKEY_CURRENT_USER\Software\Microsoft\Windows\Shell\AttachmentExecute\{0002DF01-0000-0000-C000-000000000046}. Poniżej kilka przykładowych kluczy (DWORD32), które możemy wstawić:
-
"Excel.Sheet.8"=hex(0) <- arkusz xls
-
"PowerPoint.Show.8"=hex(0) <- prezentacja ppt
-
"Word.Document.8"=hex(0) <- dokument doc
-
"Excel.Sheet.12"=hex(0) <- arkusz xlsx
-
"PowerPoint.Show.12"=hex(0) <- prezentacja pptx
-
"Word.Document.12"=hex(0) <- dokument docx
Po dopisaniu w/w kluczy podstawowe dokumenty biurowe będą się otwierać w oknie przeglądarki. Zmiana wartości kluczy na 1 wymusi pobieranie dokumentów.
Wczorajsza aktualizacja sygnatur nod32 o numerze 5757 powoduje niestabilne zachowanie stacji roboczych i serwerów. Po zaktualizowaniu bazy wirusów do wersji 5758 wszystko wraca do normy.
Prawdopodobnie podczas skanowania plików nod32 generował memory leak. Przynajmniej tyle udało mi się zauważyć na kilku serwerach.
W przypadku Windows Server 2008 problem jest trochę mniej zauważalny bo w głównych logach Aplikacje/System nie ma zbyt dużo informacji. Jedynie drobna informacja o restarcie usługi (The Eset Service service terminated unexpectedly. It has done this 1 time(s). The following corrective action will be taken in 0 milliseconds: Restart the service). W przypadku Windows Server 2k3 w logach systemowych można zobaczyć błędy o numerze 2019 (The server was unable to allocate from the system nonpaged pool because the pool was empty.)
Jeśli użytkownicy skarzą się na problemy z wolno działającym sprzętem, blokowaniem dostępu do internetu, zawieszaniem się aplikacji, komunikaty o problemie z alokacją pamięci, etc. To sprawdźcie czy aby baza klienta nie jest w wersji 5757. W przypadku stacji roboczych najszybszą metodą naprawy braku pamięci jest ponowne uruchomienie stacji, wtedy nod32 powinien pobrać najnowszą bazę wirusów.
@Edit: Forum ESET powoli się zapełnia podobnymi problemami:)
@Edit 2: Problem pojawiał się już przy wcześniejszych wersjach sygnatur, ale chyba nie był aż tak widoczny.
Ostatnio kilkakrotnie spotkałem się z pytaniem: Dlaczego mimo upływu ustawionego ostatecznego terminu instalacji aktualizacji (deadline) klient SCCM uruchamia aktualizację dopiero po 2h. Nie jest to żaden błąd w kliencie. Dwu godzinne opóźnienie inst. łatek w 99% przypadków wynika z wymuszenia wykorzystywania czasu UTC. Jeśli nic nie zmienialiśmy w konfiguracji to domyślnie serwer SCCM informuje klienta by skorzysta z czasu UTC podczas weryfikacji czasu wymuszenia. W przypadku naszego kraju czas UTC jest przesunięty o tajemnicze dwie godziny ;]
Oczywiście można to zmienić:
-
Rozwijamy Deployment Management (1)
-
Wybieramy właściwości ogłoszenie, które nas interesuje (2)
-
Przechodzimy do zakładki Display/Time Settings (3)
-
Wybieramy czas lokalny (Current Time) (4)

Wpis czysto informacyjny
Może, ktoś dzięki niemu uniknie spędzania kilku dodatkowych godzin na przekonfigurowanie macierzy i odzyskiwaniu kopi zapasowych.
Jeśli macie w swojej firmie/domowym labie macierz, na której planujecie utworzyć dość pokaźny LUN na potrzeby VMware to pamiętajcie, że pojedynczy LUN nie może być większy niż 2 TB. Szczególnie warto o tym pamiętać gdy ktoś rozszerza już istniejący LUN, który był wcześniej mniejszy od 2TB.
Dlaczego tylko 2TB?
Wolumen vmfs może mieć maksymalnie 64TB, niestety (przeczytane na forum vmware) pod VMFS siedzi sobie LVM, którego limit rozmiaru dysku (w naszym przypadku LUN) wynosi 2TB. Dlatego jeśli chcemy posiadać datastore o pojemności większej niż 2TB to musimy:
- po stronie macierzy wystawić kilka LUNów o pojemności do 2TB,
- po stronie vCenter tworzymy sobie jeden duży datastore, który agreguje wszystkie utworzone wcześniej LUNy.
Jeśli postąpimy na przekór zaleceniom i rozszerzymy już istniejący LUN to podczas próby rozszerzania/usuwania datastore dostaniemy komunikat błędu dostępu do wybranej partycji (: Wtedy pozostaje nam przenieść wszystkie maszyny na inny datastore (całe szczęście działa vMotion) i zakładać LUN od nowa.
@Update
Hmm, udało się nawet znaleźć odpowiedni opis na stronie KB vmware link.
Internet Explorer ma bardzo fajnie zaprojektowany mechanizm ulubionych stron. Podczas dodawania strony do ulubionych IE tworzy skrót do wybranej strony w katalogu “c:\Użytkownicy\Login\Ulubione” . W sumie dość prosty mechanizm, który się sprawdza. Niestety jeśli przez przypadek użytkownik utraci prawo zapisu w swoim folderze to przeglądarka zachowuje się bardzo ciekawie
W przypadku IE 7.0 dostaniemy komunikat:

Przyznam się, że gdy po raz pierwszy zobaczyłem ten błąd to spędziłem trochę czasu nad wygłówkowanie co jest nie tak. Dopiero po kilku próbach udało się znaleźć przyczynę.
Idąc z duchem czasu przy okazji świątecznej aktualizacji domowego desktopa uaktualniłem IE z wersji 8 na 9. Nowsza wersja, co prawda jeszcze beta, powinna działać lepiej
Zachowanie 9.0 jest dość ciekawe:
- Jeśli użytkownik stracił całkowicie uprawnienia do folderu ulubione, to podczas przeglądania ulubionych lub dodawania nowych stron dostaniemy komunikat o braku uprawnień i prośbę o ich zmianę.
- Jeśli użytkownik jest właścicielem katalogu to IE uzupełni uprawnienia, które są potrzebne.
- Jeśli natomiast użytkownik nie będzie właścicielem folderu ale będzie miał prawa do odczytu to przeglądarka nie wyrzuci żadnego błędu oraz nie doda strony do ulubionych.
Uwaga zgłoszona więc pozostaje mieć nadzieję, że wreszcie zostanie to poprawione i miejmy nadzieje, że zamiast nieokreślonego błędu pojawi się komunikat o braku uprawnień na folderze ulubione.
Ostatnie Komentarze