خطای سرور یکی از شایع ترین مشکلاتی است که سرورها با آن دست وپنجه نرم می کنند. این خطاها در اثر عواملی همچونکه اشتباه صورت می گیرد، باگ های نرم افزاری، مشکلات سخت افزاری و… رخ می دهند.
در این پست آموزشی از قصد داریم در رابطه با انواع خطاهای سرور باهم به گفتگو بپردازیم و با آن ها آشنا شویم. لازم به ذکر است که بیشتر تمرکز ما در این مقاله خطای سرور hp خواهد بود.
فهرست مقاله
انواع خطای سرور HP
به صورت کلی دو نوع خط سرور وجود دارند که مابقی خطاها را درخود جای می دهند. این دو نوع خطا عبارتند از:
- خطای غیر عددی
- خطای عددی
پیام ها و کد خطای سرور hp به همراه تمامی پیام هایی که سرورها هنگام شروع کار با آن موجه می شوند و در اولین تست بوت شدن (Power On Self Test) یا به اختصار POST ارائه می دهند، در این قسمت گنجانده شده است.
بیشتر خطاهایی که سرور در حالت POST بروز می دهد، قبل از اینکه سیستم عامل را لود کرده باشد از خود یک کد نشان می دهند که با استفاده از این قطعه کد می توان به رفع مشکل خطای سرور پرداخت. برخی از این پیام ها فقط برای اهداف اطلاعاتی هستند و نامعتبر هستند.
یک نکته مهم:
ما در این مقاله در رابطه با بیشتر خطاهای سرور اچ پی از مدل های مختلف آن به گفتگو می پردازیم و امکان مطرح کردن خطاهای همه سرورهای اچ پی در یک مقاله امکان پذیر نیست و ممکن است خطاهایی موجود باشند که در این مقاله به آن ها اشاره نشده باشد.
یک نکته مهم:
خواندن مستندات شرکت سازنده سرور و کمک گرفتن از افراد و شرکت های تخصصی مانند مشاوران در هنگام ، رویارویی با خطاهای رایج، بهترین راه برای مقابله با این مشکلات است. تماس
خطای سرور HP از نوع غیر عددی
سرورهای اچ پی پر استفاده برترین سرورها در بازار هستند و گاهی این سرورها با مشکلات و خطاهایی مواجه میشوند. در این بخش به بررسی این خطاها خواهیم پرداخت که خود در دسته های مختلفی قرار می گیرند:
- متن پیام خطا: Advanced Memory Protection mode: Advanced ECC
- تعداد بوق هایی که سرور میزند: هیچ
- علت خطا: پشتیبانی از Advanced ECC در حالت فعال قرار دارد.
- اقدام لازم برای رفع آن: هیچ
- متن پیام خطا: Advanced Memory Protection mode: Advanced ECC with hot-add support
- تعداد بوق هایی که سرور میزند: هیچ
- علت به وجود آمدن خطا: پشتیبانی از Advanced ECC با Hot-Add فعال است
- اقدام لازم برای رفع آن: هیچ
- متن پیام خطا: Advanced Memory Protection mode: Online spare with Advanced ECC
- تعداد بوق هایی که سرور میزند: هیچ
- دلیل خطا: خطای سرور اچ پی ذکرشده نشان می دهد که Online Spare Memory در سرور فعال است.
- اقدام لازم برای رفع آن: هیچ
- متن پیام خطا: Advanced Memory Protection mode: Multi-board mirrored memory with Advanced ECC
- تعداد بوق هایی که سرور میزند: هیچ
- چرا خطا وجود دارد: نشان از فعال بودن Mirrored Memory در سرور را می دهد.
- اقدام لازم برای رفع آن: هیچ
- متن پیام خطا: Advanced Memory Protection mode: RAID memory with Advanced ECC
- تعداد بوق هایی که سرور میزند: هیچ
- مشکل چیست: نشان از فعال بودن RAID Memory در سرور را می دهد.
- اقدام لازم برای رفع آن: هیچ
خطای Unexpected Shutdown در سرور
همان طور که از نام آن معلوم است این خطا در اثر خاموش شدن های اتفاقی و غیرمنتظره رخ می دهد که جزئیات آن به صورت زیر است.
- متن پیام خطا: An Unexpected Shutdown occurred prior to this power-up
- تعداد بوق هایی که سرور میزند: هیچ
- خطا در چه موردی است: می تواند نشانی از خرابی سیستم عامل یا لاگ سیستم باشد.
- اقدام لازم برای رفع آن: به روزرسانی سیستم عامل در صورت مکرر بودن خطا
این خطای سرور اچ پی یک خطای مهلک است که در اثر عوامل مختلفی به وجود می آید.
- متن پیام خطا: Critical Error Occurred Prior to this Power-Up
- تعداد بوق هایی که سرور میزند: هیچ
- دلیل خطا: در اثر خطاهای مهلک اتفاق می افتد که علت آن نیاز به بررسی کارشناسی دارد.
- اقدام لازم برای رفع آن: اجرای Insight Diagnostics برای یافتن خطا و رعایت کردن دستورالعمل های آن برای رفع خطا.
این خطای سرور در سروهای اچ پی و سایر مدل های دیگر سرور مربوط به خطاهای فن و عدم کار کردن آن به درستی است که به صورت زیر هستند:
- متن پیام خطا: Fan Solution Not Fully Redundant
- تعداد بوق هایی که سرور میزند: هیچ
- علت به وجود آمدن خطا: ازکارافتادن برخی از فن ها و یا نصب نبودن برخی از آن ها.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کرد و دستورالعمل های مربوط به آن اجرا کرد. ممکن است نیاز به نصب فن به صورت سخت افزاری باشد.
- متن پیام خطا: Fan Solution Not Sufficient
- تعداد بوق هایی که سرور میزند: هیچ
- مشکل کجاست: تعداد فن ها برای پشتیبانی از خنک کردن سرور کافی نیست. ممکن است فن ها از کار افتاده باشند.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کرد و دستورالعمل های مربوط به آن اجرا کرد. ممکن است نیاز به نصب و جایگزینی فن ها داشته باشید.
منبع:
- متن پیام خطا: Fatal DMA Error
- تعداد بوق هایی که سرور میزند: هیچ
- سبب خطا چیست: این خطا همان طور که گفته ده مرتبط با کنترل کننده DMA است که منجر به خطای NMI شده است.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و دستورالعمل های مربوط را برای جایگزینی اجزای خراب اجرا کنید.
این خطای سرور hp مربوط به خرابی پورت های PCI Express است که جزئیات آن به صورت زیر است:
- متن پیام خطا: Fatal DMA Error
- تعداد بوق هایی که سرور میزند: هیچ
- چ چیزی موجب خطا شده: این خطا نشان از خرابی یکی از پورت های PCI Express است که به NMI منجر شده است.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و دستورالعمل های مربوط به PCI Express را باید پیروی کنید و تابلوهای ناموفق PCI Express را باید جایگزین یا دوباره نصب کنید.
- متن پیام خطا: Fatal Front Side Bus Error
- تعداد بوق هایی که سرور میزند: هیچ
- علت به وجود آمدن خطا: این خطا مربوط به خرابی در Fatal Front Side Bus Error پردازنده است.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و دستورالعمل های مربوط به و باید پردازنده های خراب شده را پیدا کنید و آن ها را جایگزین کنید.
- متن پیام خطا: Fatal Global Protocol Error
- تعداد بوق هایی که سرور میزند: هیچ
- چرا خطا بوجود آمده: خطای مربوط به پروتکل Fatal Global.
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و اجزای خراب شده را جایگزین کنید.
این خطای سرور اچ پی مربوط به رابط هاب های خراب شده است که جزئیات آن به صورت زیر است:
- متن پیام خطا: Fatal Hub Link Error
- تعداد بوق هایی که سرور میزند: هیچ
- علت به وجود آمدن خطا: نقض در رابط پیوندهای هاب
- اقدام لازم برای رفع آن: Insight Diagnostics را باید برای آن اجرا کنید و اجزای خراب شده را جایگزین کنید.
مشکلات مربوط به ROM است که ممکن است به درستی برنامه نویسی نشده باشد.
- متن پیام خطا: FATAL ROM ERROR: The System ROM is not Properly Programmed.
- تعداد بوق هایی که سرور میزند: اول یک بوق بلند- بعد یک بوق کوتاه
- نقص در چیست: نقض در برنامه نویسی ROM
- اقدام لازم برای رفع خطا: باید ROM فیزیکی تعویض گردد
- متن پیام خطا: Fibre Channel Mezzanine/Balcony Not Supported
- تعداد بوق هایی که سرور میزند: دو بوق کوتاه میزند
- دلیل خطا: عدم پشتیبانی Fiber Channel توسط سرور
- اقدام لازم برای رفع خطا: باید آداپتور Fiber Channel مورد پشتیبانی را نصب کرد.
خطای درجه حرارت بالا در سرور hp
همان طور که از نام آن معلوم است این خطا مربوط به ترم شدن بیش ازحد سرور است که در این حالت نیز خطا نشان می دهد.
- متن پیام خطا: High Temperature Condition detected by Processor X
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- علت ارور: دمای بیش ازحد استاندارد و نبود فن کافی یا خرابی فن ها جهت خنک کردن سی پی یو
- اقدام لازم برای رفع خطا: بازگرداندن سرور به حالت نرمال و نصب کردن فن های بیشتر یا تعویض فن ازکارافتاده سرور.
این خطای سرور یکی از خطاهای نرم افزاری در سرور اچ پی است که ربطی به سخت افزار ندارد. جزئیات بیشتر به صورت زیر است.
- متن پیام خطا: Illegal Opcode – System Halted
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- علت به وجود آمدن خطا: وارد شدن سرور به حالت Illegal Operator Handler به علت خطاهای نرم افزاری
- اقدام لازم برای رفع خطا: Diagnostics را باید برای آن اجرا کنید و اجزای خراب شده نرم افزاری را جایگزین کنید.
- متن پیام خطا: iLO Generated NMI
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- مشکل از چیست: تولید خطای NMI توسط کنترل کننده iLO
- اقدام لازم برای رفع خطا: بررسی گزارش های iLO در سیستم.
- متن پیام خطا: Internal CPU Check – Processor
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- خطای بوجود آمده: خطای داخلی مربوط به پردازنده ها
- اقدام لازم برای رفع خطا: Diagnostics را باید برای آن اجرا کنید و اجزای خراب شده را جایگزین کنید. پردازنده های PPM اغلب منجر به رخداد این خطا می شوند.
این خطا مربوط به حافظه های نامعتبر است که جزئیات آن به صورت زیر است.
- متن پیام خطا: Invalid memory types were found on the same node. Please check DIMMcompatibility. Some DIMMs may not be used
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- مشکل مربوط به چیست: سرور حافظه های نامعتبری را شناسایی کرده است.
- اقدام لازم برای رفع خطا: باید حافظه های معتبری نصب شود که در راهنمای حافظه سرور به آن اشاره شده است.
- متن پیام خطا: Invalid Password – System Halted!
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- علت ارور: واردکردن رمز عبور نامعتبر در سیستم بایوس که منجر به این خطا می شود.
- اقدام لازم برای رفع خطا: بازیابی رمز عبور معتبر و وارد کردن رمز عبور به درستی.
خطای شماره 2: System Restricted
- متن پیام خطا: I Invalid Password – System Restricted!
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- سبب خطا: واردکردن رمز عبور وارد اشتباه برای سرود به سیستم
- اقدام لازم برای رفع خطا: باید رمز عبور درست وارد شود.
- متن پیام خطا: Memory found on unpopulated Node.? Processor is required to be installed for memory to be used.
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- مشکل از کجاست: عدم نصب پردازنده ها در سوکت مربوطه برای استفاده از DIMM
- اقدام لازم برای رفع خطا: نصب پردازنده ها در سوکت مربوطه.
خطای Mixed Processor Speed در سرور hp
- متن پیام خطا: Mixed processor speeds detected. Please make sure that all processors are the same speed.? System Halted!
- تعداد بوق هایی که سرور میزند: ابتدا یک بوق بلند و به دنبال آن یک بوق کوتاه
- دلیل اشتباه: عدم پشتیبانی از پردازنده ها با سرعت های متفاوت
- اقدام لازم برای رفع خطا: مراجعه به مستندات سرور و نصب پردازنده های پشتیبانی شده- به صورت کلی استفاده از پردازنده هایی با سرعت یکسان.
خطای سرور مربوط به کیبورد
- متن پیام خطا: Network Server Mode Active and No Keyboard Attached
- تعداد بوق هایی که سرور میزند: بوق نمی زن
- مشکل چیست: وصل نبودن صفحه کلید به سرور
- اقدام لازم برای رفع خطا: چک کردن اتصال صفحه کلید به سرور.
خطاهای Nmi سروهای اچ پی
خطاهای Nmi معمولاً مربوط به وقفه های سخت افزاری است که در سرورهای اتفاق می افتد.
خطای شماره 1: Button Pressed
- متن پیام خطا: NMI – Button Pressed!
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- دلیل خطا و اشتباه: احتمالاً دکمه مربوط به NMI زده شده است و حافظه جهت تجزیه و تحلیل تخلیه شده است.
- اقدام لازم برای رفع خطا: راه اندازی مجدد سرور.
خطای شماره 2: Undetermined Source
- متن پیام خطا: NMI – Undetermined Source
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- خطا در چیست: یک وقفه NMI اتفاق افتاده است.
- اقدام لازم برای رفع خطا: راه اندازی مجدد سرور.
این خطا معمولاً مربوط به تنظیمات حافظه است که جزئیات بیشتر آن به صورت زیر است:
- متن پیام خطا: Node Interleaving disabled – Invalid memory configuration
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- مشکل سرور چیست: یکسان نبودن تنظیمات حافظه در گره ها.
- اقدام لازم برای رفع خطا: پیکربندی یکسان حافظه در گره ها و فعال کردن interleaving را در RBSU.
خطای Floppy Drive در سرور
این خطا مربوط به مشکلات دیسک است که جزئیات آن به صورت زیر است.
- متن پیام خطا: No Floppy Drive Present
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- علت به وجود آمدن خطا: نصب نبودن درایو دیسک و یا خراب بودن آن.
- اقدام لازم برای رفع خطا: خاموش کردن سرور، جایگزین یا غصب کردن درایو دیسک، راه اندازی مجدد سرور.
- متن پیام خطا: Parity Check 2 – System DIMM Memory
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- دلیل وجود خطا چیست: اتفاق افتادن خطاهای غیرقابل اصلاح در DIMM.
- اقدام لازم برای رفع خطا: باید در این شرایط Insight Diagnostics را اجرا کرده و خطاهای مربوط به DIMM ها را بیابید. پس از یافتن خطاها با بررسی چراغ های ال ای دی DIMM باید DIMM را بیابید و آن را جایگزین کنید.
- متن پیام خطا: PCI Bus Parity Error, PCI Slot x
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- اشتباه کجاست: ایجاد خطای برابری توسط دستگاه PCI در گذرگاه های PCI.
- اقدام لازم برای رفع خطا: دو راه وجود دارد 1_ برای PCI هایی که به صورت افزونه اند باید کارت مربوط به آن را بردارید. 2_ برای PCI های تعبیه شده باید Insight Diagnostics اجرا کرده و دستورالعمل های جایگزینی قطعه خراب شده را اجرا کنید.
خطای PCI Slot Power
- متن پیام خطا: Power Fault Detected in Hot-Plug PCI Slot x
- تعداد بوق هایی که سرور میزند: با این خطا سرور دو بوق کوتاه میزند.
- سبب ارور چیست: Hot Plug PCI-X به درستی تغذیه نمی شود.
- اقدام لازم برای رفع خطا: راه اندازی مجدد سرور.
خطای Power Supply سرور HP
- متن پیام خطا: Power Supply Solution Not Fully Redundant
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- مشکل سرور در کجاست: ازکارافتادن یکی از منابع تغذیه و یا نصب نبودن آن.
- اقدام لازم برای رفع خطا: جایگزینی منابع تغذیه خراب شده و یا نصب کردن منابع نصب شده.
این خطای سرور مربوط به مشکلات پردازنده است که جزئیات آن به صورت زیر است.
- متن پیام خطا: Processor X Unsupported Wattage
- تعداد بوق هایی که سرور میزند: ابتدا بوق بلند، سپس بوق کوتاه
- علت به وجود آمدن خطا: عدم پشتیبانی سرور از پردازنده نصب شده.
- اقدام لازم برای رفع خطا: مراجعه به مستندات سرور برای شناسایی پردازنده های قابل پشتیبانی و حتی به روزرسانی ROM BIOS.
یک از رایج ترین خطاهای سرور hp که مربوط به ROM است و خود به 4 نوع خطا تقسیم می شود:
- متن پیام خطا: REDUNDANT ROM ERROR: Backup ROM Invalid
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- دلیل خرابی چیست: خراب شدن رام پشتیبانی شده در سرو- رام اصلی خراب نیست.
- اقدام لازم برای رفع خطا: اجرای ROMPaq Utility برای فلش کردن سیستم و معتبر سازی رام ها.
- متن پیام خطا: Redundant ROM Detected – This system contains a valid backup system ROM
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- خطا چیست: به خودی خود یک خطا نیست و بیشتر تیک اعلان برای نشان دادن معتبر بودن رام اصلی و پشتیبان است.
- اقدام لازم برای رفع خطا: اقدامی لازم نیست.
- متن پیام خطا: REDUNDANT ROM ERROR: Bootblock Invalid
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- مشکل از چیست: خرابی بوت بلوک ROM.
- اقدام لازم برای رفع خطا: کمک گرفتن از ارائه دهنده خدمات سرور حرفه ای.
- متن پیام خطا: REDUNDANT ROM ERROR: Primary ROM invalid. Booting Backup ROM
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- علت خرابی از کجاست: خرابی ROM اصلی سیستم.
- اقدام لازم برای رفع خطا: اجرای ROMPaq Utility برای بازگرداندن ROM به نسخه صحیح
- متن پیام خطا: Temperature violation detected – system Shutting Down in x seconds
- تعداد بوق هایی که سرور میزند: ابتدا یک بوق بلند و سپس یک بوق کوتاه میزند.
- دلیل خطا در سرور: رسیدن سیستم به دمای احتیاطی و خاموش شدن آن پس از x ثانیه.
- اقدام لازم برای رفع خطا: نصب فن های کافی و تعمیر فن های ازکارافتاده برای خنک نگه داشتن سرور
- متن پیام خطا: There must be a first DIMM in pair if second DIMM in pair is populated. Second DIMM in pair ignored
- تعداد بوق هایی که سرور میزند: بوق نمی زند.
- چه خطایی وجود دارد: عدم شناسایی و پر شدن سوکت های DIMM.
- اقدام لازم برای رفع خطا: پر کردن سوکت های DIMM
خطای Processor Bus Speed سرور
- متن پیام خطا: This system only supports 667 MHz Front Side Bus Speed Processors. یا One or more 800 MHz Front Side Bus Speed Processors have been initialized at 667 MHz. System Halted!
- تعداد بوق هایی که سرور میزند: ابتدا یک بوق بلند، سپس یک بوق کوتاه.
- سبب این خطا : عدم پیکربندی درست پردازنده ها در محدوده مگاهرتزی خود.
- اقدام لازم برای رفع خطا: پیکربندی درست پردازنده ها با توجه به مستندات
خطای سرور HP از نوع عددی
در این بخش به بررسی انواع خطای سرور hp از نوع عددی می پردازیم. این خطاها بیشتر از طریق بوق به کاربر اعلام می شوند.
خطای 101 سرور اچ پی
خطای شـاره 1: Error 101-I/O ROM Error
- متن پیام خطا: Error 101-I/O ROM Error
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- علت به وجود آمدن خطا: خرابی Option ROM در دستگاه های PCI، PCI-X و PCI Express.
- اقدام لازم برای رفع خطا: به به روزرسانی Option ROM دستگاه
خطای شماره 2: 101–ROM Error
- متن پیام خطا: 101-ROM Error
- تعداد بوق هایی که سرور میزند: ابتدا بوق بلند، سپس بوق کوتاه
- دلیل به وجود آمدن خطا: این خطا مربوط به چک کردن رام سیستم است.
- اقدام لازم برای رفع خطا: اجرای Insight Diagnostics و جایگزینی موارد خراب شده در سیستم
خطای شماره 3: System 101-Option ROM Checksum Error
- متن پیام خطا: System 101-Option ROM Checksum Error
- تعداد بوق هایی که سرور میزند: ابتدا بوق بلند، سپس بوق کوتاه
- مشکل چیست: عدم کار کردن درست expansion board
- اقدام لازم برای رفع خطا: برای رفع این خطا باید ابتدا سخت افزارهای اخیر نصب شده را جدا کنید و دوباره بررسی کنید که خطا وجود دارد یا خیر. در صورت ماندگاری خطا، expansion board را دوباره نصب کنید. باز هم در صورت ماندگاری خطا، با یک مرکز خدمات سرور تماس بگیرید.
خطای شماره 102 در سرور اچ پی
یکی دیگر از مشکلات سرور hp که یک نوع خطای سرور به حساب می آیند، خطاهای 102 هستند؛ که در زیر به بررسی آن ها پرداخته ایم:
- متن پیام خطا: Error: 102-System Board Failure
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- خرابی از کجا منشا می گیرد: خراب شدن DMA controllers یا timers و یا قطعات مشابه آن ها
- اقدام لازم برای رفع خطا: تعویض برد سیستم و اجرای server setup utility
نکته: جداسازی برد نیاز به تخصص و مهارت کافی دارد و نباید سرخود کاری انجام داد.
- متن پیام خطا: Error: 102-System Board Failure, CMOS Test Failed
- تعداد بوق هایی که سرور میزند: بوق نمی زند
- دلیل خرابی از چیست: خراب شدن DMA controllers یا timers و یا قطعات مشابه آن ها.
- اقدام لازم برای رفع خطا: تعویض برد سیستم توسط ارائه دهنده خدمات تعمیر سرور.
برای خرید سرور dl380 g10 که جزو پرفروش ترین سرورها در ایران و جهان است به مشخصات فنی آن توجه کنید.