فلوپس

أداء الحاسب
الاسم الوحدة القيمة
كيلو فلوپس kFLOPS 103
ميگا فلوپس MFLOPS 106
گيگا فلوپس GFLOPS 109
تيرا فلوپس TFLOPS 1012
پيتا فلوپس PFLOPS 1015
إكسا فلوپس EFLOPS 1018
زيتا فلوپس ZFLOPS 1021
يوتا فلوپس YFLOPS 1024
فلوپس بواسطة أكبر حاسب فائق بمرور الزمن

في الحوسبة، عمليات الفاصلة المتحركة في الثانية (FLOPS، فلوپس أو flop/s) هي مقياس لأداء الحاسب والمفيدة في مجالات الحسابات العلمية والتي تتطلب حسابات الفاصلة العائمة. في مثل هذه الحالات، يعتبر مقياساً أكثر دقة من قياس التعليمات في الثانية.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

الفاصلة العائمة الحسابية

الفاصلة العائمة الحسابية مطلوبة من أجل الأرقام الحقيقية الكبيرة جداً أو الصغيرة جداً، أو للحسابات التي تتطلب نطاقاً ديناميكياً كبيراً. تمثيل الفاصلة العائمة يشبه الترميز العلمي، باستثناء أن كل شيء يتم في الأساس الثاني، بدلاً من الأساس العاشر. يخزن مخطط الترميز العلامة، الأس (في الأساس الثاني لـ كراي وڤاكس، الأساس اثنين أو عشرة لتنسيقات آي تربل إي 754 المنقح، والأساس 16 للفاصلة العائمة السداسية العشرية لـ آي‌بي‌إم) والدلالة (الرقم بعد فاصلة الأساس). بينما يتم استخدام العديد من التنسيقات المماثلة، فإن الأكثر شيوعاً هو ANSI/IEEE Std. 754-1985. يحدد هذا المعيار تنسيق الأرقام ذات 32 بت المسماة الدقة المفردة، بالإضافة إلى الأرقام ذات 64 بت المسماة الدقة المزدوجة والأرقام الأطول التي تسمى الدقة الموسعة (تُستخدم للنتائج الوسيطة). يمكن أن تدعم تمثيلات الفاصلة العائمة نطاقاً أكبر بكثير من القيم مقارنة بالفاصلة الثابتة، مع القدرة على تمثيل أعداد صغيرة جداً وأرقام كبيرة جداً.[1]


المدى الديناميكي والدقة

يضمن الأس المتأصل في حساب الفاصلة العائمة نطاقاً ديناميكياً أكبر بكثير - أكبر وأصغر الأرقام التي يمكن تمثيلها - وهو أمر مهم بشكل خاص عند معالجة مجموعات البيانات حيث قد تحتوي بعض البيانات على نطاق كبير للغاية من القيم الرقمية أو حيث النطاق قد تكون غير متوقعة. على هذا النحو، تعتبر معالجات الفاصلة العائمة مناسبة بشكل مثالي للتطبيقات الحسابية المكثفة.[2]

الأداء الحسابي

فلوپس و MIPS هي وحدات قياس لأداء الحوسبة الرقمية للحاسب. تُستخدم عمليات الفاصلة العائمة عادةً في مجالات مثل البحث الحسابي العلمي. تقيس وحدة MIPS أداء عدد صحيح للحاسب. تتضمن أمثلة عملية الأعداد الصحيحة حركة البيانات (A إلى B) أو اختبار القيمة (إذا كان A = B، ثم C). يعد MIPS كمعيار للأداء مناسباً عند استخدام الحاسب في استعلامات قاعدة البيانات أو معالجة الكلمات أو جداول البيانات أو لتشغيل أنظمة تشغيل افتراضية متعددة[3][4]اخترع فرانك إتش مكماهون، من مختبر لورانس ليڤرمور الوطني، المصطلحين فلوپس وMFLOPS (ميگافلوپس) حتى يتمكن من مقارنة أجهزة الحاسب العملاقة في اليوم بعدد حسابات الفاصلة العائمة التي يتم إجراؤها في الثانية. كان هذا أفضل بكثير من استخدام MIPS السائد لمقارنة أجهزة الحاسب لأن هذه الإحصائية عادة ما يكون لها تأثير ضئيل على القدرة الحسابية للجهاز.

يمكن حساب فلوپس على نظام HPC باستخدام هذه المعادلة:[5]

يمكن تبسيط هذا إلى الحالة الأكثر شيوعاً: جهاز حاسب يحتوي على وحدة معالجة مركزية واحدة بالضبط:

يمكن تسجيل فلوپس بمقاييس مختلفة من الدقة، على سبيل المثال، تصنف قائمة الحواسيب العملاقة توپ 500 أجهزة الحاسب بمعدل 64 بت (تنسيق الفاصلة العائمة مزدوج الدقة) في الثانية، والمختصرة إلى "FP64".[6] تتوفر مقاييس مماثلة لعمليات 32 بت (FP32) و 16 بت (FP16).

فلوپس لكل دورة لكل نواة لمختلف المعالجات

فلوپس لكل نواة[7]
الهندسة الدقيقة ISA FP64 FP32 FP16
وحدة المعالجة المركزية لإنتل
Intel 80486 x87 (32-bit) ? 0.128[8] ?
x87 (32-bit) ? 0.5[8] ?
MMX (64-bit) ? 1[9] ?
إنتل P6 Pentium III SSE (64-bit) ? 2[9] ?
إنتل Netburst پنتيوم 4 (ويلاميت، نورثوود) SSE2 (64-bit) 2 4 ?
إنتل P6 Pentium M SSE2 (64-bit) 1 2 ?
SSE3 (64-bit) 2 4 ?
4 8 ?
إنتل آتوم (بونل، سالتول، سلڤرمونت وگولدمونت) SSE3 (128-bit) 2 4 ?
إنتل ساندي بردج (ساندي بردج، أيڤي بردج) AVX (256-bit) 8 16 0
AVX2 & FMA (256-bit) 16 32 0
إنتل Xeon Phi (Knights Corner) IMCI (512-bit) 16 32 0
AVX-512 & FMA (512-bit) 32 64 0
وحدة المعالجة المركزية إيه إم دي
AMD بوب‌كات AMD64 (64-bit) 2 4 0
AVX (128-bit) 4 8 0
AMD K10 SSE4/4a (128-bit) 4 8 0
AMD بلدوزر[10] (Piledriver, ستيم رولر، Excavator)
  • AVX (128-bit) بلدوزر-ستيم رولر
  • AVX2 (128-bit) Excavator
  • FMA3 (بلدوزر)[11]
  • FMA3/4 (Piledriver-Excavator)
4 8 0
AVX2 & FMA (128-bit, 256-bit decoding)[15] 8 16 0
AVX2 & FMA (256-bit) 16 32 0
وحدة المعالجة المركزية آرم
ARM Cortex-A7, A9, A15 ARMv7 1 8 0
ARM Cortex-A32, A35, A53, A55, A72, A73, A75 ARMv8 2 8 0
ARM Cortex-A57[10] ARMv8 4 8 0
ARM Cortex-A76, A77, A78 ARMv8 8 16 0
ARM Cortex-X1 ARMv8 16 32 ?
Qualcomm Krait ARMv8 1 8 0
Qualcomm Kryo (1xx - 3xx) ARMv8 2 8 0
Qualcomm Kryo (4xx - 5xx) ARMv8 8 16 0
Samsung Exynos M1 and M2 ARMv8 2 8 0
Samsung Exynos M3 and M4 ARMv8 3 12 0
IBM PowerPC A2 (Blue Gene/Q) ? 8 8 (as FP64) 0
Hitachi SH-4[17][18] SH-4 1 7 0
وحدة معالجة الرسومات إنڤيديا
Nvidia Curie (GeForce 6 series and GeForce 7 series) PTX ? 8 ?
Nvidia Tesla 2.0 (GeForce GTX 260-295) PTX ? 2 ?
Nvidia Fermi (only GeForce GTX 465–480, 560 Ti, 570-590) PTX 1/4 (locked by driver, 1 in hardware) 2 0
Nvidia Fermi (only Quadro 600-2000) PTX 1/8 2 0
Nvidia Fermi (only Quadro 4000–7000, Tesla) PTX 1 2 0
Nvidia Kepler (GeForce (except Titan and Titan Black), Quadro (except K6000), Tesla K10) PTX 1/12 (for GK110: locked by driver, 2/3 in hardware) 2 0
Nvidia Kepler (GeForce GTX Titan and Titan Black, Quadro K6000, Tesla (except K10)) PTX 2/3 2 0
  • Nvidia Maxwell
  • Nvidia Pascal (all except Quadro GP100 and Tesla P100)
PTX 1/16 2 1/32
Nvidia Pascal (only Quadro GP100 and Tesla P100) PTX 1 2 4
Nvidia Volta[19] PTX 1 2 (FP32) + 2 (INT32) 16
Nvidia Turing (only GeForce 16XX) PTX 1/16 2 (FP32) + 2 (INT32) 4
Nvidia Turing (all except GeForce 16XX) PTX 1/16 2 (FP32) + 2 (INT32) 16
Nvidia Ampere[20][21] (only Tesla A100/A30) PTX 2 2 (FP32) + 2 (INT32) 32
Nvidia Ampere (all GeForce and Quadro, Tesla A40/A10) PTX 1/32 2 (FP32) + 0 (INT32) or 1 (FP32) + 1 (INT32) 8
وحدة معالجة الرسومات أيه إم دي
AMD TeraScale 1 (Radeon HD 4000 series) TeraScale 1 0.4 2 ?
AMD TeraScale 2 (Radeon HD 5000 series) TeraScale 2 1 2 ?
AMD TeraScale 3 (Radeon HD 6000 series) TeraScale 3 1 4 ?
AMD GCN (only Radeon Pro W 8100-9100) GCN 1 2 ?
AMD GCN (all except Radeon Pro W 8100-9100, Vega 10-20) GCN 1/8 2 4
AMD GCN Vega 10 GCN 1/8 2 4
AMD GCN Vega 20 (only Radeon VII) GCN 1/2 (locked by driver, 1 in hardware) 2 4
AMD GCN Vega 20 (only Radeon Instinct MI50 / MI60 and Radeon Pro VII) GCN 1 2 4
RDNA 1/8 2 4
AMD CDNA CDNA 1 4 (Tensor)[24] 16
AMD CDNA 2 CDNA 2 4 (Tensor) 4 (Tensor) 16
وحدة معالجة الرسومات كوالكوم
Qualcomm Adreno 5x0 Adreno 5xx 1 2 4
Qualcomm Adreno 6x0 Adreno 6xx 1 2 4
گراف‌كور
Graphcore Colossus GC2[25][26] ? 0 16 64
  • Graphcore Colossus GC200 Mk2[27]
  • Graphcore Bow-2000[28]
? 0 32 128
حاسب فائق
ENIAC @ 100 Khz with 385 Flops[29]
48-bit processor @ 208 kHz in CDC 1604 in 1960
60-bit processor @ 10 Mhz in CDC6600 in 1964 0.3 (FP60)
60-bit processor @ 10 Mhz in CDC7600 in 1967 1.0 (FP60) [30]
Cray-1 @ 80 Mhz in 1976 2
CDC Cyber 205 @ 50 Mhz in 1981 FORTRAN compiler

(ANSI 77 with vector extensions)

8 16
Microarchitecture ISA FP64 FP32 FP16

سجلات الأداء

سجلات الحواسب الفردية

في يونيو 1997، كان ASCI Red الخاص بـ إنتل هو أول حاسب في العالم يحقق تيرافلوپس واحداً وأكثر. قال مدير Sandia Bill Camp أن ASCI Red يتمتع بأفضل موثوقية من أي حاسب فائق تم بناؤه على الإطلاق، و "كان علامة عالية للحوسبة الفائقة من حيث طول العمر والسعر والأداء".[31]

كان الحاسب الفائق NEC SX-9 أول معالج متجهي في العالم يتجاوز 100 gigaFLOPS لكل نواة واحدة.

في يونيو 2006، تم الإعلان عن جهاز حاسب جديد من قبل معهد الأبحاث الياباني ريكن، MDGRAPE-3. يتفوق أداء الحاسب عند مستوى پيتافلوپس واحد، أسرع مرتين تقريباً من الجين الأزرق / L، لكن MDGRAPE-3 ليس حاسباً للأغراض العامة، ولهذا السبب لا يظهر في قائمة Top500.org. لها أغراض خاصة أنابيب التجزئة لمحاكاة الديناميكيات الجزيئية.

بحلول عام 2007، كشفت إنتل النقاب عن الشريحة التجريبية متعددة النواة پولاريس، والتي تحقق 1 تيرافلوپس عند 3.13 گيگاهرتز. يمكن للشريحة 80 نواة رفع هذه النتيجة إلى 2 تيرافلوپس عند 6.26 گيگاهرتز، على الرغم من أن التبديد الحراري عند هذا التردد يتجاوز 190 واط.[32]

في يونيو 2007، أعلن موقع Top500.org عن أسرع حاسب في العالم ليكون الحاسب الفائق آي‌بي‌إم الجين الأزرق/إل، بقياس ذروة 596 تيرافلوپس.[33] وكان Cray XT4 في المركز الثاني بـ 101.7 تيرافلوپس.

في 26 يونيو 2007، أعلنت آي‌بي‌إم عن الجيل الثاني من أفضل حواسيبها الفائقة، والتي يطلق عليها اسم الجين الأزرق/پي والمصممة للعمل باستمرار بسرعات تتجاوز پيتافلوپس واحد، أسرع من الجين الأزرق/إل. عند التهيئة للقيام بذلك، يمكن أن تصل سرعات تزيد عن ثلاثة پيتافلوپس.[34]

في 25 أكتوبر 2007، أصدرت شركة إن إي سي اليابانية بياناً صحفياً أعلنت فيه عن طراز سلسلة SX SX-9،[35] مدعية أنه أسرع حاسب فائق متجهي في العالم. تتميز SX-9 بأول وحدة معالجة مركزية قادرة على أداء متجهي ذروة يبلغ 102.4 گيگافلوپس لكل نواة واحدة.

في 4 فبراير 2008، افتتحت NSF وجامعة تكساس في أوستن بحثاً على نطاق واسع على إيه إم دي، من نوع صن حاسب عملاق يدعى رانجر،[36] أقوى نظام حوسبة فائقة في العالم لبحوث العلوم المفتوحة، والذي يعمل بسرعة ثابتة تبلغ 0.5 پيتافلوپس.

في 25 مايو 2008، وصل حاسوب عملاق أمريكي تم بناؤه بواسطة آي‌بي‌إم، واسمه " رودرنر"، إلى مرحلة الحوسبة المتمثلة في پيتافلوپس واحد. تصدرت قائمة يونيو 2008 ونوفمبر 2008 توپ 500 لأقوى أجهزة الحواسيب الفائقة (باستثناء أجهزة الحواسب الشبكية).[37][38]يوجد الحاسب في مختبر لوس ألاموس الوطني في نيو مكسيكو. يشير اسم الحاسب إلى نيومكسيكو طائر الولاية، رودرنر الأكبر (Geococcyx californianus).[39]

في يونيو 2008، أصدرت أيه إم دي سلسلة ATI Radeon HD 4800، والتي ورد أنها أول وحدات معالجة رسومات (GPU) تحقق تيرافلوپس واحد. في 12 أغسطس 2008، أصدرت AMD بطاقة رسومات ATI Radeon HD 4870X2 مع اثنين من Radeon R770 يبلغ مجموعها 2.4 تيرافلوپس.

في نوفمبر 2008، رفعت ترقية إلى كراي الحاسب الفائق جاگوار في مختبر أوك ريدج الوطني (ORNL) التابع لوزارة الطاقة (DOE) قوة حوسبة النظام إلى ذروة 1.64 پيتافلوپس، مما جعل جاگوار أول نظام پيتافلوپس في العالم مخصص للبحث المفتوح. في أوائل عام 2009، تم تسمية الحاسب الفائق على اسم مخلوق أسطوري، كراكن. تم إعلان كراكن أسرع حاسب فائق تديره الجامعات في العالم والسادس الأسرع بشكل عام في قائمة توپ 500 لعام 2009. في عام 2010 تمت ترقية كراكن ويمكن أن تعمل بشكل أسرع وأكثر قوة.

في عام 2009، تَقدم أداء Cray على أداء جاگوار بمعدل 1.75 پيتافلوپس، متفوقاً على آي‌بي‌إم رودرنر في المركز الأول على قائمة توپ 500.[40]

في أكتوبر 2010، كشفت الصين النقاب عن تيان‌خى-1، وهو حاسب فائق يعمل بأقصى معدل حوسبة يبلغ 2.5 پيتافلوپس.[41][42]

اعتبارا من 2010 وصل أسرع معالج للحاسب الشخصي إلى 109 گيگافلوپس (Intel Core i7 980 XE)[43] في حسابات الدقة المزدوجة. تعد وحدات GPU أكثر قوة بشكل ملحوظ. على سبيل المثال، تؤدي Nvidia Tesla معالجات C2050 للحوسبة GPU حوالي 515 گيگافلوپس [44] في حسابات الدقة المزدوجة، وذروة AMD FireStream 9270 عند 240 گيگافلوپس.[45]

في نوفمبر 2011، أُعلن أن اليابان حققت 10.51 پيتافلوپس من خلال كـِيْ كومپيوتر.[46] والذي لديه 88128 SPARC64 VIIIfx معالج في 864 رف، مع أداء نظري يبلغ 11.28 پيتافلوپس. تمت تسميته على اسم الكلمة اليابانية "kei"، والتي تعني 10 كوادريليون،[47] المقابلة للسرعة المستهدفة 10 پيتافلوپس.

في 15 نوفمبر 2011، عرضت إنتل معالجاً واحداً قائماً على x86، يحمل الاسم الرمزي "نايتس كورنر"، يحافظ على أكثر من تيرافلوپس على نطاق واسع من عمليات DGEMM. وقد أكدت إنتل خلال العرض التوضيحي أن هذا كان تيرافلوپس مستداماً (وليس "تيرافلوپس خاماً" يستخدمه الآخرون للحصول على أرقام أعلى ولكن أقل أهمية)، وأنه كان أول معالج للأغراض العامة يتخطى تيرافلوپس.[48][49]

في 18 يونيو 2012، وصل نظام الحاسب الفائق سيكويا التابع لشركة آي‌بي‌إم، ومقره في مختبر لورانس ليڤرمور الوطني بالولايات المتحدة (LLNL)، إلى 16 پيتافلوپس، محققاً الرقم القياسي العالمي وحصل على المركز الأول في أحدث قائمة توپ 500.[50]

في 12 نوفمبر 2012، تم اعتماد قائمة توپ 500 تيتان كأسرع حاسب فائق في العالم وفقاً لمعيار لينپاك، بمعدل 17.59 پيتافلوپس.[51][52] تم تطويره بواسطة شركة كراي في مختبر اوك ريدج الوطني ويجمع بين معالجات AMD Opteron وتقنيات وحدة معالجة الرسوم (GPU) NVIDIA Tesla "Kepler".[53][54]

في 10 يونيو 2013، احتلت الصين بحاسبها تيان‌خى-2 المرتبة الأسرع في العالم بـ 33.86 پيتافلوپس.[55]

في 20 يونيو 2016 صنفت الصين صنواي تايهولايت الأسرع في العالم بـ 93 پيتافلوپس على مقياس LINPACK (من 125 ذروة پيتافلوپس). يتم تثبيت النظام، الذي يعتمد بشكل حصري تقريباً على التكنولوجيا المطورة في الصين، في المركز الوطني للحوسبة الفائقة في ووشي، ويمثل أداءً أكثر من الأنظمة الخمسة التالية الأكثر قوة في قائمة توپ 500 مجتمعة.[56]

في يونيو 2019، حصل سومت، وهو حاسب فائق من إنتاج شركة IBM يعمل الآن في مختبر أوك ريدج الوطني التابع لوزارة الطاقة (DOE)، على المركز الأول بأداء 148.6 پيتافلوپس على لينپاك عالي الأداء (HPL)، المعيار المستخدم لتصنيف قائمة توپ 500. يحتوي سومت على 4,356 عقدة، كل واحدة مجهزة بوحدتي CPU Power9 من 22 نواة، وستة وحدات معالجة رسومات NVIDIA Tesla V100.[57]

في يونيو 2020، قام فوگاكو بتحويل نتيجة لينپاك عالية الأداء (HPL) لـ 415.5 پيتافلوپس، متفوقاً على نظام سومت الذي يحتل المركز الثاني الآن بعامل 2.8x. يتم تشغيل فوگاكو بواسطة نظام Fujitsu's 48-core A64FX SoC، ليصبح أول نظام رقم واحد في القائمة يتم تشغيله بواسطة معالجات آرم. في دقة مفردة أو مخفضة أخرى، تُستخدم في التعلم الآلي وتطبيقات الذكاء الاصطناعي، يبلغ ذروة أداء فوگاكو أكثر من 1000 پيتافلوپس (1 إكسافلوپس). تم تثبيت النظام الجديد في مركز رايكن للعلوم الحسابية (R-CCS) في كوبي، اليابان.[بحاجة لمصدر]


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

سجلات الحوسبة الموزعة

تستخدم الحوسبة الموزعة الإنترنت لربط الحاسوب الشخصي لتحقيق المزيد من فلوپس:

  • اعتبارا من أبريل 2020، تمتلك شبكة فولدنگ@هوم أكثر من 2.3 إكسافلوپس من إجمالي طاقة الحوسبة.[58][59][60][61] فهي أقوى شبكة حاسب موزعة، كونها أول من كسر 1 إكسافلوپس من إجمالي قوة الحوسبة. يتم تمكين هذا المستوى من الأداء بشكل أساسي من خلال الجهد التراكمي لمجموعة واسعة من وحدات GPU و CPU القوية.[62]

كلفة الحوسبة

تكاليف الأجهزة

التاريخ تقريباً بالدولار الأمريكي لكل گيگافلوپس منصة توفر أقل تكلفة لكل گيگافلوپس تعليقات
غير معدل 2022[68]
1945 $129.49 تريليون $1.88 كوادرليون ENIAC: US$487٬000 في 1945 وUS$7٬195٬000 في 2019 US$487٬000 / 0.0000000385 GFLOPS
1961 $18.7 مليار $145٫4 مليار كانت تكلفة التثبيت الأساسي لـ IBM 7030 Stretch تبلغ US$7٫78 million لكل تثبيت. يقوم IBM 7030 Stretch بإجراء مضاعفة فاصلة عائمة واحدة كل مرة 2.4 microseconds.[69]
1984 $18,750,000 $41٬940٬000 Cray X-MP/48 $15,000,000 / 0.8 GFLOPS
1997 $30,000 $43٬000 مجموعتان من 16 معالج بيوولف مع معالجات پنتيوم پرو[70]
April 2000 $1,000 $1٬370 Bunyip Beowulf cluster كانت بونييپ أول تقنية حوسبة فرعية - US$1/MFLOPS فازت بجائزة گوردون بيل عام 2000.
May 2000 $640 $876 KLAT2 كانت KLAT2 تقنية الحوسبة الأولى التي تطورت لتلائم التطبيقات الكبيرة أثناء بقائها تحت US$1/MFLOPS.[71]
August 2003 $82 $104 KASY0 كان KASY0 هو أول فرع - US$100/GFLOPS لتقنية حوسبة.[72]
August 2007 $48 $54 Microwulf اعتباراً من أغسطس 2007، يمكن إنشاء مجموعة بيوولف "الشخصية" 26.25 GFLOPS مقابل 1256 دولار أمريكي.[73]
March 2011 $1.80 $1٫88 HPU4Science بُنيت هذه المجموعة التي تبلغ تكلفتها 30 ألف دولار أمريكي باستخدام أجهزة من فئة "الألعاب" المتوفرة تجارياً فقط.[74]
August 2012 $0.75 $0٫75 نظام AMD Radeon 7970 رباعي حاسب مكتبي رباعي AMD Radeon 7970 يصل إلى 16 تيرافلوپس من دقة فردية و4 تيرافلوپس لأداء حوسبة مزدوجة الدقة. إجمالي تكلفة النظام كان 3000 دولار؛ تم إنشاؤها باستخدام الأجهزة المتوفرة تجارياً فقط.[75]
June 2013 $0.22 $0٫22 پلاي ستيشن 4 من سوني أُدرجت پلاي ستيشن 4 من سوني على أنها تتمتع بأعلى أداء يبلغ 1.84 TFLOPS، بسعر 400 دولار أمريكي (أو ما يعادله بالعملة المحلية)[76]
November 2013 $0.16 $0٫16 نظام AMD Sempron 145 & GeForce GTX 760 أُنشئ باستخدام الأجزاء المتاحة تجارياً، وهو نظام يستخدم AMD Sempron واحد 145 وثلاثة Nvidia GeForce GTX 760 يصل إلى إجمالي 6.771 TFLOPS بتكلفة إجمالية قدرها US$1٬090٫66.[77]
December 2013 $0.12 $0٫12 نظام Pentium G550 & Radeon R9 290 بنيت باستخدام الأجزاء المتاحة تجارياً. إنتل Pentium G550 و AMD Radeon R9290 يتصدران 4.848 TFLOPS من الإجمالي الكلي US$681٫84.[78]
January 2015 $0.08 $0٫08 نظام Celeron G1830 & Radeon R9 295X2 بنيت باستخدام الأجزاء المتاحة تجارياً. انتل Celeron G1830 و AMD Radeon R9 295X2 تتفوق على 11.5 TFLOPS بإجمالي US$902٫57.[79][80]
June 2017 $0.06 $0٫06 نظام AMD Ryzen 7 1700 & AMD Radeon Vega Frontier Edition بنيت باستخدام الأجزاء المتاحة تجارياً. انتل Celeron G1830 و AMD Radeon R9 295X2 تتفوق على 11.5 TFLOPS بإجمالي.[81]
أكتوبر 2017 $0.03 $0٫03 نظام Intel Celeron G3930 & AMD RX Vega 64 بنيت باستخدام الأجزاء المتاحة تجارياً. توفر ثلاث بطاقات رسومات AMD RX Vega 64 ما يزيد قليلاً عن 75 تيرافلوپس نصف دقة (38 TFLOPS SP أو 2.6 TFLOPS DP عند دمجها مع وحدة المعالجة المركزية) بسعر ~ 2050 دولار للنظام الكامل.[82]
نوفمبر 2020 $0.03 $0.03 AMD Ryzen 3600 & 3× NVIDIA RTX 3080 system AMD Ryzen 3600 @ 484 GFLOPS & $199.99

3× NVIDIA RTX 3080 @ 29,770 GFLOPS each & $699.99

Total system GFLOPS = 89,794 / TFLOPS= 89.2794

إجمالي تكلفة النظام بما في ذلك. أجزاء واقعية ولكن منخفضة التكلفة؛ مطابق مع مثال آخر = 2839 دولاراً[83]

US$/GFLOP = $0.0314

نوفمبر 2020 $0.04 $0.04 PlayStation 5 تم إدراج الإصدار الرقمي من سوني پلاي ستيشن 5 على أنه يتمتع بأعلى أداء يبلغ 10.28 TFLOPS (20.58 TFLOPS نصف دقة) بسعر تجزئة يبلغ 399 دولار أمريكي.[84]
نوفمبر 2020 $0.04 $0.04 Xbox Series X تم إدراج Xbox Series X من مايكروسوفت على أنها تتمتع بأعلى أداء يبلغ 12.15 TFLOPS بسعر تجزئة يبلغ 499 دولار أمريكي.[85]


انظر أيضاً

المراجع

  1. ^ Floating Point Retrieved on December 25, 2009.
  2. ^ Summary: Fixed-point (integer) vs floating-point Retrieved on December 25, 2009.
  3. ^ Fixed versus floating point. Retrieved on December 25, 2009.
  4. ^ Data manipulation and math calculation. Retrieved on December 25, 2009.
  5. ^ "Nodes, Sockets, Cores and FLOPS, Oh, My" by Dr. Mark R. Fernandez, Ph.D.
  6. ^ "FREQUENTLY ASKED QUESTIONS". www.top500.org. Retrieved 23 June 2020.
  7. ^ "Floating-Point Operations Per Second (FLOPS)".
  8. ^ أ ب "home.iae.nl".{{cite web}}: CS1 maint: url-status (link)
  9. ^ أ ب "Computing Power throughout History". www.alternatewars.com. Retrieved 2021-02-13.
  10. ^ أ ب ت ث ج Dolbeau, Romain (2017). "Theoretical Peak FLOPS per instruction set: a tutorial". Journal of Supercomputing. 74 (3): 1341–1377. doi:10.1007/s11227-017-2177-5. S2CID 3540951.
  11. ^ "New instructions support for Bulldozer (FMA3) and Piledriver (FMA3+4 and CVT,BMI,TBM)" (PDF).
  12. ^ "Agner's CPU blog - Test results for AMD Ryzen".
  13. ^ https://arstechnica.com/gadgets/2017/03/amds-moment-of-zen-finally-an-architecture-that-can-compete/2/ "each core now has a pair of 128-bit FMA units of its own"
  14. ^ Mike Clark (August 23, 2016). "A New x86 Core Architecture for the Next Generation of Computing" in HotChips 28., AMD.  page 7
  15. ^ "The microarchitecture of Intel and AMD CPUs" (PDF).
  16. ^ "AMD CEO Lisa Su's COMPUTEX 2019 Keynote". www.youtube.com. Archived from the original on 2021-12-11.
  17. ^ "Entertainment Systems and High-Performance Processor SH-4" (PDF). Hitachi Review. Hitachi. 48 (2): 58–63. 1999. Retrieved 21 June 2019.
  18. ^ "SH-4 Next-Generation DSP Architecture for VoIP" (PDF). Hitachi. 2000. Retrieved 21 June 2019.
  19. ^ "Inside Volta: The World's Most Advanced Data Center GPU". May 10, 2017.
  20. ^ "NVIDIA Ampere Architecture In-Depth". May 14, 2020.
  21. ^ "NVIDIA A100".
  22. ^ "Alles zu Navi: Radeon RX 5700 XT ist RDNA mit GDDR6".
  23. ^ "AMD Radeon RX 5700 XT".
  24. ^ "AMD Instinct MI100 Accelerator".
  25. ^ "250 TFLOPs/s for two chips with FP16 mixed precision". www.youtube.com.
  26. ^ Archived at Ghostarchive and the Wayback Machine: "Estimation via power consumption that FP32 is 1/4 of FP16 and that clock frequency is below 1.5GHz". www.youtube.com.
  27. ^ Archived at Ghostarchive and the Wayback Machine: "Introducing Graphcore's Mk2 IPU systems". www.youtube.com.
  28. ^ "Bow-2000 IPU-Machine". docs.graphcore.ai/.
  29. ^ "Computers of Yore". www.clear.rice.edu. Retrieved 2021-02-26.
  30. ^ (in en)CDC 7600, 2020-09-16, https://en.wikipedia.org/w/index.php?title=CDC_7600&oldid=978691910, retrieved on 2021-02-26 
  31. ^ "Sandia's ASCI Red, world's first teraflop supercomputer, is decommissioned" (PDF). Archived from the original (PDF) on November 5, 2010. Retrieved November 17, 2011.
  32. ^ Richard Swinburne (April 30, 2007). "The Arrival of TeraFLOP Computing". bit-tech.net. Retrieved February 9, 2012.
  33. ^ "29th TOP500 List of World's Fastest Supercomputers Released". Top500.org. يونيو 23, 2007. Archived from the original on May 9, 2008. Retrieved July 8, 2008.
  34. ^ "June 2008". TOP500. Retrieved July 8, 2008.
  35. ^ "NEC Launches World's Fastest Vector Supercomputer, SX-9". NEC. October 25, 2007. Retrieved July 8, 2008.
  36. ^ "University of Texas at Austin, Texas Advanced Computing Center". Archived from the original on August 1, 2009. Retrieved September 13, 2010. Any researcher at a U.S. institution can submit a proposal to request an allocation of cycles on the system.
  37. ^ Sharon Gaudin (يونيو 9, 2008). "IBM's Roadrunner smashes 4-minute mile of supercomputing". Computerworld. Archived from the original on ديسمبر 24, 2008. Retrieved يونيو 10, 2008.
  38. ^ "Austin ISC08". Top500.org. نوفمبر 14, 2008. Archived from the original on February 22, 2012. Retrieved February 9, 2012.
  39. ^ Fildes, Jonathan (June 9, 2008). "Supercomputer sets petaflop pace". BBC News. Retrieved July 8, 2008.
  40. ^ Greenberg, Andy (November 16, 2009). "Cray Dethrones IBM In Supercomputing". Forbes.
  41. ^ "China claims supercomputer crown". BBC News. October 28, 2010.
  42. ^ Dillow, Clay (October 28, 2010). "China Unveils 2507 Petaflop Supercomputer, the World's Fastest". Popsci.com. Retrieved February 9, 2012.
  43. ^ "Intel's Core i7-980X Extreme Edition – Ready for Sick Scores?: Mathematics: Sandra Arithmetic, Crypto, Microsoft Excel". Techgage. March 10, 2010. Retrieved February 9, 2012.
  44. ^ "NVIDIA Tesla Personal Supercomputer". Nvidia.com. Retrieved February 9, 2012.
  45. ^ "AMD FireStream 9270 GPU Compute Accelerator". Amd.com. Retrieved February 9, 2012.
  46. ^ "'K computer' Achieves Goal of 10 Petaflops". Fujitsu.com. Retrieved February 9, 2012.
  47. ^ See Japanese numbers
  48. ^ "Intel's Knights Corner: 50+ Core 22nm Co-processor". 2011-11-16. Retrieved November 16, 2011.
  49. ^ "Intel unveils 1 TFLOP/s Knight's Corner". Retrieved November 16, 2011.
  50. ^ Clark, Don (June 18, 2012). "IBM Computer Sets Speed Record". The Wall Street Journal. Retrieved June 18, 2012.
  51. ^ "BBC News – US Titan supercomputer clocked as world's fastest". BBC News. Bbc.co.uk. November 12, 2012. Retrieved February 28, 2013.
  52. ^ "Oak Ridge Claims No. 1 Position on Latest TOP500 List with Titan | TOP500 Supercomputer Sites". Top500.org. November 12, 2012. Retrieved February 28, 2013.
  53. ^ Montalbano, Elizabeth (October 11, 2011). "Oak Ridge Labs Builds Fastest Supercomputer". Informationweek. Retrieved February 9, 2012.
  54. ^ Tibken, Shara (October 29, 2012). "Titan supercomputer debuts for open scientific research | Cutting Edge – CNET News". News.cnet.com. Retrieved February 28, 2013.
  55. ^ "Chinese Supercomputer Is Now The World's Fastest – By A Lot". Forbes Magazine. June 17, 2013. Retrieved June 17, 2013.
  56. ^ Feldman, Michael. "China Races Ahead in TOP500 Supercomputer List, Ending US Supremacy". TOP500.org. Retrieved 31 December 2016.
  57. ^ "June 2018 | TOP500 Supercomputer Sites". www.top500.org (in الإنجليزية). Retrieved 2018-07-17.
  58. ^ "Folding@Home Active CPUs & GPUs by OS". www.foldingathome.org. Retrieved 2020-04-08.
  59. ^ Folding@home (2020-03-25). "Thanks to our AMAZING community, we've crossed the exaFLOP barrier! That's over a 1,000,000,000,000,000,000 operations per second, making us ~10x faster than the IBM Summit!pic.twitter.com/mPMnb4xdH3". @foldingathome (in الإنجليزية). Retrieved 2020-04-04.
  60. ^ "Folding@Home Crushes Exascale Barrier, Now Faster Than Dozens of Supercomputers - ExtremeTech". www.extremetech.com. Retrieved 2020-04-04.
  61. ^ "Folding@Home exceeds 1.5 ExaFLOPS in the battle against Covid-19". TechSpot (in الإنجليزية الأمريكية). Retrieved 2020-04-04.
  62. ^ "Sony Computer Entertainment's Support for Folding@home Project on PlayStation™3 Receives This Year's "Good Design Gold Award"" (Press release). Sony Computer Entertainment Inc. نوفمبر 6, 2008. Archived from the original on January 31, 2009. Retrieved December 11, 2008.
  63. ^ "BOINC Computing Power". BOINC. Retrieved December 28, 2020.
  64. ^ "SETI@Home Credit overview". BOINC. Retrieved June 15, 2018.
  65. ^ "Einstein@Home Credit overview". BOINC. Retrieved June 15, 2018.
  66. ^ "MilkyWay@Home Credit overview". BOINC. Retrieved June 15, 2018.
  67. ^ "Internet PrimeNet Server Distributed Computing Technology for the Great Internet Mersenne Prime Search". GIMPS. Retrieved June 15, 2018.
  68. ^ Consumer Price Index (estimate) 1800–2008. Federal Reserve Bank of Minneapolis. Retrieved December 7, 2010.
  69. ^ "The IBM 7030 (STRETCH)". Norman Hardy. Retrieved February 24, 2017.
  70. ^ "Loki and Hyglac". Loki-www.lanl.gov. July 13, 1997. Archived from the original on July 21, 2011. Retrieved February 9, 2012.
  71. ^ "Kentucky Linux Athlon Testbed 2 (KLAT2)". The Aggregate. Retrieved February 9, 2012.
  72. ^ "KASY0". The Aggregate. August 22, 2003. Retrieved February 9, 2012.
  73. ^ "Microwulf: A Personal, Portable Beowulf Cluster". Archived from the original on September 12, 2007. Retrieved February 9, 2012.
  74. ^ Adam Stevenson, Yann Le Du, and Mariem El Afrit. "High-performance computing on gamer PCs." Ars Technica. March 31, 2011.
  75. ^ Tom Logan (January 9, 2012). "HD7970 Quadfire Eyefinity Review". OC3D.net.
  76. ^ "Sony Sparks Price War With PS4 Priced at $399." CNBC. June 11, 2013.
  77. ^ "FreezePage". Archived from the original on November 16, 2013. Retrieved May 9, 2020.
  78. ^ "FreezePage". Archived from the original on December 19, 2013. Retrieved May 9, 2020.
  79. ^ "FreezePage". Archived from the original on January 10, 2015. Retrieved May 9, 2020.
  80. ^ "Radeon R9 295X2 8 GB Review: Project Hydra Gets Liquid Cooling". 2014-04-08.
  81. ^ Perez, Carol E. (July 13, 2017). "Building a 50 Teraflops AMD Vega Deep Learning Box for Under $3K". Intuition Machine. Retrieved July 26, 2017.
  82. ^ "lowest_$/fp16 - mattebaughman's Saved Part List - Celeron G3930 2.9GHz Dual-Core, Radeon RX VEGA 64 8GB (3-Way CrossFire), XON-350_BK ATX Mid Tower - PCPartPicker". pcpartpicker.com. Retrieved 2017-09-13.
  83. ^ "System Builder". pcpartpicker.com. Retrieved 2020-12-07.
  84. ^ "AMD Playstation 5 GPU Specs". www.techpowerup.com. Retrieved May 12, 2021.
  85. ^ "Xbox Series X | Xbox". www.xbox.com. Retrieved September 21, 2021.