Arm Cortex-A77 - كل ما تحتاج إلى معرفته

مؤلف: Randy Alexander
تاريخ الخلق: 2 أبريل 2021
تاريخ التحديث: 1 تموز 2024
Anonim
Arm Cortex-A77 - كل ما تحتاج إلى معرفته - التقنيات
Arm Cortex-A77 - كل ما تحتاج إلى معرفته - التقنيات

المحتوى


جنبا إلى جنب مع معالج الرسومات الجديد Mali-G77 ومعالج العرض Mali-D77 ، كشفت Arm النقاب عن أحدث تصميم عالي الأداء لوحدة المعالجة المركزية - Cortex-A77. كما هو الحال مع Cortex-A76 للعام الماضي ، تم تصميم Cortex-A77 لتطبيقات الفئة الممتازة التي تتطلب استهلاك الطاقة المنخفض من Arm. كل شيء بدءًا من الهواتف الذكية وحتى أجهزة الكمبيوتر المحمولة ومن المحتمل جدًا بعدها.

مع Cortex-A77 ، استهدفت Arm الحد الأقصى من الإرشادات لكل أداء في دورة / ساعة (IPC) مما يمكنها من إدارته عبر Cortex-A76. تم تصميم جميع ترددات الساعة ، واستهلاك الطاقة ، والمساحة ، لتبقى تقريبًا في نفس الملعب ، ولكن يمكن للقرص الجديد أن يتدفق أكثر في نفس الوقت. للقيام بذلك ، صممت Arm نواة أوسع من العام الماضي وأجرت عددًا من التحسينات للحفاظ على تغذية وحدة المعالجة المركزية بأشياء للقيام بها. ولكن قبل أن نصل إلى ذلك ، دعنا ننتقل إلى نظرة عامة وأرقام الأداء رفيعة المستوى.

ضرب أهداف الأداء

في آب (أغسطس) 2018 ، شاركت Arm بشكل غير معتاد في خريطة طريق وحدة المعالجة المركزية حتى عام 2020. من تصميم Cortex-A73 حتى عام 2020 إلى تصميم Hercules لعام 2020 ، وعدت الشركة بزيادة أداء حسابها بمقدار 2.5 مرة. تم تحقيق جزء كبير من هذا الإسقاط الضخم مع تحول كبير في البنية الدقيقة مع Cortex-A76 ، وسرعات أعلى على مدار الساعة الحديثة ، والانتقال من 16 إلى 10 والآن تصنيع 7nm مع 5nm لمتابعة. تم تحقيق حوالي 1.8 مرة من مكاسب خارطة الطريق بالفعل بحلول العام الماضي ، ويوفر Cortex-A77 دفعة إضافية بنسبة 20 بالمائة تقريبًا من IPC. هذا يضعنا على الطريق الصحيح للوصول إلى هدف Arm 2.5x ، على الرغم من أن الأجهزة المحمولة ذات الميزانيات المحدودة للطاقة والحرارية لا تتوقع رؤية كل هذه المكاسب.


للمقارنة ، قدم Cortex-A76 العام الماضي حوالي 30-35 في المئة زيادة على Cortex-A75. هذا العام ، نتطلع إلى تحقيق مكاسب أقل بنسبة 20 في المائة من IPC بين A77 و A76. هذه أخبار جيدة لأنها تعني مزيدًا من الأداء مع الالتزام بالقيود الحرارية وقيود الطاقة المماثلة كما كان من قبل. المفاضلة هي أن A77 أكبر بنحو 17 في المائة من A76 ، وبالتالي سيكلف أكثر قليلاً من حيث مساحة السيليكون. إذا كنت ترغب في مقارنة مع رواد سطح المكتب ، فقد تمكنت AMD من زيادة IPC بنسبة 15 في المائة بين Zen2 و Zen + ، بينما ظل IPC من Intel ثابتًا تقريبًا لسنوات.بالطبع نحن نتحدث عن قطاعات السوق المختلفة هنا ، ولكن هذا يوضح كيف حقق فريق تصميم وحدة المعالجة المركزية Arm's مكاسب رائعة في الأجيال الأخيرة.

هناك زيادة بنسبة 20٪ في الأداء معروض على شركات الدعم اللاحق من Cortex-A77

إن الوجبات السريعة هنا هي أن A76 يمثل تحولًا رئيسيًا كبيرًا في الهندسة المعمارية مع تحقيق مكاسب هائلة في الأداء ، بينما نعود إلى تحسينات على مستوى التحسين باستخدام A77. من خلال ذلك ، دعنا نستكشف ما هو جديد في Arm Cortex-A77.


تعتمد Cortex-A77 على البنية الدقيقة A76

المفتاح لفهم الفرق بين Cortex-A77 و A76 هو فهم المقصود بالتصميم الأساسي "الأوسع". بشكل أساسي ، نتحدث عن القدرة على تنفيذ المزيد من الإرشادات لكل دورة على مدار الساعة ، مما يزيد من إنتاجية المركز. هناك جزءان مهمان لتحقيق ذلك - زيادة عدد وحدات التنفيذ للقيام بالمعالجة والتأكد من أن هذه الوحدات يتم الاحتفاظ بها تغذية جيدة بالبيانات. دعنا نبدأ بالجزء الأخير ونركز على أجزاء الإرسال ، وذاكرة التخزين المؤقت ، والتنبؤ الفرعي في شركة نفط الجنوب.

يرى Cortex-A77 زيادة بنسبة 50 في المائة لعرض الإرسال ، ما يصل إلى ستة تعليمات لكل دورة من أربعة مع A76. وهذا يعني المزيد من الإرشادات المتوجهة إلى مركز التنفيذ لكل دورة على مدار الساعة لتحقيق إمكانات أداء أكبر. نافذة التنفيذ خارج الترتيب أكبر أيضًا نتيجة لذلك ، حيث زادت إلى 160 إدخالًا لكشف المزيد من التوازي. هناك ذاكرة تخزين مؤقت تعليمي 64 كيلو بايت مألوفة ، في حين أن فرع هدف المخزن المؤقت (BTB) ، الذي يحتفظ بعناوين متنبئ الفرع ، أكبر بنسبة 33 في المائة عن ذي قبل للتعامل مع النمو بتعليمات متوازية. لا يوجد شيء غير عادي هنا ، فهو في الأساس نسخة أوسع من تصميم العام الماضي.

الإضافة الأكثر إثارة للاهتمام للواجهة الأمامية هي ذاكرة التخزين المؤقت 1.5K MOP الجديدة كليًا ، والتي تخزن Ops (MOPs) التي يتم تغذيتها مرة أخرى من وحدة فك التشفير. تقلل بنية وحدة المعالجة المركزية الخاصة بشركة Arm من التعليمات من تطبيق المستخدم إلى عمليات كلية أصغر ثم تنخفض أكثر إلى العمليات الصغيرة التي يفهمها جوهر التنفيذ. يمكنك أن ترى هذا على الرسم البياني أعلاه في قسم فك التشفير. يتم استخدام ذاكرة التخزين المؤقت لبروتوكول MOP لتقليل عقوبة تكلفة الفروع والفرش الضائعة ، حيث يمكنك الاحتفاظ بعمليات ops الكلية بدلاً من فك ترميزها مرة أخرى ، ويزيد من إجمالي الإنتاجية الأساسية. يتجاوز الجلب من MOP بدلاً من i-cache مرحلة فك التشفير ، مما يوفر دورة واحدة. ينص Arm على أن ذاكرة التخزين المؤقت MOP يمكن أن تصل إلى 85 بالمائة أو أكثر من مرات الدخول عبر مجموعة من أعباء العمل ، مما يجعلها إضافة مفيدة للغاية إلى ذاكرة التخزين المؤقت القياسية i.

الانتقال لأسفل إلى الجزء الأساسي للتنفيذ من وحدة المعالجة المركزية ، لاحظ إضافة وحدة ALU الرابعة والوحدة الفرعية الثانية. تعمل وحدة ALU الرابعة هذه على تعزيز الرقم العام للمعالج في عرض النطاق الترددي بنسبة 50 في المائة. وحدة ALU الإضافية هذه قادرة على الإرشادات الأساسية ذات الدورة الواحدة (مثل ADD و SUB) بالإضافة إلى عمليات الأعداد الصحيحة ذات الدورتين مثل الضرب. لا يستطيع اثنان من وحدات ALU الأخرى التعامل مع التعليمات الأساسية لدورة واحدة فقط ، في حين يتم تكليف الوحدة النهائية بعمليات حسابية أكثر تقدماً مثل القسمة ، أو مضاعفة التراكم ، أو ما إلى ذلك. تضاعف الوحدة الفرعية الثانية داخل مركز التنفيذ عدد الفروع المتزامنة. يمكن التعامل مع core ، وهو أمر مفيد في الحالات التي يكون فيها اثنان من التعليمات الستة المرسلة عبارة عن قفزات فرعية. هذا يبدو غريبا بعض الشيء ، ولكن الاختبارات الداخلية في Arm كشفت فوائد الأداء من اعتماد هذه الوحدة الثانية.

يوفر Cortex-A77 التوازي المحسّن وأسلوبًا جديدًا للذاكرة المؤقتة قبل جلبها

تتضمن التعديلات الأخرى على وحدة المعالجة المركزية إضافة خط أنابيب تشفير AES ثانٍ. تحتوي خطوط أنابيب تخزين البيانات الآن على منافذ مشكلة مخصصة لمضاعفة النطاق الترددي لمشكلة الذاكرة. تمت مشاركة هذه المنافذ مسبقًا مع ALUs ، والتي قد تصبح في بعض الأحيان عنق الزجاجة. هناك أيضًا الجيل التالي من البيانات المثالية لتحسين كفاءة الطاقة مع زيادة عرض النطاق الترددي إلى نظام DRAM.

جزء من هذا النظام في Cortex-A77 يتميز أيضًا بنظام الجلب المسبق الجديد "المدرك للنظام". يعمل ذلك على تحسين أداء الذاكرة استنادًا إلى مجموعة واسعة من تعدادات وحدة المعالجة المركزية الأساسية ، وقدرات ذاكرة التخزين المؤقت والكمون ، وتكوينات النظام الفرعي للذاكرة داخل الأجهزة النهائية. الجهاز المخصص لإجراء محادثات مع وحدة الجدولة الديناميكية (DSU) كجزء من مجموعة وحدة المعالجة المركزية DynamIQ ، والتي تراقب استخدام ذاكرة التخزين المؤقت L3 المشتركة. الميزات الأساسية مستويات المسافة الديناميكية والعدوانية لتقليل استخدام ذاكرة التخزين المؤقت في الحالات التي يكون فيها النطاق الترددي L3 محدودًا بمراكز وحدة المعالجة المركزية الأخرى. من الأرجح أن تؤدي النوى ذات الأداء العالي مثل Cortex-A77 إلى تشبع وصول وحدة DSU إلى الذاكرة ، بينما من غير المحتمل أن تؤدي النوى منخفضة الطاقة مثل A55.

تركيب كل ذلك معا

هناك الكثير من التغييرات الصغيرة على Cortex-A77 والتي تضيف بعض الاختلافات الكبيرة إلى سابقتها. باختصار ، تساعد ذاكرة التخزين المؤقت MOP الجديدة A77s مع إطار تعليمات أوسع وأطول في الحفاظ على وحدات ALU والفرع والذاكرة المعززة مشغولين بأشياء للقيام بها. تم توسيع تصميم Cortex-A76 ذو القوة الضخمة لتحسين إنتاجيته بدرجة أكبر باستخدام الموديل A77 ، دون الاعتماد على سرعات أعلى في الساعة.

تصل أكبر زيادة في الأداء إلى Cortex-A77 في شكل رياضيات عدد صحيح وعائم. وهذا ما تؤكده معايير Arm الداخلية ، والتي تعرض زيادة بنسبة 20 إلى 35 في المائة في عدد صحيح SPEC ومقاييس الفاصلة العائمة على التوالي. تقع تحسينات النطاق الترددي للذاكرة في مكان ما بين 15 و 20 في المائة ، مما يبرز مرة أخرى أن أكبر المكاسب تأتي في شكل زيادة أعداد. وعموما ، هذه التحسينات تعطي A77 في المتوسط ​​20 في المئة رفع عن الجيل السابق. قد نرى أيضًا بعض المكاسب الأكثر هامشيًا نتيجة لعمليات التصنيع المتقدمة التي تبلغ 7nm في وقت لاحق من هذا العام أو أوائل عام 2020.

فيما يتعلق بالهواتف الذكية ، تتجه شركة SoCs المزودة بتقنية Cortex-A77 إلى المنتجات الرائدة عالية الأداء. يتوقع Arm تمامًا أن يرى تصميم powerhouse يستخدم الترتيبات الأساسية 4 + 4 bit.LITTLE. بالنظر إلى الإنتاجية المتزايدة والحجم الطفيف لمساحة A77 ، من المحتمل أن نرى مصممي SoC يواصلون اتجاه 1 + 3 + 4 أو 2 + 2 + 4. مع واحد أو اثنين من النوى الكبيرة القوية مع ذاكرة التخزين المؤقت أكبر وساعات أعلى ، مدعومة من قبل 2 أو 3 A77 النوى مع أحجام ذاكرة التخزين المؤقت أصغر وساعات أقل لتوفير الطاقة والمساحة. في نهاية المطاف ، فإن Cortex-A77 تتحدث عن أشياء جيدة لرقائق الهواتف الذكية والسوق المتنامية لأجهزة الكمبيوتر المحمولة المستندة إلى Arm دائمًا. ترقبوا إعلانات السيليكون في وقت لاحق من هذا العام.

أعلنت اليابان أنها تزيد من ضوابط تصدير المواد ذات الصلة بالتكنولوجيا إلى كوريا الجنوبية.تشمل المواد التي تأثرت بنقل اليابان المواد المستخدمة للشاشات المرنة وأشباه الموصلات.يمكن أن تؤثر هذه الخطوة على ...

Android DK تعليمي للمبتدئينكيفية إنشاء تطبيقات أندرويدلا تعد Java لغة البرمجة الرسمية لتطوير تطبيقات Android (إلى جانب Kotlin) فحسب ، بل تستخدم Java نفسها من قبل Google لأجزاء كبيرة من Android الداخلي...

منشورات شائعة