ذراع مالي G77 GPU - خصوصيات وعموميات كاملة

مؤلف: Randy Alexander
تاريخ الخلق: 3 أبريل 2021
تاريخ التحديث: 1 تموز 2024
Anonim
ذراع مالي G77 GPU - خصوصيات وعموميات كاملة - التقنيات
ذراع مالي G77 GPU - خصوصيات وعموميات كاملة - التقنيات

المحتوى


إلى جانب وحدة المعالجة المركزية الجديدة Cortex-A77 ، كشفت Arm النقاب عن وحدة معالجة الرسومات من الجيل التالي المخصصة لشركات الهواتف الذكية من الجيل التالي. يمثل Mali-G77 ، الذي لا يجب الخلط بينه وبين معالج العرض الجديد Mali-D77 ، رحيل بنية Arm's Bifrost والانتقال إلى Valhall.

سنتطرق إلى التفاصيل الدقيقة للهندسة الجديدة في لحظة. أولاً ، سنقفز مباشرةً إلى ما ينبغي أن يتوقعه المستخدمون من حيث مكاسب الأداء.

نظرة عامة على أداء مالي G77

يتمتع Arm بأداء رسومات يصل إلى 40 بالمائة مع أجهزة Mali-G77 من الجيل التالي مقارنةً بطرز Mali-G76 اليوم. هذا الرقم يأخذ في الاعتبار العملية وكذلك التحسينات المعمارية. مالي G77 هو شكلي من 7 إلى 16 النوى تظليل ، ولكل جوهر هو بالضبط تقريبا نفس حجم جوهر G76. هذا يعني أن الهواتف الذكية المتطورة ستشحن على الأرجح مع عدد الجرافيك الأساسية مماثلة كما هي الحال اليوم - في مكان ما في سن المراهقة منخفضة. بسهولة ، يتيح لنا ذلك إجراء بعض تقييمات الأداء المضاربة مقابل الشرائح الحالية.

بالنظر إلى مؤشر Manhattan GFXBench الرائد ، فإن زيادة الأداء بنسبة 40 بالمائة تفتح المجال أمام تقدم كبير للأجهزة الحالية. ستحتاج شريحة Adreno من الجيل القادم من كوالكوم إلى ترقيتها المهمة في الأداء للحفاظ على مستوى اللعب. يبدو أن الجداول تتحول لصالح Arm.


العمارة حكيمة ، أداء الألعاب يزيد من 20 إلى 40 ٪ ، في حين أن التعلم الآلي يكسب زيادة 60 ٪

استنادًا إلى هذا الملعب المائل إلى حد ما ، يتطلع جهاز Mali-G77 المكون من 10 مراكز (وهو التكوين الذي نراه كثيرًا من شركة Huawei) إلى تفوق أجهزة رسومات الأجهزة المحمولة لهذا الجيل. يوفر التكوين الأساسي 12 ، والذي يظهر عادةً في Exynos من سامسونج ، تقدمًا كبيرًا لجرافيك Arm الأخير. بالطبع ، ستعتمد المقاييس الحقيقية على عوامل أخرى ، بما في ذلك عقدة العملية وذاكرة التخزين المؤقت GPU وتكوين ذاكرة LPDDR ونوع التطبيق الذي تختبره. حتى تأخذ الرسم البياني أعلاه مع جرعة كبيرة من الملح.

فيما يتعلق بالهندسة المعمارية الجديدة وحدها ، يذكر Arm أن Mali-G77 توفر تحسينًا متوسطًا بنسبة 30 في المائة لكفاءة الطاقة وكثافة الأداء. هناك أيضًا زيادة هائلة بنسبة 60 بالمائة في تطبيقات التعلم الآلي ، وذلك بفضل دعم المنتج INT8. يتم تعيين توقعات أداء الألعاب في مكان ما بين 20 إلى 40 في المائة ، اعتمادًا على العنوان ونوع أحمال عمل الرسومات المعروضة.

لفهم كيف حقق Arm هذا الارتقاء في الأداء بدقة ، دعنا نلقي نظرة أعمق على الهيكل.


قابل Valhall ، خليفة Bifrost

Vahall هو الجيل الثاني من معمارية GPU العددية من Arm. إنه محرك تنفيذ عريض 16 إنش ، وهو ما يعني أساسًا أن وحدة معالجة الرسومات تنفذ 16 تعليمات بالتوازي لكل دورة ، لكل وحدة معالجة ، لكل مركز. هذا أعلى من 4 و 8 في Bifrost.

تتضمن الميزات المعمارية الجديدة الأخرى جدولة التعليمات الديناميكية التي تتم إدارتها بالكامل في الأجهزة ومجموعة تعليمات جديدة تمامًا تحافظ على معادلة التشغيل لـ Bifrost. وتشمل الميزات الأخرى دعم تنسيق ضغط AFBC1.3 من Arm ، وأهداف تقديم FP16 ، وتقديم الطبقات ، ومخرجات تظليل قمة الرأس.

يقوم برنامج Mali-G77 بإجراء 33٪ من الرياضيات بالتوازي مع G76.

تم العثور على مفاتيح لفهم التغييرات المعمارية الرئيسية عن طريق فحص وحدة التنفيذ داخل الأساسية. هذا الجزء من GPU هو المسؤول عن عدد الطحن.

داخل محرك التنفيذ

في Bifrost ، احتوى كل وحدة معالجة GPU على ثلاثة محركات تنفيذ أو محركين في حالة بعض التصميمات ذات النهاية المنخفضة Mali-G52. يحتوي كل محرك على ذاكرة تخزين مؤقت (i-cache) وملف التسجيل ووحدة التحكم في الاعوجاج. في Mali-G72 ، يتعامل كل محرك مع 4 تعليمات لكل دورة ، والتي ارتفعت إلى 8 في Mali-G76 العام الماضي. يسمح الانتشار عبر هذه المراكز الثلاثة بتعليمات التجميع المضاعف المتضاعف (FMA) 12 و 24 بت (FP32) 12 و 24 بت لكل دورة.

مع Valhall و Mali-G77 ، يوجد فقط محرك تنفيذ واحد داخل كل وحدة معالجة GPU. كما كان من قبل ، يضم هذا المحرك وحدة التحكم الاعوجاج والتسجيل و icache ، والتي تتم مشاركتها الآن عبر وحدتي معالجة. كل وحدة معالجة تتعامل مع 16 تعليمات تشوه لكل دورة ، لإجمالي إنتاجية من 32 FP32 FMA تعليمات لكل جوهر. هذا زيادة بنسبة 33 بالمائة في إنتاجية التعليمات على Mali-G76.

انتقل Arm من ثلاث وحدات إلى وحدة تنفيذ واحدة لكل وحدة معالجة GPU ، ولكن يوجد الآن وحدتان للمعالجة ضمن مجموعة G77.

بالإضافة إلى ذلك ، تحتوي كل وحدة من وحدات المعالجة هذه على كتلتين رياضيتين جديدتين. تتعامل وحدة التحويل الجديدة (CVT) مع الإرشادات الصحيحة الصحيحة والمنطق والفرع والتحويل. تعمل وحدة الوظائف الخاصة (SFU) على تسريع عملية ضرب الأعداد الصحيحة والأقسام والجذر التربيعي واللوغاريتمات وغيرها من وظائف الأعداد الصحيحة المعقدة.

شهدت وحدة FMA القياسية بضعة تعديلات ، تدعم 16 تعليمات FP32 لكل دورة ، 32 FP16 ، أو 64 INT8 تعليمات المنتج نقطة. تنتج هذه التحسينات أداءً بنسبة 60٪ في تطبيقات التعلم الآلي.

رباعية الملمس معين

التغيير الرئيسي الآخر في Mali-G77 هو إدخال مخطط نسيج رباعي ، من مخطط نسيج مزدوج في الجيل السابق. يكون مخطط النسيج مسؤولاً عن تعيين المضلعات ثلاثية الأبعاد في مشهد ما في التمثيل الثنائي الأبعاد الذي تراه على الشاشة. إنها مسؤولة عن أخذ العينات ، والاستيفاء ، والترشيح لتنعيم المحتوى الزاوي والمتحرك لتجنب الحواف القاسية المنخفضة الجودة.

تظل ميزة مكافحة التعرجات منخفضة التكلفة في مكانها للمساعدة في جودة الصورة ، ولكن مضاعفة أداء الملمس هي الفائدة الرئيسية هنا. تقوم وحدة النسيج الآن بمعالجة 4 إطارات نصفية في الساعة أعلى من 2 سابقًا ، و 2 إطارات ثلاثية في الساعة ، والتعامل مع تصفية FP16 و FP32 بشكل أسرع.

ينقسم مخطط نسيج الرباعي إلى مسارين ، مما يوفر خط أنابيب أقصر للمواضيع التي تصل إلى محتوى في ذاكرة التخزين المؤقت. يتميز المسار المفقود ، الذي يتعامل مع تحويل التنسيق وإزالة الضغط عن الملمس ، بواجهة أوسع لذاكرة التخزين المؤقت L2. هذا مفيد أيضًا لأحمال عمل التعلم الآلي التي قد تحتاج كثيرًا إلى سحب بيانات جديدة من الذاكرة.

جمع كل شيء معا في مالي G77

قدم Arm عددًا من التعديلات الأخرى على Mali-G77 لتتزامن مع التغييرات الرئيسية في هندسة Valhall. تم تبسيط كتلة التحكم بفضل تصميم وحدة التنفيذ الفردية ، في حين أن برنامج الجدولة الديناميكي الداخلي يسمح في الواقع بإصدار تعليمات أكثر مرونة داخل كل قلب. مع إنتاجية أعلى في كل نواة ، يكون datapath أيضًا أقصر وأقل في زمن الانتقال ، وصولًا إلى 4 دورات فقط من 8 سابقًا.

يتماشى التصميم الجديد أيضًا بشكل أفضل مع واجهة برمجة تطبيقات Vulkan ، مما يعمل على تبسيط واصفات برنامج التشغيل لخفض النفقات العامة للسائق لتحسين الأداء من "المعدن".

باختصار ، تقوم Mali-G72 و Valhall بإجراء تغييرات مهمة من Bifrost تعد بتحسينات كبيرة في الأداء لتطبيقات الألعاب والتعلم الآلي. والأهم من ذلك ، أن التصميم يتلاءم مع نفس ميزانيات الطاقة والمساحة مثل Bifrost ، مما يضمن أن الأجهزة المحمولة ستكون قادرة على تقديم المزيد من أعلى مستويات الأداء دون الحاجة إلى القلق بشأن تكاليف الحرارة والطاقة والسيليكون. استنادًا إلى توقعات الأداء ، ينبغي أن تكون Mali-G77 قادرة على منح الجيل القادم من كوالكوم أدرينو أداءً جيدًا مقابل أموالها.

يتلقى Huawei P30 و Huawei P30 Pro تحديثًا مهمًا للوضع الليلي للكاميرا الأمامية التي توفر وظائف الإضاءة المنخفضة المحسنة للأجهزة. يشار إليها باسم "uper Night Mode" بواسطة Gizmochinaتهدف هذه ا...

لقطة شاشة من فيديو P30 التشويقي.لقد انتشرت الشائعات منذ فترة طويلة فيما يتعلق بشركة Huawei الرئيسية التالية ، ويبدو أننا لن نضطر إلى الانتظار طويلًا حتى نضع أيدينا عليها....

الوظائف الرائعة