كيفية إضافة Machine Learning إلى تطبيقات Android

فيديو: Add Navigation Drawer into existing multiple activities of Android Application using Android studio

المحتوى

تعرف على مجموعة أدوات التعلم من Google
كيف يمكنني استخدام واجهات برمجة تطبيقات ML Kit؟
حدد النص في أي صورة باستخدام واجهة برمجة تطبيقات التعرف على النص
فهم محتوى الصورة: واجهة برمجة تطبيقات Image Labeling
فهم التعبيرات وتتبع الوجوه: واجهة برمجة تطبيقات اكتشاف الوجه
مسح الباركود مع Firebase و ML
التعلم الآلي في السحابة: واجهة برمجة تطبيقات التعرف على المعالم
واجهة برمجة تطبيقات تحديد اللغة: تطوير لجمهور دولي
قريبًا: الرد الذكي
ماذا بعد؟ باستخدام TensorFlow لايت مع ML كيت
تغليف

يمكن أن يساعدك التعلم الآلي (ML) في إنشاء تجارب مبتكرة وجذابة وفريدة لمستخدمي هاتفك المحمول.

بمجرد إتقان ML ، يمكنك استخدامه لإنشاء مجموعة واسعة من التطبيقات ، بما في ذلك التطبيقات التي تنظم الصور تلقائيًا بناءً على موضوعها ، وتحديد وتعقب وجه شخص ما عبر بث مباشر ، واستخراج النص من صورة ، وأكثر من ذلك بكثير .

لكن ML ليست صديقة للمبتدئين تمامًا! إذا كنت ترغب في تحسين تطبيقات Android باستخدام إمكانات قوية للتعلم الآلي ، فمن أين تبدأ بالضبط؟

في هذه المقالة ، سأقدم نظرة عامة على SDK (مجموعة تطوير البرامج) التي تعد بوضع قوة ML في متناول يدك ، حتى لو كان لديك صفر تجربة ML. بحلول نهاية هذه المقالة ، سيكون لديك الأساس الذي تحتاجه لبدء إنشاء تطبيقات ذكية مدعومة من ML قادرة على تسمية الصور ، ومسح الرموز الشريطية ، والتعرف على الوجوه والمعالم الشهيرة ، وتنفيذ العديد من مهام ML القوية الأخرى.

تعرف على مجموعة أدوات التعلم من Google

مع إطلاق تقنيات مثل TensorFlow و CloudVision ، أصبح ML أكثر استخدامًا على نطاق واسع ، لكن هذه التقنيات ليست خافتة للقلب! ستحتاج عادةً إلى فهم عميق للشبكات العصبية وتحليل البيانات ، لمجرد الحصول عليها بدأت مع التكنولوجيا مثل TensorFlow.

حتى لو كنت فعل لديك بعض الخبرة مع ML ، يمكن أن يكون إنشاء تطبيق جوال يعتمد على التعلم عملية تستغرق وقتًا طويلاً ومعقدًا ومكلفًا ، ويتطلب منك الحصول على بيانات كافية لتدريب نماذج ML الخاصة بك ، ثم تحسين نماذج ML هذه لتعمل بكفاءة في بيئة المحمول. إذا كنت مطورًا فرديًا ، أو لديك موارد محدودة ، فقد لا يكون من الممكن وضع علم ML الخاص بك موضع التنفيذ.

ML Kit هي محاولة Google لجلب التعلم الآلي للجماهير.

تحت الغطاء ، تجمع ML Kit بين العديد من تقنيات ML القوية التي تتطلب عادة معرفة ML واسعة النطاق ، بما في ذلك Cloud Vision و TensorFlow و Android Neural Networks API. يجمع ML Kit بين تقنيات ML المتخصصة هذه والنماذج المدربة مسبقًا لحالة الاستخدامات الشائعة للهواتف المحمولة ، بما في ذلك استخراج النص من صورة ما والمسح الضوئي للباركود وتحديد محتويات الصورة.

بغض النظر عما إذا كان لديك أي معرفة سابقة بـ ML ، يمكنك استخدام ML Kit لإضافة إمكانات قوية للتعلم الآلي على جهاز Android و تطبيقات iOS - ما عليك سوى تمرير بعض البيانات إلى الجزء الصحيح من ML Kit ، مثل واجهة التعرف على النص أو واجهة برمجة تطبيقات التعرف على اللغة ، وسيستخدم واجهة برمجة التطبيقات هذه التعلم الآلي لإرجاع استجابة.

كيف يمكنني استخدام واجهات برمجة تطبيقات ML Kit؟

تم تقسيم ML Kit إلى عدة واجهات برمجة تطبيقات يتم توزيعها كجزء من نظام Firebase. لاستخدام أيٍ من واجهات برمجة تطبيقات ML Kit ، ستحتاج إلى إنشاء اتصال بين مشروع Android Studio ومشروع Firebase المطابق ، ثم التواصل مع Firebase.

تتوفر معظم طرز ML Kit كنماذج على الجهاز يمكنك تنزيلها واستخدامها محليًا ، ولكن بعض الطرز متوفرة أيضًا في السحابة ، مما يتيح للتطبيق الخاص بك أداء مهام مدعومة من ML عبر اتصال الإنترنت الخاص بالجهاز.

يحتوي كل أسلوب على مجموعة من نقاط القوة والضعف الفريدة الخاصة به ، لذلك ستحتاج إلى تحديد ما إذا كانت المعالجة المحلية أو البعيدة هي الأكثر أهمية لتطبيقك الخاص. يمكنك إضافة دعم لكلا النموذجين ، ثم السماح للمستخدمين بتحديد النموذج الذي سيتم استخدامه في وقت التشغيل. بدلاً من ذلك ، يمكنك تكوين التطبيق الخاص بك لتحديد أفضل طراز للظروف الحالية ، على سبيل المثال فقط باستخدام النموذج المستند إلى مجموعة النظراء عندما يكون الجهاز متصلاً بشبكة Wi-Fi.

إذا اخترت النموذج المحلي ، فستتوفر دائمًا ميزات التعلم الآلي للتطبيق ، بغض النظر عما إذا كان المستخدم لديه اتصال إنترنت نشط. نظرًا لأن كل العمل يتم تنفيذه محليًا ، تعد الطرز على الجهاز مثالية عندما يحتاج تطبيقك إلى معالجة كميات كبيرة من البيانات بسرعة ، على سبيل المثال إذا كنت تستخدم ML Kit لمعالجة دفق الفيديو المباشر.

وفي الوقت نفسه ، تقدم النماذج المستندة إلى مجموعة النظراء عادةً دقة أكبر من نظرائها على الجهاز ، حيث تعمل النماذج السحابية على الاستفادة من قوة تقنية التعلم الآلي الخاصة بـ Google Cloud Platform. على سبيل المثال ، يشتمل طراز Image Labeling API على الجهاز على 400 تسمية ، لكن ميزات النموذج السحابي قد انتهت 10000 علامة.

بناءً على واجهة برمجة التطبيقات ، قد تكون هناك بعض الوظائف المتاحة فقط في السحابة ، على سبيل المثال ، يمكن لـ API التعرف على النص تحديد الأحرف غير اللاتينية فقط إذا كنت تستخدم نموذجها المستند إلى مجموعة النظراء.

تتوفر واجهات برمجة التطبيقات المستندة إلى مجموعة النظراء فقط لمشاريع Firebase على مستوى Blaze ، لذلك ستحتاج إلى الترقية إلى خطة Blaze للدفع الفوري ، قبل أن تتمكن من استخدام أي من نماذج السحابة الخاصة بـ ML Kit.

إذا قررت استكشاف نماذج السحابة ، فعند كتابة هذا التقرير ، كان هناك حصة مجانية متاحة لجميع واجهات برمجة التطبيقات ML Kit. إذا كنت ترغب فقط في تجربة Labeling المستندة إلى مجموعة النظراء ، فيمكنك ترقية مشروع Firebase إلى خطة Blaze ، واختبار واجهة برمجة التطبيقات (API) على أقل من 1000 صورة ، ثم العودة إلى خطة Spark المجانية ، دون أي رسوم. ومع ذلك ، فإن الشروط والأحكام عادة سيئة للتغيير مع مرور الوقت ، لذا تأكد من قراءة النص الصغير قبل الترقية إلى Blaze ، فقط للتأكد من عدم حصولك على أي فواتير غير متوقعة!

حدد النص في أي صورة باستخدام واجهة برمجة تطبيقات التعرف على النص

يمكن لـ API التعرف على النص التعرف على النص وتحليله ومعالجته بذكاء.

يمكنك استخدام واجهة برمجة التطبيقات هذه لإنشاء تطبيقات تستخرج نصًا من صورة ما ، حتى لا يضطر المستخدمون إلى إضاعة الوقت في الإدخال اليدوي للبيانات المملة. على سبيل المثال ، يمكنك استخدام واجهة برمجة تطبيقات التعرف على النص لمساعدة المستخدمين على استخراج وتسجيل المعلومات من الإيصالات أو الفواتير أو بطاقات العمل أو حتى الملصقات الغذائية ، وذلك ببساطة عن طريق التقاط صورة للعنصر المعني.

يمكنك حتى استخدام واجهة برمجة تطبيقات التعرف على النص كخطوة أولى في تطبيق الترجمة ، حيث يلتقط المستخدم صورة لبعض النصوص غير المألوفة ويستخرج واجهة برمجة التطبيقات جميع النص من الصورة ، ويكون جاهزًا لنقله إلى خدمة الترجمة.

يمكن لـ API Kit للتعرف على النص على جهاز ML Kit تحديد النص بأي لغة تعتمد على اللغة اللاتينية ، في حين يستطيع نظيره المستند إلى مجموعة النظراء التعرف على مجموعة أكبر من اللغات والأحرف ، بما في ذلك الأحرف الصينية واليابانية والكورية. تم تحسين النموذج المستند إلى مجموعة النظراء أيضًا لاستخراج نص متفرق من الصور والنصوص من المستندات المزدحمة بالسكان ، والتي يجب أن تأخذها في الاعتبار عند تحديد النموذج الذي يجب استخدامه في تطبيقك.

تريد بعض الخبرة العملية مع API هذا؟ ثم راجع دليلنا خطوة بخطوة لإنشاء تطبيق يمكنه استخراج النص من أي صورة ، باستخدام واجهة برمجة تطبيقات التعرف على النص.

فهم محتوى الصورة: واجهة برمجة تطبيقات Image Labeling

يمكن أن تتعرف واجهة برمجة تطبيقات Image Labeling على الكيانات الموجودة في صورة ما ، بما في ذلك المواقع والأشخاص والمنتجات والحيوانات ، دون الحاجة إلى بيانات وصفية إضافية للسياق. ستُرجع واجهة برمجة تطبيقات Image Labeling معلومات حول الكيانات المكتشفة في شكل تسميات. على سبيل المثال ، في لقطة الشاشة التالية ، زودت واجهة برمجة التطبيقات (API) بصور طبيعية ، ورد عليها بتسميات مثل "Forest" و "River".

يمكن أن تساعدك هذه القدرة على التعرف على محتويات الصورة على إنشاء تطبيقات تضع علامات على الصور بناءً على موضوعها ؛ الفلاتر التي تحدد تلقائيًا المحتوى غير المناسب المقدم من المستخدم وإزالته من التطبيق الخاص بك ؛ أو كأساس لوظيفة البحث المتقدم.

تعرض العديد من واجهات برمجة تطبيقات ML Kit العديد من النتائج الممكنة ، مع استكمال درجات الثقة المصاحبة لها - بما في ذلك واجهة برمجة تطبيقات Image Labeling. إذا قمت بتمرير Image Labeling لصورة لبودل ، فربما تقوم بإرجاع الملصقات مثل "poodle" و "dog" و "pet" و "animal small" ، وكل ذلك بدرجات متفاوتة تدل على ثقة API في كل علامة. نأمل ، في هذا السيناريو ، أن تحصل "القلطي" على أعلى درجات الثقة!

يمكنك استخدام درجة الثقة هذه لإنشاء حد يجب الوفاء به ، قبل أن يعمل التطبيق الخاص بك على ملصق معين ، على سبيل المثال عرضه على المستخدم أو وضع علامة على صورة بهذه التسمية.

يتوفر Image Labeling على الجهاز وعلى السحاب ، على الرغم من أنه إذا اخترت طراز السحاب ، فستتمكن من الوصول إلى أكثر من 10000 ملصق ، مقارنةً بـ 400 ملصق مدرج في النموذج الموجود على الجهاز.

لإلقاء نظرة أكثر تعمقا على واجهة برمجة تطبيقات Image Labeling ، تحقق من تحديد محتوى الصورة بالتعلم الآلي. في هذه المقالة ، نقوم ببناء تطبيق يقوم بمعالجة صورة ، ثم يُرجع التصنيفات وعشرات الثقة لكل كيان تم اكتشافه داخل تلك الصورة. نحن نطبق أيضًا نماذج على الجهاز والسحابة في هذا التطبيق ، حتى تتمكن من معرفة بالضبط كيف تختلف النتائج ، اعتمادًا على الطراز الذي تختاره.

فهم التعبيرات وتتبع الوجوه: واجهة برمجة تطبيقات اكتشاف الوجه

يمكن لـ Face Detection API تحديد موقع الوجوه البشرية في الصور ومقاطع الفيديو والبث المباشر ، ثم استخراج معلومات حول كل وجه تم اكتشافه ، بما في ذلك موضعه وحجمه واتجاهه.

يمكنك استخدام واجهة برمجة التطبيقات هذه لمساعدة المستخدمين على تحرير صورهم ، على سبيل المثال عن طريق اقتصاص كل المساحة الفارغة حول أحدث صورة للرأس.

واجهة برمجة تطبيقات Face Detection ليست مقصورة على الصور - يمكنك أيضًا تطبيق واجهة برمجة التطبيقات هذه على مقاطع الفيديو ، على سبيل المثال ، يمكنك إنشاء تطبيق يحدد جميع الوجوه في تغذية الفيديو ثم يطمس كل شيء إلا تلك الوجوه ، على غرار ميزة طمس الخلفية في Skype.

كشف الوجه هو دائما يتم تنفيذها على الجهاز ، حيث يكون سريعًا بما يكفي لاستخدامه في الوقت الفعلي ، لذلك على عكس غالبية واجهات برمجة التطبيقات الخاصة بـ ML Kit ، فإن اكتشاف الوجه لا ليس تشمل نموذج سحابة.

بالإضافة إلى اكتشاف الوجوه ، يحتوي واجهة برمجة التطبيقات هذه على بعض الميزات الإضافية التي تستحق الاستكشاف. أولاً ، يمكن لـ Face Detection API التعرف على معالم الوجه ، مثل العيون والشفتين والأذنين ، ثم يسترد الإحداثيات الدقيقة لكل من هذه المعالم. هذه اعتراف تاريخي يوفر لك خريطة دقيقة لكل وجه تم اكتشافه - وهو مثالي لإنشاء تطبيقات الواقع المعزز (AR) التي تضيف أقنعة ومرشحات على غرار Snapchat إلى خلاصة كاميرا المستخدم.

واجهة برمجة تطبيقات اكتشاف الوجه كما يقدم الوجه تصنيف. حاليًا ، يدعم ML Kit تصنيفين للوجه: عيون مفتوحة ، وتبتسم.

يمكنك استخدام هذا التصنيف كأساس لخدمات إمكانية الوصول ، مثل أدوات التحكم في اليدين ، أو لإنشاء ألعاب تستجيب لتعبيرات وجه اللاعب. يمكن أن تكون القدرة على اكتشاف ما إذا كان شخص ما يبتسم أو تفتح عينيه في متناول يديك إذا كنت تقوم بإنشاء تطبيق كاميرا - بعد كل شيء ، لا يوجد ما هو أسوأ من التقاط مجموعة من الصور ، فقط لاكتشاف لاحقًا أن أحدهم قد أغلق عينيه في كل طلقة واحدة.

أخيرًا ، تشتمل واجهة برمجة تطبيقات اكتشاف الوجه على مكون لتعقب الوجه ، يقوم بتعيين معرف للوجه ثم يتتبع ذلك عبر عدة صور أو إطارات فيديو متتالية. لاحظ أن هذا وجه تتبع وليس الوجه الحقيقي التعرف على. وراء الكواليس ، تتتبع واجهة برمجة تطبيقات Face Detection موضع الوجه وحركته ، ومن ثم تستنتج أن هذا الوجه ينتمي على الأرجح إلى الشخص نفسه ، لكنه في نهاية المطاف لا يعرف هوية الشخص.

جرب واجهة برمجة تطبيقات اكتشاف الوجه بنفسك! تعرف على كيفية إنشاء تطبيق للكشف عن الوجوه من خلال التعلم الآلي و Firebase ML Kit.

مسح الباركود مع Firebase و ML

قد لا يبدو المسح الضوئي للباركود مثيرًا مثل بعض واجهات برمجة التطبيقات للتعلم الآلي ، لكنه يعد أحد الأجزاء الأكثر سهولة في ML Kit.

لا يتطلب مسح الرمز الشريطي أي أجهزة أو برامج متخصصة ، حتى تتمكن من استخدام API Barcode Scanning مع ضمان بقاء تطبيقك في متناول أكبر عدد ممكن من الأشخاص ، بما في ذلك المستخدمين على الأجهزة القديمة أو ذات الميزانية. طالما أن الجهاز يحتوي على كاميرا تعمل ، فلن يواجه أي مشكلة في مسح الرمز الشريطي.

يمكن لـ API Kit الخاص بـ Barcode Scanning API استخراج مجموعة واسعة من المعلومات من الرموز الشريطية المطبوعة والرقمية ، مما يجعلها وسيلة سريعة وسهلة ويمكن الوصول إليها لتمرير المعلومات من العالم الواقعي إلى التطبيق الخاص بك ، دون أن يضطر المستخدمون إلى القيام بأي إدخال بيانات يدوي مملة .

هناك تسعة أنواع مختلفة من البيانات يمكن لواجهة برمجة تطبيقات مسح الباركود التعرف عليها وتحليلها من الباركود:

TYPE_CALENDAR_EVENT. يحتوي هذا على معلومات مثل موقع الحدث ، والمنظم ، ووقت البدء والنهاية.إذا كنت تروج لحدث ما ، فيمكنك تضمين رمز شريطي مطبوع على ملصقاتك أو منشوراتك ، أو يمكنك وضع رمز شريطي رقمي على موقع الويب الخاص بك. يمكن للحضور المحتملين ثم استخراج جميع المعلومات حول هذا الحدث الخاص بك ، وذلك ببساطة عن طريق مسح الباركود الخاص به.
TYPE_CONTACT_INFO. يغطي نوع البيانات هذا معلومات مثل عنوان البريد الإلكتروني لجهة الاتصال والاسم ورقم الهاتف والعنوان.
TYPE_DRIVER_LICENSE. يحتوي هذا على معلومات مثل الشارع والمدينة والولاية والاسم وتاريخ الميلاد المرتبط برخصة القيادة.
TYPE_EMAIL. يشتمل نوع البيانات هذا على عنوان بريد إلكتروني ، بالإضافة إلى سطر موضوع البريد الإلكتروني ، والنص الأساسي.
TYPE_GEO. يحتوي هذا على خطوط الطول والعرض لنقطة جغرافية محددة ، وهي طريقة سهلة لمشاركة موقع مع المستخدمين لديك ، أو لمشاركة مواقعهم مع الآخرين. يمكنك حتى استخدام الرموز الشريطية الجغرافية لعرض الأحداث المستندة إلى الموقع ، مثل عرض بعض المعلومات المفيدة حول الموقع الحالي للمستخدم ، أو كأساس لألعاب الجوال القائمة على الموقع.
TYPE_PHONE. يحتوي هذا على رقم الهاتف ونوع الرقم ، على سبيل المثال ما إذا كان العمل أو رقم هاتف المنزل.
TYPE_SMS. يحتوي هذا على بعض نص الرسائل النصية القصيرة ورقم الهاتف المرتبط بالرسائل النصية القصيرة.
TYPE_URL. يحتوي نوع البيانات هذا على عنوان URL وعنوان URL. يعد مسح رمز شريط TYPE_URL أسهل كثيرًا من الاعتماد على المستخدمين لكتابة عنوان URL طويل ومعقد يدويًا ، دون ارتكاب أي أخطاء مطبعية أو أخطاء إملائية.
TYPE_WIFI. يحتوي هذا على SSID وكلمة مرور لشبكة Wi-Fi ، بالإضافة إلى نوع التشفير الخاص بها مثل OPEN أو WEP أو WPA. يعد باركود Wi-Fi واحدًا من أسهل الطرق لمشاركة بيانات اعتماد Wi-Fi ، مع إزالة مخاطر إدخال المستخدمين لهذه المعلومات بشكل غير صحيح.

يمكن لـ Barcode Scanning API تحليل البيانات من مجموعة من الرموز الشريطية المختلفة ، بما في ذلك التنسيقات الخطية مثل Codabar و Code 39 و EAN-8 و ITF و UPC-A و 2 D مثل Aztec و Matrix Data و QR Codes.

لتسهيل الأمور على المستخدمين النهائيين ، يقوم واجهة برمجة التطبيقات هذه بمسح جميع الرموز الشريطية المدعومة في وقت واحد ، ويمكنه أيضًا استخراج البيانات بغض النظر عن اتجاه الباركود - لذلك لا يهم إذا كان الباركود مقلوبًا تمامًا عندما يقوم المستخدم بمسحها!

التعلم الآلي في السحابة: واجهة برمجة تطبيقات التعرف على المعالم

يمكنك استخدام واجهة برمجة التطبيقات الخاصة بـ ML Kit الخاصة بـ ML Kit لتحديد المعالم الطبيعية والبنية المعروفة في صورة ما.

إذا قمت بتمرير واجهة برمجة التطبيقات هذه صورة تحتوي على معلم مشهور ، فسوف تُرجع اسم ذلك المعلم وقيم خطوط الطول والعرض الخاصة بالمعلم وعلبة تحديد المربع التي تشير إلى مكان اكتشاف العلامة داخل الصورة.

يمكنك استخدام واجهة برمجة تطبيقات لاندمارك التعرف لإنشاء تطبيقات تميز صور المستخدم تلقائيًا ، أو لتوفير تجربة أكثر تخصيصًا ، على سبيل المثال إذا كان تطبيقك يدرك أن المستخدم يلتقط صورًا لبرج إيفل ، فقد يقدم بعض الحقائق المهمة حول هذا المعلم ، أو يشير إلى مناطق جذب سياحية قريبة مشابهة قد يرغب المستخدم في زيارتها بعد ذلك.

بشكل غير معتاد بالنسبة لـ ML Kit ، لا تتوفر واجهة برمجة تطبيقات Landmark Detection إلا كواجهة برمجة التطبيقات المستندة إلى مجموعة النظراء ، لذلك لن يكون التطبيق الخاص بك قادراً على إجراء اكتشاف المعالم إلا عندما يكون للجهاز اتصال نشط بالإنترنت.

واجهة برمجة تطبيقات تحديد اللغة: تطوير لجمهور دولي

اليوم ، يتم استخدام تطبيقات Android في كل أنحاء العالم ، من قبل المستخدمين الذين يتحدثون العديد من اللغات المختلفة.

يمكن أن تساعد واجهة برمجة التطبيقات لتعريف اللغة من Kit Kit في تطبيق Android الخاص بك على جذب جمهور دولي ، من خلال أخذ سلسلة من النص وتحديد اللغة التي كتبت بها. يمكن لـ API لتعريف اللغة التعرف على أكثر من مائة لغة مختلفة ، بما في ذلك النص المكتوب بالحروف اللاتينية للغة العربية والبلغارية ، الصينية واليونانية والهندية واليابانية والروسية.

يمكن أن تكون واجهة برمجة التطبيقات هذه إضافة قيمة إلى أي تطبيق يقوم بمعالجة النص المقدم من المستخدم ، حيث نادراً ما يشتمل هذا النص على أي معلومات لغة. يمكنك أيضًا استخدام API Identification Language في تطبيقات الترجمة ، كخطوة أولى للترجمة اى شى، معرفة اللغة التي تعمل بها! على سبيل المثال ، إذا قام المستخدم بتوجيه كاميرا أجهزته في قائمة ، فقد يستخدم التطبيق واجهة برمجة تطبيقات تعريف اللغة لتحديد أن القائمة مكتوبة باللغة الفرنسية ، ثم يعرض ترجمة هذه القائمة باستخدام خدمة مثل Cloud Translation API ( ربما بعد استخراج النص ، باستخدام واجهة برمجة تطبيقات التعرف على النص؟)

بناءً على السلسلة المعنية ، قد تُرجع واجهة برمجة التطبيقات لتعريف اللغة عدة لغات محتملة ، مصحوبة بنقاط ثقة حتى تتمكن من تحديد اللغة التي تم اكتشافها والتي من المرجح أن تكون صحيحة. لاحظ أنه في وقت كتابة هذا التقرير ، لم يكن بإمكان ML Kit تحديد لغات مختلفة متعددة داخل نفس السلسلة.

للتأكد من أن واجهة برمجة التطبيقات توفر تعريف اللغة في الوقت الفعلي ، تتوفر واجهة برمجة تطبيقات تعريف اللغة فقط كنموذج على الجهاز.

قريبًا: الرد الذكي

تخطط Google لإضافة المزيد من واجهات برمجة التطبيقات إلى مجموعة أدوات ML في المستقبل ، لكننا نعرف بالفعل واجهة برمجة تطبيقات واحدة صاعدة.

وفقا لموقع ML Kit ، والقادم الرد الذكي API سيتيح لك تقديم ردود رسائل نصية في تطبيقاتك ، من خلال اقتراح مقتطفات من النص تتناسب مع السياق الحالي. استنادًا إلى ما نعرفه بالفعل عن واجهة برمجة التطبيقات هذه ، يبدو أن الرد الذكي سيكون مشابهًا لميزة الاستجابة المقترحة المتوفرة بالفعل في تطبيق Android و Wear OS و Gmail.

توضح لقطة الشاشة التالية كيف تظهر ميزة الاستجابة المقترحة حاليًا في Gmail.

ماذا بعد؟ باستخدام TensorFlow لايت مع ML كيت

توفر ML Kit نماذج مسبقة الصنع لحالات استخدام الهاتف المحمول الشائعة ، ولكن في مرحلة ما قد ترغب في تجاوز هذه النماذج الجاهزة.

من الممكن إنشاء نماذج ML الخاصة بك باستخدام TensorFlow Lite ثم توزيعها باستخدام ML Kit. ومع ذلك ، فقط عليك أن تدرك أنه على عكس واجهات برمجة التطبيقات الجاهزة لـ ML Kit ، فإن العمل مع طرز ML الخاصة بك يتطلب أ كبير كمية الخبرة ML.

بمجرد إنشاء نماذج TensorFlow Lite ، يمكنك تحميلها على Firebase وستقوم Google بعد ذلك بإدارة استضافة هذه النماذج وتقديمها إلى المستخدمين النهائيين. في هذا السيناريو ، تعمل ML Kit كطبقة واجهة برمجة التطبيقات (API) فوق النموذج المخصص لديك ، مما يبسط بعض الأحمال الثقيلة المتضمنة في استخدام النماذج المخصصة. وعلى الأخص ، ستقوم ML Kit تلقائيًا بدفع أحدث إصدار من الموديل الخاص بك إلى المستخدمين لديك ، لذلك لن تضطر إلى تحديث تطبيقك في كل مرة تريد فيها تعديل قرصك.

لتوفير أفضل تجربة مستخدم ممكنة ، يمكنك تحديد الشروط التي يجب الوفاء بها ، قبل أن يقوم التطبيق الخاص بك بتنزيل إصدارات جديدة من طراز TensorFlow Lite ، على سبيل المثال فقط تحديث النموذج عندما يكون الجهاز في وضع الخمول أو الشحن أو الاتصال بشبكة Wi- فاي. يمكنك حتى استخدام ML Kit و TensorFlow Lite جنبًا إلى جنب مع خدمات Firebase الأخرى ، على سبيل المثال استخدام Firebase Remote Config و Firebase A / B Testing لتقديم نماذج مختلفة لمجموعات مختلفة من المستخدمين.

إذا كنت تريد تجاوز الموديلات سابقة الصنع ، أو أن النماذج الحالية لـ ML Kit لا تلبي احتياجاتك تمامًا ، فيمكنك معرفة المزيد حول إنشاء نماذج تعلم الآلة الخاصة بك ، في مستندات Firebase الرسمية.

تغليف

في هذه المقالة ، نظرنا إلى كل مكون من مجموعة أدوات التعلم الآلي من Google ، وقمنا بتغطية بعض السيناريوهات الشائعة التي قد ترغب في استخدام كل من واجهات برمجة تطبيقات ML Kit.

تخطط Google لإضافة المزيد من واجهات برمجة التطبيقات في المستقبل ، فما هي واجهات برمجة التطبيقات للتعلم الآلي التي ترغب في إضافتها إلى ML Kit بعد ذلك؟ اسمحوا لنا أن نعرف في التعليقات أدناه!