رئيس التحرير
عصام كامل

جوجل تطلق نموذجا يولد وصفا نصيا تلقائيا لمحتوى الصور

شركة جوجل الأمريكية
شركة جوجل الأمريكية
18 حجم الخط

أعلنت شركة جوجل الأمريكية اليوم عن فتح نموذج يولد وصفا نصيا تلقائيا لمحتوى الصور بعد مسحها وفهم محتواها.

كانت الشركة قد نشرت ورقة بحث علمي عن نموذج Show and Tell قبل عامين، وفي العام الماضي تم تحديث النموذج وتحسين مستوى الدقة فيه، والآن أصبح مفتوح المصدر متاحًا على GitHub.


ويمكن للمطورين الآن تدريب نموذج الذكاء الصنعي هذا بسرعة أكبر من النماذج القديمة مثل DistBelief الذي كانت تستخدمه جوجل لتوليد وصف نصي عن محتوى الصور.

ودربت جوجل نموذج Show and Tell من خلال عرض صور ووصف نصي كتبه البشر ليتمكن من خلاله فهم الآلية وتوليد وصف أكثر دقة تلقائيًا. لكن هذا لايعني أن النموذج قادر على توليد وصف نصي فقط للصور التي يعرفها وتدرب عليها سابقًا بل حتى يمكنه توليد وصف نصي أصيل وخاص به.

الشركة تعد الشركة الأفضل في مجال التعرف على محتوى الصور بواسطة الذكاء الصنعي، حيث يكتفي المنافسون بالتعرف على بعض الأشياء في الصورة، تذهب قوقل أكثر لكتابة وصف نصي أيضًا. وأبرز قدرات قوقل نراها في خدمتها للصور حيث يمكنها البحث وعرض كل الصور التي تطابق كلمة البحث الخاصة بك حتى لو لم تضف وسم للصور.

الجريدة الرسمية