أوراق بحثية, رسائل ماجستير ودكتوراه حول الرؤية

توسيع الرؤية: منطق العمولة البصرية المتنوعة

140 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يتم تعريف المنزول على أنه المعرفة التي يوافق عليها الجميع. ومع ذلك، فإن أنواع معينة من المعرفة المنطقية مرتبطة بالثقافة والمواقع الجغرافية ويتم تقاسمها فقط محليا. على سبيل المثال، تختلف مشاهد مراسم الزفاف عبر المناطق الناجمة عن الجمارك المختلفة التي تتأثر بالعوامل التاريخية والدينية. ومع ذلك، حذفت هذه الخصائص الإقليمية عموما في العمل السابق. في هذه الورقة، نقوم بإنشاء مجموعة بيانات منطق مرئية للبصرية (GD-VCR) لاختبار قدرة النماذج في الرؤية واللغة على فهم المنطقية الثقافية والرائعة. على وجه الخصوص، نقوم بدراسة نماذج للرؤية واللغدية التي من بين الفنون، و Visualbert و Vilbert تدربت على VCR، وهو معيار قياسي مع الصور في المقام الأول من المناطق الغربية. بعد ذلك تقييم مدى جودة أن تعميم النماذج المدربة للإجابة على الأسئلة في GD-VCR. نجد أن أداء كلا النماذج للمناطق غير الغربية بما في ذلك شرق آسيا وجنوب آسيا وأفريقيا أقل بكثير من تلك الخاصة بالمنطقة الغربية. نقوم بتحليل الأسباب الكامنة وراء تباين الأداء وتجد أن فجوة الأداء أكبر على أزواج ضمنيا: 1) تشعر بالقلق من السيناريوهات المتعلقة بالثقافة، على سبيل المثال، حفلات الزفاف، الأنشطة الدينية، والمهرجانات؛ 2) تتطلب منطق المنطقي الجغرافي الرفيع المستوى بدلا من التصور والاعتراف بالترتيب المنخفض. يتم إصدار DataSet و Code في https://github.com/wadeyin9712/gd-vcr.

broaden the vision visual commonsense reasoning geo-diverse visual commonsense توسيع الرؤية منطق العمولة البصرية العمولة البصرية المتنوعة صناعة حمض الفوسفور المزيد..

كشف الاستعارة العصبي مع تضمين الرؤية

170 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نقدم نتائج جديدة لمشكلة تسلسل وضع الاستعارة، باستخدام تضمين الرؤية المتطور مؤخرا.نظهر أننا يتسلسلون مثل هذه الأنشطة إلى مدخلات بيلستمية يحصلون على تحسينات متسقة ومهمة أي تكلفة تقريبا، ونقدم المزيد من النتائج المحسنة عند الجمع بين تضمين الرؤية مع بيرت.

neural metaphor detection metaphor detection visibility embeddings اكتشاف الاستعارة العصبي اكتشاف الاستعارة وظائف الرؤية صناعة حمض الفوسفور المزيد..

تحسين المحاذاة عبر الوسائط في رؤية لغة الرؤية عبر المعلومات الأساسية

224 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

رؤية لغة الرؤية هي المهمة التي تتطلب وكيل للتنقل من خلال بيئة ثلاثية الأبعاد بناء على تعليمات اللغة الطبيعية. أحد التحدي الرئيسي في هذه المهمة هو التعليمات البرية مع المعلومات المرئية الحالية التي يترافق الوكيل. معظم العمل الحالي توظف اهتماما ناعما ع لى الكلمات الفردية لتحديد موقع التعليمات المطلوبة للعمل التالي. ومع ذلك، فإن كلمات مختلفة لها وظائف مختلفة في الجملة (على سبيل المثال، المعدلات ينقل السمات، الأفعال تنقل الإجراءات). يمكن أن تساعد معلومات بناء الجملة مثل التبعيات وهياكل العبارات الوكيل لتحديد أجزاء مهمة من التعليمات. وبالتالي، في هذه الورقة، نقترح وكيل التنقل الذي يستخدم معلومات بناء الجملة المستمدة من شجرة التبعية لتعزيز المحاذاة بين التعليمات والمشاهد المرئية الحالية. التجريبية، تتفوق وكيلنا على نموذج خط الأساس الذي لا يستخدم معلومات بناء الجملة على مجموعة بيانات الغرفة إلى الغرفة، خاصة في البيئة غير المرئية. بالإضافة إلى ذلك، يحقق وكيلنا الحديث الجديد في مجموعة بيانات الغرفة عبر الغرفة، والتي تحتوي على تعليمات في 3 لغات (الإنجليزية، الهندية، التيلجو). نظهر أيضا أن وكيلنا أفضل في محاذاة التعليمات مع المعلومات المرئية الحالية عبر تصورات نوعية.

vision language navigation improving cross-modal alignment vision language الرؤية لغة الملاحة تحسين المحاذاة عبر الوسائط لغة الرؤية صناعة حمض الفوسفور المزيد..

متعددة اللغات متعددة الوسائط التدريبية للتحويل الصفر - نقل عبر اللغات من نماذج لغة الرؤية

208 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تقوم هذه الدراسات الورقية بالتحويل عبر اللغات الصفرية إلى نماذج لغة الرؤية. على وجه التحديد، نركز على البحث عن نص متعدد اللغات والفيديو واقتراح نموذجا يستند إلى المحولات التي تتعلم أن تضمينات السياق متعددة اللغات متعددة اللغات. تحت إعداد طلقة صفرية، نوضح تجريبيا أن الأداء يتحلل بشكل كبير عند الاستعلام عن نموذج الفيديو النصي متعدد اللغات مع جمل غير إنجليزية. لمعالجة هذه المشكلة، نقدم استراتيجية متعددة الاستخدامات متعددة الاستخدامات متعددة اللغات، وجمع مجموعة بيانات تعليمية متعددة اللغات متعددة اللغات (متعدد HOWTO100M) للتدريب المسبق. تشير التجارب في VTT إلى أن طريقتنا تعمل بشكل كبير على تحسين البحث عن الفيديو في اللغات غير الإنجليزية دون شروح إضافية. علاوة على ذلك، عند توفر التعليقات التوضيحية متعددة اللغات، تتفوقت طريقة لدينا على خطوط الأساس الحديثة بواسطة هامش كبير في البحث عن نص متعدد اللغات للفيديو على VTT و Vatex؛ وكذلك في البحث النص متعدد اللغات إلى الصورة على multi30k. يتوفر نموذجنا ومتعدد HOWTO100M على http://github.com/berniebear/multi-ht100m.

zero-shot cross-lingual transfer cross-lingual transfer transfer of vision-language صفر النار نقل عبر اللغات نقل عبر اللغات نقل لغة الرؤية صناعة حمض الفوسفور المزيد..

كيف تؤثر الرؤية على اللغة: مقارنة اهتمامي عن النفس ملثمين في محول UNI-MODAL ومتعدد الوسائط

251 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

كانت مشكلة تفسير المعرفة المستفادة من قبل اهتمام ذاتي متعدد الأطراف في المحولات واحدة من الأسئلة المركزية في NLP. ومع ذلك، فإن الكثير من العمل يركز بشكل أساسي على النماذج المدربة لمهام UNI-MODAL، على سبيل المثال الترجمة الآلية. في هذه الورقة، نقوم بف حص اهتمامي عن نفسه في محول متعدد الوسائط مدربا لمهمة تقسيم الصور. على وجه الخصوص، نحن نختبر ما إذا كانت الوسيلة متعددة المهام تؤثر على أنماط الاهتمام المستفاد. أظهرت تصوراتنا المتمثلة في اهتمام ذاتي ملثمين أن المعرفة اللغوية العامة للمدخلات النصية، و (2) دمج أنماط اهتمامها من القطع الأثرية من طريقة مرئية على الرغم من أنها لم تصل إليها مباشرة. قارنا أنماط انتباه المحولات لدينا مع الاهتمام الملثمين في DistilGPT-2 تم اختباره لجيلي UNI-MODAL لنص التسميات التوضيحية للصور. بناء على خرائط أوزان الاهتمام المستخرجة، فإننا نجادل بأنه ملثم بالاهتمام الذاتي في محول تقسيم الصور يبدو أنه يعزز مع المعرفة الدلالية من الصور، مماثلة للحصول على معلومات مشتركة بين اللغة والرؤية في أنماط اهتمامها.

vision affects language comparing masked self-attention affects language الرؤية تؤثر على اللغة مقارنة اهتمامي عن النفس يؤثر اللغة صناعة حمض الفوسفور المزيد..

تأطير تفكيك: نموذج متعدد إشرافه متعدد إشرافه من إطارات الوسائط

217 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

فهم كيفية أخبار الإطار الإعلامي القضايا السياسية مهمة بسبب تأثيرها على المواقف العامة، ولكن من الصعب أتمتة. تركزت النهج الحسابية إلى حد كبير على تصنيف إطار مقال أخبار كامل بينما غالبا ما تكون إشارات تأطير خفية ومحلية. علاوة على ذلك، فإن تحليل الأخبار التلقائي هو مجال حساس، ويفتقر الفصوص الموجودة إلى الشفافية في تنبؤاتهم. تتناول هذه الورقة كلا من المشكلات مع نموذج جديد للإشراف، والتي تتعلم بشكل مشترك تضمين المعلومات المحلية حول الأحداث والجهات الفاعلة ذات الصلة في مقالة إخبارية من خلال إطار ترميز تلقائي، والاستفادة من هذه الإشارة لتصنيف إطار الوثيقة على مستوى المستند. تظهر تجاربنا أن: تتفوق النموذج لدينا النماذج السابقة من التنبؤ الإطار؛ يمكننا زيادة تحسين الأداء مع بيانات التدريب غير المسبق التي تستفيد من الطبيعة شبه الإشرفة لنموذجنا؛ وتأثير الحدث المستفيد و Ambeddings الممثل بشكل حدسي التوقعات على مستوى الوثيقة، مما يوفر تمثيلا إطارات إطارات محمولة ومهمة.

framing unpacked interpretable multi-view model media frame political تأطير تفريغ نموذج متعدد الرؤية القابلة للتفسير إطار وسائل الإعلام السياسية صناعة حمض الفوسفور المزيد..

التفكير فوق الرؤية واللغة: استكشاف فوائد المعرفة الإضافية

160 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يتم تعريف حدود قابلية تطبيق نماذج الرؤية واللغة من خلال تغطية بياناتها التدريبية. تتطلب المهام مثل الرؤية الإجابة على الأسئلة (VQA) في كثير من الأحيان معلومات المنطقية والواقعية تتجاوز ما يمكن تعلمه من مجموعات البيانات الخاصة بمهام المهام. تحقق هذه ا لورقة في حقن المعرفة من قواعد المعرفة العامة للأغراض العامة (KBS) إلى محولات الرؤية واللغة. نحن نستخدم هدف تدريب إضافي يشجع التمثيلات المستفادة على محاذاة مع شرطة الرسم البياني للكيانات المطابقة في KB. ندرس تجريبيا أهمية مختلفة KBS إلى مهام ومعايير متعددة. توفر هذه التقنية فوائد واضحة لاستكشاف السؤال المطلقة على المعرفة (OK-VQA، FVQA) من خلال التقاط المعرفة الدلالية والعلدية غائبة عن النماذج القائمة. أكثر من المستغرب، فإن هذه التقنية تفيد أيضا مهام التفكير البصري (NLVR2، SNLI-VE). نقوم بإجراء تجارب التحقيق وإظهار أن حقن المعرفة الإضافية ينتقلان مساحة الشريات التي تحسن من تمثيل أوجه التشابه المعجمية والدلالية. تقنية النموذج الأذرع ويمكن أن توسع قابلية تطبيق أي محول للرؤية واللغة مع الحد الأدنى من النفقات الحاسوبية.

supplemental knowledge vision-and language models exploring المعرفة الإضافية نماذج الرؤية واللغة استكشاف صناعة حمض الفوسفور المزيد..

التصنيف التلقائي للهياكل الجيولوجية باستخدام الرؤية الحاسوبية ونموذج التعلم العميق

1127 - Tianjin 2018 ورقة بحثية

دراسة الهياكل الجيولوجية المكشوفة على سطح الأرض ذات أهمية كبيرة بشكل عام وخصوصا في التصميم الهندسي والبناء. في هذا البحث ، استخدمنا 2206 صورة مع 12 ملصق للتعرف على الهياكل الجيولوجية بناءً على نموذج Inception-v3. تم اعتماد الصور ذات التدرج الرمادي و اللون في النموذج. كما تم بناء نموذج الشبكة العصبية التلافيفية (CNN) وتم تطبيق خوارزمية أقرب جار (KNN) والشبكة العصبية الاصطناعية (ANN) وتعزيز التدرج الشديد (XGBoost) في تصنيف الهياكل الجيولوجية بناءً على الميزات المستخرجة من مكتبة رؤية الكمبيوتر مفتوحة المصدر (OpenCV). أخيرًا ، تمت مقارنة أداء الطرق الخمس وأظهرت النتائج أن أداء KNN و ANN و XGBoost كان ضعيفًا وبدقة أقل من 40.0٪. أما CNN فعد عانت من فرط التدريب Overfitting. كان للنموذج الذي تم تدريبه باستخدام التعلم بالنقل تأثير كبير على مجموعة بيانات صغيرة من صور التركيب الجيولوجي. وأفضل نموذجين وصلوا إلى دقة 83.3٪ و 90.0٪ على التوالي. هذا يدل على أن النسيج هو السمة الرئيسية في هذا البحث. يمكن أن يستخرج التعلم القائم على نموذج التعلم العميق ميزات بيانات البنية الجيولوجية الصغيرة بشكل فعال ، وهو قوي في تصنيف صور الهيكل الجيولوجي.

الشبكات العصبونية الرؤية الحاسوبية التعلم الآلي التعلم العميق الشبكات العصبونية الالتفافية OpenCV الرؤية الحاسوببة والجيولوجيا المزيد..

متطلبات تطبيق التخطيط الاستراتيجي في الشركة العامة لمرفأ طرطوس – دراسة ميدانية

1429 - جامعة البعث 2017 ورقة بحثية

يهدف البحث إلى دراسة متطلبات تطبيق التخطيط الاستراتيجي في الشركة العامة لمرفأ طرطوس, من حيث تحديد المتطلبات الأساسية اللازمة لتطبيق التخطيط الاستراتيجي, و مدى وجود بعض هذه المتطلبات في الشركة العامة لمرفأ طرطوس.

Vision Strategic Planning التخطيط الاستراتيجي الرسالة Mission التفكير الاستراتيجي الرؤية الاستراتيجية Strategic Thinking المزيد..

الثقافة التنظيمية كأحد المتطلبات الرئيسة لنجاح إدارة المعرفة دراسة ميدانية في جامعة تشرين

1805 - جامعة البعث 2017 ورقة بحثية

هدف البحث إلى دراسة العلاقة بين الثقافة التنظيمية من جهة، و بين ممارسات إدارة المعرفة في جامعة تشرين من جهة ثانية، حيث قام الباحث بتوزيع استبانة على عينة من الكليات في جامعة تشرين بلغت ( 250 ) استبانة تم استرداد ( 228 ) استبانة منها، كان صالحاً من ها للاستخدام ( 158 ) استبانة. و لاختبار العلاقة قام الباحث باستخدام اختبار T ستيودنت لعينة واحدة، و كذلك معامل ارتباط بيرسون.

الثقافة التنظيمية Organizational Culture knowledge management إدارة المعرفة تشارك المعرفة تخزين المعرفة الثقة المتبادلة الرؤية المشتركة knowledge sharing knowledge storage mutual trust shared vision المزيد..

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد