تعتمد مطورو نماذج جيل النص على مقاييس التقييم الآلي كمستقلة للتقييمات اليدوية البطيئة والمكلفة. ومع ذلك، كافحت مقاييس تقسيم الصور لإعطاء تقديرات مستفادة دقيقة للنجاح الدلالي والبراغماتي لنص الإخراج. نحن نتطلع إلى هذا الضعف عن طريق إدخال أول متري تعلم القيادة المستفادة لتقييم أوصاف الصورة. نهجنا مستوحى من النظريات الحاسوبية للتخلص من أهداف المعلومات باستخدام الاتساق. نقدم مجموعة بيانات من الصورة - وصف أزواج المشروح مع علاقات الاتساق. ثم قمنا بتدريب مقياس عمل متماسك على مجموعة فرعية من مجموعة بيانات التسميات المفاهيمية وقياس فعاليتها --- قدرتها على التنبؤ بالتصنيفات البشرية للتسميات التوضيحية الإنتاجية --- في مجموعة اختبار تتكون من صور خارج المجال. نوضح معامل ارتباط كيندل كيندل كيندل لتقسيطنا المقترح مع الأحكام الإنسانية لنتائج عدد من نماذج تواتير التسمية التوضيحية لمواصلة التماسك الواحد عند مقارنتها بالعديد من المقاييس الأخرى بما في ذلك المقاييس المستفادة المقترحة مؤخرا مثل bleurt و bertscore.
Developers of text generation models rely on automated evaluation metrics as a stand-in for slow and expensive manual evaluations. However, image captioning metrics have struggled to give accurate learned estimates of the semantic and pragmatic success of output text. We address this weakness by introducing the first discourse-aware learned generation metric for evaluating image descriptions. Our approach is inspired by computational theories of discourse for capturing information goals using coherence. We present a dataset of image--description pairs annotated with coherence relations. We then train a coherence-aware metric on a subset of the Conceptual Captions dataset and measure its effectiveness---its ability to predict human ratings of output captions---on a test set composed of out-of-domain images. We demonstrate a higher Kendall Correlation Coefficient for our proposed metric with the human judgments for the results of a number of state-of-the-art coherence-aware caption generation models when compared to several other metrics including recently proposed learned metrics such as BLEURT and BERTScore.
References used
https://aclanthology.org/
This work aims to explane and analysise some cosmic
particles that reach to the earth with super high energy
using the hypothesis of increasing the speed of light dated
to ancient past time ,based on the energy conservation law
and the mechanism
Abstract While pretrained language models (LMs) have driven impressive gains over morpho-syntactic and semantic tasks, their ability to model discourse and pragmatic phenomena is less clear. As a step towards a better understanding of their discourse
Zero-shot cross-domain dialogue state tracking (DST) enables us to handle unseen domains without the expense of collecting in-domain data. In this paper, we propose a slot descriptions enhanced generative approach for zero-shot cross-domain DST. Spec
Text generation from semantic graphs is traditionally performed with deterministic methods, which generate a unique description given an input graph. However, the generation problem admits a range of acceptable textual outputs, exhibiting lexical, sy
We study the impact of using rich and diverse textual descriptions of classes for zero-shot learning (ZSL) on ImageNet. We create a new dataset ImageNet-Wiki that matches each ImageNet class to its corresponding Wikipedia article. We show that merely