إن أنظمة الإجابة على السؤال الطبي (QA) لديها القدرة على الرد على أوجه عدم اليقين للأطباء حول العلاج والتشخيص عند الطلب، على علم بأحدث الأدلة.ومع ذلك، على الرغم من التقدم الكبير في عام ضمان الجودة التي أدلى بها مجتمع NLP، لا تزال أنظمة ضمان الجودة الطبية تستخدم على نطاق واسع في البيئات السريرية.أحد الأسباب المحتملة لهذا هو أن الأطباء قد لا يرجعون بسهولة مخرجات نظام ضمان الجودة، جزئيا لأن الشفافية والثقة بالثقة، ولم تكن الأصل اعتبارات رئيسية في تصميم هذه النماذج.في هذه الورقة، نناقش مجموعة من المعايير التي، إذا التقت، فمن المرجح أن تزيد من المرجح أن تزيد من فائدة أنظمة ضمان الجودة الطبية الحيوية، والتي قد تؤدي بدورها إلى اعتماد هذه النظم في الممارسة العملية.نقوم بتقييم النماذج والمهام والموادات الموجودة فيما يتعلق بهذه المعايير وتسليط الضوء على أوجه القصور من الأساليب المقترحة سابقا والشديد نحو ما قد يكون أكثر قدرة للاستخدام من أنظمة ضمان الجودة.
Medical question answering (QA) systems have the potential to answer clinicians' uncertainties about treatment and diagnosis on-demand, informed by the latest evidence. However, despite the significant progress in general QA made by the NLP community, medical QA systems are still not widely used in clinical environments. One likely reason for this is that clinicians may not readily trust QA system outputs, in part because transparency, trustworthiness, and provenance have not been key considerations in the design of such models. In this paper we discuss a set of criteria that, if met, we argue would likely increase the utility of biomedical QA systems, which may in turn lead to adoption of such systems in practice. We assess existing models, tasks, and datasets with respect to these criteria, highlighting shortcomings of previously proposed approaches and pointing toward what might be more usable QA systems.
References used
https://aclanthology.org/
Evaluation for many natural language understanding (NLU) tasks is broken: Unreliable and biased systems score so highly on standard benchmarks that there is little room for researchers who develop better systems to demonstrate their improvements. The
Infusing factual knowledge into pre-trained models is fundamental for many knowledge-intensive tasks. In this paper, we proposed Mixture-of-Partitions (MoP), an infusion approach that can handle a very large knowledge graph (KG) by partitioning it in
This paper describes the Tencent AI Lab submission of the WMT2021 shared task on biomedical translation in eight language directions: English-German, English-French, English-Spanish and English-Russian. We utilized different Transformer architectures
When a model attribution technique highlights a particular part of the input, a user might understand this highlight as making a statement about counterfactuals (Miller, 2019): if that part of the input were to change, the model's prediction might ch
This paper describes the submission of Huawei Translation Service Center (HW-TSC) to WMT21 biomedical translation task in two language pairs: Chinese↔English and German↔English (Our registered team name is HuaweiTSC). Technical details are introduced