firstbacksecondback
15 Results
Poster
|
Fri 11:00 |
Efficient multi-prompt evaluation of LLMs Felipe Maia Polo · Ronald Xu · Lucas Weber · Mírian Silva · Onkar Bhardwaj · Leshem Choshen · Allysson de Oliveira · Yuekai Sun · Mikhail Yurochkin |
|
Workshop
|
JMMMU: A Japanese Massive Multi-discipline Multimodal Understanding Benchmark Shota Onohara · Atsuyuki Miyai · Yuki Imajuku · Kazuki Egashira · Jeonghun Baek · Xiang Yue · Graham Neubig · Kiyoharu Aizawa |
||
Poster
|
Wed 16:30 |
BLEnD: A Benchmark for LLMs on Everyday Knowledge in Diverse Cultures and Languages Junho Myung · Nayeon Lee · Yi Zhou · Jiho Jin · Rifki Putri · Dimosthenis Antypas · Hsuvas Borkakoty · Eunsu Kim · Carla Perez-Almendros · Abinew Ali Ayele · Victor Gutierrez Basulto · Yazmin Ibanez-Garcia · Hwaran Lee · Shamsuddeen H Muhammad · Kiwoong Park · Anar Rzayev · Nina White · Seid Muhie Yimam · Mohammad Taher Pilehvar · Nedjma Ousidhoum · Jose Camacho-Collados · Alice Oh |