Skip to yearly menu bar Skip to main content


CURIE: Evaluating LLMs on Multitask Scientific Long-Context Understanding and Reasoning

Hao Cui · Zahra Shamsi · Xuejian Ma · Gowoon Cheon · Shutong Li · Maria Tikhanovskaya · Nayantara Mudur · Martyna Plomecka · Peter Norgaard · Paul Raccuglia · Victor V. Albert · Yasaman Bahri · Pranesh Srinivasan · Haining Pan · Philippe Faist · Brian Rohr · Michael Statt · Dan Morris · Drew Purves · Elise Kleeman · Ruth Alcantara · Matthew Abraham · Muqthar Mohammad · Ean Phing VanLee · Chenfei Jiang · Elizabeth Dorfman · Eun-Ah Kim · Michael Brenner · Sameera Ponda · Subhashini Venugopalan

Abstract

Chat is not available.