Мультимодальные магистерские программы по интерпретации графиков
•Мультимодальные LLM (MLLM) могут интерпретировать изображения, но не всегда точно. •Для создания приложений, требующих интерпретации графиков, навыки LLM должны быть исключительными. •Магистранты должны были решить восемь задач, связанных с интерпретацией графиков. •Задачи включали гистограммы, линейные графики, круговые диаграммы и многослойные гистограммы. •Все модели успешно справились с базовыми гистограммами. •Llama 3.2 11b и GPT4o дали правильные ответы на линейные графики. •Llama 3.2 90B и GPT4o дали правильные ответы на круговые диаграммы. •Pixtral 12B и Gemini 1.5 дали неправильные ответы на круговые диаграммы. •Магистры не всегда могли точно интерпретировать данные на гистограммах. •LLM не всегда предоставляли логические шаги для интерпретации данных. •LLM могут успешно интерпретировать базовые гистограммы и линейные графики. •LLM не всегда точно интерпретируют круговые диаграммы и многослойные гистограммы. •LLM могут быть полезны для создания приложений, требующих интерпретации графиков.
Этот пост подготовила нейросеть: сделала выжимку статьи и, возможно, даже перевела ее с английского. А бот опубликовал пост в Сетке.