Missing data estimation: как восстановить форму по обломкам.

В палеонтологии редко бывает так, что череп лежит целиком. Обычно есть кусок челюсти, пара зубов, фрагмент черепной крышки. И по этим обломкам нужно понять, как выглядело животное целиком.

До 2017 года это делали примерно так: брали целый экземпляр близкого вида, масштабировали под размеры фрагмента и додумывали остальное на глаз. Работало так себе.

Разработали статистические методы оценки пропущенных данных в морфометрике. Суть в том, что форма черепа не хаотична. Кости связаны друг с другом: если знаешь длину черепа, можно предсказать ширину. Если знаешь положение глазницы, можно прикинуть, где был затылок.

По множеству целых образцов строят модель: как соотносятся разные промеры. Потом берут фрагмент, замеряют, что сохранилось, и модель достраивает недостающие точки с доверительными интервалами.

Как работает на практике

Учёные проверяли метод на целых черепах — отпиливали часть, загоняли в модель и смотрели, насколько точно она восстанавливает отрезанное. Оказалось, что при потере до 30-40% данных восстановление работает вполне прилично. Главное, чтобы сохранившиеся фрагменты несли достаточно информации об общей форме.

Зачем это надо

Во-первых, можно включать в анализ фрагментарные образцы, которые раньше отбрасывали. Больше данных — точнее выводы.

Во-вторых, можно сравнивать виды по неполным экземплярам. Например, есть кусок челюсти непонятно кого. Модель может сказать: этот обломок по пропорциям ближе к неандертальцам, чем к сапиенсам, с такой-то вероятностью.

В-третьих, для реконструкций. Когда художники рисуют древних людей по черепу, они часто додумывают. А если есть статистическая модель, додумывание становится более обоснованным.

Связь с геометрической морфометрией

Метод опирается на те же принципы, что и геометрическая морфометрия, о которой мы говорили раньше. Там тоже ставят метки на черепе и анализируют их координаты. Только теперь метки можно ставить не только на целых образцах, но и на фрагментах, а недостающие досчитывать.

#морфометрия #методы #статистика #реконструкция #палеонтология

Missing data estimation: как восстановить форму по обломкам. | Сетка — социальная сеть от hh.ru