Виноват Microsoft Excel: ученые переименовали десятки человеческих генов из-за автоформатирования

08 августа 2020 | 06:00

Комитет по номенклатуре генов рекомендовал поменять названия у нескольких десятков человеческих генов. Причиной этого стало автоформатирование в Microsoft Excel, из-за которого в научных работах возникали ошибки. 

Об этом пишет The Verge.

Наименования генов обычно состоят из нескольких букв (чаще всего это аббревиатура, указывающая на назначение гена) и могут дополняться цифрами. Некоторые из ранее существовавших имен были схожи с названиями месяцев года, из-за чего Excel, которым в своих работах пользуются ученые по всему миру, интерпретировал их как даты. Например, при записи в ячейку Excel названия гена MARCH1 программа автоматически преобразовывала его в «1 марта».

В общей сложности за последний год Комитет по номенклатуре генов выпустил рекомендации по переименованию 27 генов. Так, например, MARCH1 стал MARCHF1, а SEPT1 — SEPTIN1.

The Verge отмечает, что хотя в Excel при заполнении таблицы можно отключить автоматическое форматирование, это не решает проблему: когда файл откроет другой человек, у которого эта функция по умолчанию включена, данные все равно преобразуются.

Ошибки такого рода являются чрезвычайно распространенными. В 2016 году было проведено исследование, участники которого изучили 3597 научных работ, опубликованных в рецензируемых научных журналах — примерно в каждой пятой нашли ошибки, вызванные автоматическим форматированием данных в Excel.

Ранее сообщалось, что команда ученых из Университета Эдинбурга исследовала развитие половых клеток эмбрионов мышей в попытке найти биологические пути, которые могли бы защитить их от прыгающих генов.