Томас Штейнер, инженер центра клиентских решений Google в Германии, разработал программное обеспечение, выявляющее в интернет-энциклопедии Википедия статьи, созданные или отредактированные ботами, а не людьми. Подробно алгоритм работы он расписал в пре-принт архиве arXiv.
“Многие люди не осознают, что определенная часть информации, появляющейся в Википедии, размещается там при помощи ботов. Рост объемов Википедии таков, что одни лишь люди не могут обеспечить производство контента в таких объемах, особенно если мы говорим о людях-добровольцах”, – говорит Штейнер.
Чтобы обеспечить ввод контента и его последующее обновление, существуют боты – они схватывают данные из одного источника и помещают его в другой, но они сами по себе не являются ни авторами, ни редакторами статей. Она работают как аудиторы, автоматически подправляющие контент. Также немногие знают, что разработчики из Wikimedia создали платформу Wikidata, представляющую собой базу данных, позволяющую обмениваться статьями между версиями Википедий на разных языках. Кроме того, Wikidata позволяет автоматизировать многие аспекты управления мультиязычными данными.
Учитывая этот, а также ряд других факторов, проблема ботов в Википедии становится актуальной. Приложение Штейнера позволяет в реальном времени выявлять и демонстрировать бот-статьи, а также оценивать объем контента, генерируемый людьми и ботами. (Википедия/NovostIT)