В статье описываются экспериментальные исследования устойчивости словосочетаний и способы их количественной оценки в синхронии и диахронии. Количественная оценка лингвистических данных и математические методы их обработки представляют большой интерес для лингвистов. Богатым источником статистической информации являются корпуса текстов. Однако существует проблема верификации и достоверности данных, получаемых на основе корпусов. Для реализации потенциальных возможностей корпус должен удовлетворять таким требованиям, как репрезентативность (объем) и сбалансированность (качество).