Лингвистические сигналы как мощный инструмент для прогнозирования и выявления случаев мошенничества

По материалам статьи Кристины Ганеа "USING LINGUISTIC CUES FOR DETECTING FRAUDULENT ACCOUNTS"

Я обсуждала со своим другом факторы, которые ухудшают качество активного портфеля акций инвесторов. Похоже, что управляющие фондами часто сталкиваются с одним или двумя активами, которые, обрушиваясь, оказывают давление на общую доходность портфеля.

Несомненно, причин для падения акций может быть много, но чаще всего это происходит вовсе не потому, что аналитики или инвесторы не смогли предвидеть неблагоприятные события. Вообще возможно ли предусмотреть все подобные случаи? Я уверена, что мнений по этому поводу также много, как много управляющих фондами. Но было бы несправедливо не заметить, что в некоторых случаях изменения цены связаны с опубликованным предупреждением о падении прибыли компании или еще хуже — с обнаружением факта подделки отчетности или сокрытия убытков организации.

Так что же можно сделать, чтобы избежать инвестирования в такие акции?

Поскольку я интересуюсь темой обмана и его обнаружения, мне тут же вспомнилась недавно попавшаяся мне на глаза статья об использовании судебно-бухгалтерской экспертизы и лингвистического анализа для прогнозирования мошенничества в финансовой отчетности. Похоже, что у методов судебно-бухгалтерской экспертизы есть определенные достижения в определении поддельной финансовой отчетности. Однако есть проблема и с этими методами: наряду с поддельными отчетами они идентифицируют мошенничество в случаях, которые в последствии признаются честными. Процент так называемых ложноположительных отчетностей достаточно высок.

Судебная бухгалтерия давно работает над определением предсказательной силы различных переменных и коэффициентов. С другой стороны, в лингвистике тоже трудились над тем, чтобы найти показатели, которые могут иметь предсказательную силу в выявлении случаев мошенничества.

Пурда и Скилликорн (2012) внесли свой вклад в решение проблемы существования большого количества ложноположительных отчетов и низкой предсказательной силы метода путем объединения бухгалтерского и лингвистического подходов.

Отрадно, что в результате, по-видимому, удастся, по крайней мере, снизить уровень ошибочных отчетов, если данные (финансовая отчетность) анализируются отдельно по каждой методике, а затем результаты сравниваются.

С коэффициентом ложноположительных результатов в 9 % и точностью правильной классификации выше 82 % применение данной методики для учета финансов выглядит многообещающе.

Еще одним свидетельством того, как много может лингвистика, является исследование Гоэля и соавторов (2012), в котором при изучении описательной части годового отчета была достигнута прогностическая точность 89 %.

Исследование показало, что: «мошеннические годовые отчеты содержали предложения в страдательном залоге, в них использовалось больше маркеров неопределенности, имели более высокие показатели коэффициента лексического разнообразия (я сама плохо понимаю, что это значит — авт.), их было труднее читать и понимать, чем несфабрикованные годовые отчеты».

Однако такие исследования нужно воспринимать со здоровой долей критики, так как они подвержены искажениям, связанными с размером и формированием выборки и наличием других методологических проблем, которые ограничивают возможности для получения тех же результатов в реальных условиях. Не говоря уже о необходимости в разработке программного обеспечения и временных затратах, которые потребуется для того, чтобы стать специалистом в его использовании и научиться интерпретировать результаты.

Исходя из моего собственного опыта работы в качестве менеджера фонда, я знаю, что время для глубокого анализа отдельной инвестиции достаточно ограничено. Конечно, «Блумберг» имеет несколько параметров оценки надежности в своем арсенале, позволяющих дать очень приблизительную оценку перед покупкой (например, Z-счет Альтмана), и я уверена, что есть ряд приложений на их платформе, которые могут добавить дополнительные параметры оценки.

Но что вы делаете, когда у вас есть предчувствие или подозрение, что что-то упущено, а впереди встреча с руководством компании и вы хотели бы получить более полное представление о ее надежности? Было бы здорово, записать разговор, потом вернуться, загрузить файл в приложение и увидеть выделение зеленым, там, где правда, и красным, где ложь.

Две проблемы:

Несмотря на то, что мне всегда очень хотелось записывать встречи (О Боже! Я несколько раз чувствовала это искушение), делать это скрыто было бы неэтично. Если вы попросите у руководителя организации разрешение на запись встречи — прощай раппорт и красочные ответы на ваши вопросы.
Нет ни надежного приложения, ни научной базы для его создания. Так что же делать?

На самом деле в такой ситуации могут быть полезны лингвистические показатели, и есть несколько индикаторов, которые вы сможете увидеть в реальном времени, конечно, если вы умеете их считывать. Исследователи выяснили, что, например, использование пауз в речи и неуверенные слова, специфика использования местоимений, эмоциональные высказывания, дифференциальные признаки или изменения языка, связаны с обманом. Кроме того, было обнаружено, что комбинации таких показателей, а еще лучше комбинации показателей по различным каналам коммуникации в результате позволяют дать более точную оценку правдивости.

Более подробную информацию вы можете найти в статье о системе SCAnR, которую еще придется проверить на пригодность использования к лексике финансового мира, но, к счастью, исследования уже проводятся.

694 просмотра