Твиттер и прогнозы на спорт



Идея исследования коллективного разума относительно спортивных прогнозов не нова. Твиттер – это отличная площадка для такого анализа. Благодаря ограничению в 140 символов получилось использовать средства автоматической обработки сообщений и их анализа. Эксперты исследовали англоязычные просторы из-за распространенности языка и словообразования, удобного для машинной обработки.

Американский футбол

Исследователи работали со статистикой NFL 2010-12 и футбольными твитами того же времени. Сообщения обрабатывались по хэштегам, поэтому каждая запись говорила однозначно о победе или проигрыше. 

После того, как исследователи научились правильно извлекать информацию и обсчитывать ключевые слова в твитах, началось составление собственных прогнозов. Если использовался только твиттер, то точность прогнозов получилась 54,3% на тотал и 47,6% на фору. Обучение программы позволило получить следующие данные на 2012 год:
       • исход – 63,%;
       • фора – 52%
       • тотал – 44,1%.

Матчи АПЛ

Под прицел попали матчи весны 2014 года. Исследовали футбольную статистику и около 2 млн твитов. Не обошлось без затруднений в расчетах из-за разности в популярности команд. МЮ и «Ливерпуль» посвящали более 400 тысяч сообщений, а Swansea и Fulham пришлось довольствоваться 15,5 тысячами. При обработке статистики учитывали множество факторов – угловые, штрафы, карточки, удары по воротам и средний счет. Исследователи получили следующие результаты точности прогнозов:
       • твиттер – 56%-75%;
       • статистика – 51-64%;
       • статистика и твиттер – 64-75%.
Результаты обнадеживающие, даже одной социальной сети достаточно для достижения неплохой точности прогнозирования. Так что перед ставкой стоит проверить настроения в твиттере, возможно информация оттуда поможет принять верное решение.