Статистическая оценка баскетболиста

Автор: Пользователь скрыл имя, 22 Ноября 2011 в 16:15, курсовая работа

Описание работы

Соревновательная деятельность в баскетболе представляет собой спортивное единоборство двух команд, и результат этой борьбы зависит от множества факторов и действий более чем десяти игроков. Объективную информацию об эффективности соревновательной деятельности в баскетболе дают результаты соревнований. Однако спортивный результат как интегральный показатель не всегда детально информирует о составе и структуре тех или иных технико-тактических действий, победа или поражение сами по себе не дают конкретной информации об эффективности каждого из игроков в отдельности. Игровая деятельность баскетболистов состоит из большого количества игровых показателей в нападении и защите. Поэтому возникает задача оценить действия игрока на площадке с помощью каких-либо статистических показателей. Было созданы множество формул коэффициента полезности игрока, но ни одна из них, пожалуй, не отражает адекватно совокупность индивидуальных и командных действий игрока. Традиционно игрок оценивается по следующим действиям, произведенным на площадке: набранные очки, атакующие передачи, перехваты, блок-шоты, подборы, фолы соперника, фолы собственные, промахи, потери.

Содержание

Введение 3

Глава 1

1.1 История развития баскетбола 4

1.2 Статистические методы, используемые для оценки эффективности игрока 9

Глава 2

2.1 Обзор существующих статистических подходов к оценке полезности игрока 14

2.2 Разработка методики оценки полезности игрока 19

2.3 Рекомендации к применению разработанной методики 22

Заключение 27

Список литературы 28

Приложения 29

Работа содержит 1 файл

Возможность статистической оценки действий игрока в баскетболе (окончательный вариант).doc

— 457.50 Кб (Скачать)
    1. Статистические  методы, используемые для оценки эффективности игрока
 

Для оценки действий игрока на площадке используется коэффициент  полезности игрока, о котором будет  подробнее рассказано ниже. Для интерпретации  КПИ следует опираться на методы математической статистики, которые  позволяет дать рекомендации к его использованию.

Рассмотрим основным методы математической статистики, которые  будут использоваться в данной работе.

В своей практике естествоиспытателю приходится обрабатывать большие массивы данных, полученных в результате эксперимента путем измерений, наблюдений, анализа проб и т.п. Часто этим данным присуща изменчивость, вызванная случайными ошибками. Природа этих ошибок может быть различной: погрешность измерительных приборов, неоднородность образцов проб и др. Как правило, экспериментатор имеет возможность многократно повторить свой опыт и получить большое количество однородных данных. Затем перед исследователем встает задача обработки этих данных, чтобы извлечь как можно более точную информацию об измеряемой величине. Приступаем к изложению базовых принципов и методов статистической обработки данных.

Выборка

Отправной точкой любого статистического анализа  являются данные, полученные экспериментатором  в результате опыта. Допустим, что  опыт состоял из повторных измерений некоторой неизвестной величины и в результате получены значения . Эти значения естественно считать реализацией набора из независимых одинаково распределенных случайных величин с неизвестной функцией распределения  . Вектор данных

называется  независимой выборкой объема из неизвестного распределения  .

Часто встречается  ситуация, когда экспериментатор  имеет основания предполагать, что  неизвестное распределение принадлежит  некоторому семейству распределений  , зависящему от параметра . В этом случае проблема статистического анализа сводится к получению информации об этом неизвестном параметре.

Гистограмма частот

Наглядное (но, вместе с тем, довольно приближенное) представление о неизвестном распределении можно получить при помощи гистограмм. Пусть - независимая выборка из неизвестного распределения  . Выберем два числа и , чтобы все числа попали внутрь интервала . Разобьем этот интервал на конечное число меньших интервалов:

где . Обозначим через длины интервалов разбиений. Теперь произведем так называемую группировку данных (выборки), а именно, для каждого интервала разбиения объединим в группу те , которые попали в этот интервал. Пусть - число таких элементов выборки:

Определим функцию 

График функции  и называется гистограммой.

Таким образом, гистограмма представляет собой график кусочно-постоянной функции, такой, что площадь столбца с основанием, например, равна частоте попадания измерений в этот интервал группировки. Гистограмма является выборочным аналогом плотности распределения.

Выборочное  среднее и выборочная дисперсия.

Иногда исследователь  ставит перед собой более конкретную проблему: как, основываясь на выборке, оценить интересующие его числовые характеристики неизвестного распределения, не прибегая к приближению этого  распределения как такового, то есть без построения выборочных функций распределения, гистограмм и т.п.

В данном параграфе обсудим простые выборочные аппроксимации для математического ожидания и дисперсии. Замечательно то, что они применимы в очень общей ситуации. Мы будем предполагать, что независимая выборка взята из неизвестного распределения, у которого существует математическое ожидание и дисперсия (обозначим эти неизвестные значения, как и соответственно). Величины, вычисляемые по выборке,

 
 
 

называются выборочным средним и выборочной дисперсией. Следует особо подчеркнуть, что определенные выше величины зависят только от выборки. Следующее предложение объясняет, почему естественно считать выборочным аналогом математического ожидания, а - выборочным аналогом дисперсии. Математические ожидания и совпадают с оцениваемыми неизвестными величинами:

 

Дисперсия стремится к нулю при росте объема выборки.  

Статистическое  оценивание параметров. 

При построении оценок параметров в данной работе используется метод наибольшего правдоподобия. Расскажем о нем подробно. Пусть, - независимая выборка из распределения с функцией распределения , зависящей от неизвестного параметра . Определим функцию правдоподобия, полагая

если  - абсолютно непрерывна и имеет плотность , либо

если  есть функция распределения некоторой дискретной случайной величины  , причем .

Переменные  следует считать основными для функции , а - дополнительными параметрами. Считая фиксированными, найдем точку , в которой функция правдоподобия принимает наибольшее значение. Понятно, что эта точка будет зависеть от заранее фиксированной выборки , следовательно, мы получим набор функций от выборки:

 
 

что и будет  искомой оценкой по методу наибольшего правдоподобия.

Критерий согласия Колмогорова

Часто при проверке гипотез о распределении тех  или иных данных недостаточно применить  какой-то один критерий, в особенности, когда данные наблюдений не показывают значимого отклонения от гипотезы, и ситуация представляется сомнительной. В этих случаях целесообразно воспользоваться другими критериями, основанными на других вероятностных идеях, чтобы при их помощи подвергнуть анализу те же данные. Таким образом, очень важно иметь широкий арсенал методов для статистической обработки данных.

Критерий Колмогорова, о котором идет речь ниже, очень широко применяются в случае непрерывных функций распределения.

Мы ограничимся  лишь рассмотрением случая простой  гипотезы

Основой всех методов  является рассмотрение некоторой удачно выбранной меры расхождения между выборкой и гипотетическим распределением, а также возможность описать асимптотическое распределение этой меры расхождения при росте объема выборки. В случае критерия Пирсона этой мерой расхождения была функция .

Для критериея Колмогорова выбор меры расхождения связан с эмпирической функцией распределения  . А именно, рассматривается статистика Колмогорова

Замечательно  то, что эта функция легко могут быть вычислены по выборке (не требуется брать какие-либо интегралы, все сводится к простым выражениям, содержащим конечное суммирование и взятие максимума). Верна теорема Колмогорова: Если гипотеза  верна и непрерывна, то

  1. распределение статистики является одним и тем же для любой функции распределения и
  2. у последовательности существует предельное распределение при .

Это предельное распределение носит название распределения Колмогорова.

Теорема Колмогорова является основой для построения соответствующих критериев согласия с критическим множеством вида

   

соответственно. Число С1 определяются по заданным уровням значимости из таблиц до предельных (или предельных, если очень велико) распределений Колмогорова. 

Глава 2

2.1 Обзор существующих  подходов к оценке  полезности игрока 

Существующие  формулы для оценки полезности игрока:

Как в европейском, так и в американском баскетболе существуют различные методы расчета полезности действий игрока на площадке.

В США рассчитывают по формуле принятой в НБА: 
(броски попал-броски сделал-потери+очки+подборы+передачи+перехваты+блок-шоты) / кол-во игр.

Получается какая-то условная единица, близкая по смыслу к очкам. Благодаря такой формуле  и вычисляется истинный вклад  в игру игроков как Аллен Айверсон или Кобе Брайант, которые набирают по 40 очков, но при этом попадают 15 из 50 бросков и делают по 5-6 потерь. Итог - очень низкая эффективность. В НБА сейчас самую высокую эффективность имеет Кевин Гарнетт. За всю историю – Майкл Джордан, Шакилл ОНил, Тим Данкан.  
Эта оценка исходит из понимания баскетбола. На минуты взвешивать не нужно. Так как игроки основы играют 30-35 минут и делят между собой очки и другие показатели, им тяжело играть все время, но почему-то им дают это время. А человек, который выходит на 5 минут в конце игры при разнице в 30 очков, когда все решено и борьбы нет, может набрать и 10 очков с 5 подборами, но это не будет решающим показателем. Эта формула для игроков стартовой пятерки, для оценки их звездности и вклада в игру.

     В Европе существуют два варианта расчета КПИ:

  1. INDEX= (POINTS– MISSED SHOTS+ REBOUNDS+ ASSISTS+ STEALS+BLOCKS-T/OVER) /TIME PLAYED (7 MINS MIN PLAY),

INDEX – индекс эффективности технико-тактического мастерства игрока

POINTS – очки

MISSED SHOTS – неточные броски

REBOUNDS –подборы мяча

STEALS –перехваты

BLOCKS – блок-шоты

T/OVER – ошибки

TIME PLAYED – время пребывания игрока на

площадке, минуты (минимум – 7)

        2)  ЕвроКПИ (рейтинг за матч)="положительные статсы" (очки+подборы+передачи+перехваты+заработанные фолы+бло-шоты) минус "отрицательные статсы" (смазанные броски (штрафные тоже), потери, фолы)

  Эти два показателя идентичны, только в расчете первого происходит взвешивание на время, но это время должно быть не менее 7 минут, иначе показатель просто не рассчитывается. Второй же показатель, который называется ЕвроКПИ, иногда применяется в нашей стране и показывает абсолютное превышение положительных действий над отрицательными и, наоборот, без учета времени, проведенного на площадке.

Основной минус  в том, что все действия считаются  равноценными, хотя в этом и состоит  удобство этого коэффициента.

Вариант, предложенный литовскими специалистами

КПИ=1,5*СЩ+2*ЧЩ+1,5*ПХ+1,5*БШ+2*АВ+ШБт-1,5*ШБт+3*СБт  –   

СБн + 4*ДБт  – ДБн – 1,5*П/СВ.

О – набранные  очки

АВ – атакующие  передачи (передачи, после которых  партнер произвел бросок)

ПХ – перехваты

БШ – блок-шоты

СЩ – подборы  на своем щите

ЧЩ – подборы  на чужом щите

ФС – фолы соперника на игроке

СБт - точные средние  броски

ДБт - точные дальние  броски

ШБт - точные штрафные броски

СБн – неточные средние броски

ДБн – неточные дальние броски

ШБн – неточные штрафные броски

П – потери

СВ – сыгранное  время

Эта формула  очень схожа с формулой, по которой  аналогичный коэффициент рассчитывается в РФБ.

В России статистическая оценка игрока проводится на основе следующей  формулы:

КПИ РФБ = (О+АВ+1,4*ПХ+1,2*БШ+1,2*СЩ+1,4*ЧЩ+0,5*ФС – СБн -  1,5*ДБн – 0,8*ШБн – 1,4*ПП – ПТ – Ф) / СВ.

О – набранные  очки

АВ – атакующие  передачи (передачи, после которых  партнер произвел бросок)

ПХ – перехваты

Информация о работе Статистическая оценка баскетболиста