?

Log in

No account? Create an account
О спортивных статистических базах данных в интернете - Dmitry
December 5th, 2008
11:39 am
[User Picture]

[Link]

Previous Entry Share Next Entry
О спортивных статистических базах данных в интернете
Речь об официальных базах результатов, которые ведутся спортивными федерациями по своим соревнованиям за несколько лет (иногда за несколько десятков лет). У всех баз, которые я встречал, есть один серьезнейший изъян - ни в одной базе у одного спортсмена с одним id нет возможности фиксировать изменения его/ее личной информации за годы выступлений.

Скажем, меняет человек гражданство и начинает выступать за другую страну - ему меняют нац.принадлежность в профайле - и в старых результатах он появляется с новой родиной. Таких примеров в статистике на сайте FIS - тьма.

Или, скажем, меняет спортсменка фамилию, выйдя замуж - в базе ее записывают по-новому и теперь в ее результатах за все предыдущие годы она будет отображаться строго с новой фамилией. То есть Ольгу Пылеву в базе IBU теперь найти нельзя, если не знать, что она стала Медведцевой.

Или, например, данные по росту-весу. Во всех профайлах всегда и везде данные только текущие. То есть посмотреть, с каким весом Рафа Надаль начинал играть в АTP, из стат.базы АТР невозможно.

В общем, удивительно, что никто не пытается сохранять такие изменения, чтобы старые архивные результаты отображались без ошибок. Понятно, что это в большей степени вопрос к архитектуре используемой БД, но вопрос-то явно решаемый!

Нашей базе еще только предстоит подобная переделка, но задача хранить и выводить такие изменения будет непременно поставлена.

(14 comments | Leave a comment)

Comments
 
[User Picture]
From:makki
Date:December 5th, 2008 10:08 am (UTC)
(Link)
ох взялся ты за дело с размахом)
[User Picture]
From:diesell
Date:December 5th, 2008 10:33 am (UTC)
(Link)
Ваня, самое главное, что совершенно не желая того крупные стат.базы 1) "портят" сами себя, потому что нужные данные по искомым людям становится почти невозможно найти, 2) предоставляют широкое поле для категорически неверных обобщений.

Ну и лично меня, как человека с историческим образованием, невероятно плющит от описанных в постинге ляпов...
[User Picture]
From:makki
Date:December 5th, 2008 10:45 am (UTC)
(Link)
ну мне кажется сначала нада все таки технику подтягивать а потом уж и данными заниматься в том числе и используя труд стажеров каких нибудь)
[User Picture]
From:diesell
Date:December 5th, 2008 12:31 pm (UTC)
(Link)
не понял, о какой ты технике говоришь
[User Picture]
From:makki
Date:December 5th, 2008 12:39 pm (UTC)
(Link)
Ну технической стороне дела
[User Picture]
From:skor_12
Date:December 5th, 2008 11:49 am (UTC)
(Link)
Дмитрий, раз уж рассказал о планах, то приоткрой для неосведомлённых - где ты сейчас трудишься?
[User Picture]
From:skor_12
Date:December 5th, 2008 11:50 am (UTC)
(Link)
в КХЛ?
[User Picture]
From:diesell
Date:December 5th, 2008 12:31 pm (UTC)
(Link)
хм, а я-то думал, что всем всё рассказал полтора месяца назад - http://diesell.livejournal.com/297216.html
From:chitatel04
Date:December 6th, 2008 07:47 pm (UTC)
(Link)
Дима, так в базе данных просто не отслеживаются перемещения людей с одного рабочего места на другое:-)
[User Picture]
From:dotslashmute
Date:December 5th, 2008 01:05 pm (UTC)
(Link)
Ресурсоёмкая задачка получается. С одной стороны, надо иметь таблицы с неким постоянным идентификатором человека, а с другой -- отдельные таблички-срезы на разные времена (которые для разных людей будут разными), привязанные к этому идентификатору.

С фамилией проще. Основная плюс интервалы в прошлом, когда она отличалась, и натаскать программу на корректный вывод.
[User Picture]
From:diesell
Date:December 5th, 2008 01:24 pm (UTC)
(Link)
насчет "табличек-срезов" - дело в том, что хранимая статистика спортивных выступлений каждого человека в такой базе, вероятнее всего, уже так и организована - данные за каждый сезон, сгруппированные по определенному шаблону, и являются "табличкой-срезом".
Штука в том, чтобы показатель "имя/фамилия" не являлся свозным - сквозным будет только id. А имя-фамилия (национальность, рост-вес, и т.п.) за каждый сезон хранятся в отдельных несквозных полях, что позволяет в случае необходимости выводить разницу.

В случае с хоккеистами есть проблема более суровая - один человек за сезон может играть в нескольких клубах, и при этом он может сменить гражданство (когда получает российский паспорт). А за карьеру он может в одном клубе поиграть несколько раз. И статистику по нему надо уметь выворачивать как по-сезонно, так и по-клубно.

кстати, смена фамилий у хоккеистов не такая уж редкость - у иностранцев, которые могут быть заявлены разными клубаи с разными вариантами написания фамилии. Или у тех же латышей, которые сначала были обычными Иванами Ивановыми, а теперь заявлены как Иванс Ивановс - но в предыдущие-то годы они именовались иначе...
[User Picture]
From:dotslashmute
Date:December 5th, 2008 01:31 pm (UTC)
(Link)
Я потому и говорю, что эти срезы, точнее, их привязка по времени будет разной для каждого человека.
[User Picture]
From:diesell
Date:December 5th, 2008 01:35 pm (UTC)
(Link)
но способ-то и правила привязки будут едиными :)
[User Picture]
From:dotslashmute
Date:December 5th, 2008 01:37 pm (UTC)
(Link)
Естественно, иначе это будет нечто странное :)))))
My Website Powered by LiveJournal.com