Advanced Statistics

Begonnen von GermanNuck, 14. Juli 2012, 12:28:55

« vorheriges - nächstes »

GermanNuck

Für all diejenigen, die an einer etwas zahlenorientierteren Saisonvorschau interessiert sind, hier mal meine Vorschau auf die kommende Saison:

Eastern Conference
Western Conference
5 Plus Spieldauer - #fancystats für Deutschland

GermanNuck

Mal ne ganz kurze Werbung in eigener Sache  :grins:

Alle, die die Konzepte in dem Thread hier nicht völlig uninteressant fanden, können ab jetzt auf 5 plus Spieldauer mehr davon lesen. Der Blog wird sich hauptsächlich mit der DEL beschäftigen, auch wenn sicher die NHL oder andere Ligen angesprochen werden. Nebenbei sind noch einige Blogs/Seiten aufgeführt, die der analytischeren Herangehensweise nicht abgeneigt sind.

Kritik, Verbesserungsvorschläge, Fragen, Ideen, Hilfe, etc. sind natürlich erwünscht, ob als Kommentar, per Mail (5plusspieldauer at gmail . com) oder hier im Forum!  :grins:

LG
5 Plus Spieldauer - #fancystats für Deutschland

Flames1848

Ich empfehle dir das Buch Moneyball zu lesen. Ist die paar $ wirklich wert!
Hövelgriller auf Instagram --> https://www.instagram.com/hoevelgrillerbbq/

GermanNuck

Hier ein Ausschnitt eines Interviews mit Mike Gillis (Manager der Vancouver Canucks) zum Thema ''Moneyball'':

(herausgehoben habe ich hier die offiziellen Zitat von Mike Gillis, den Artikel verfasst hat Cam Charron.)

Eventually, Matt asked Mike about analytics and Moneyball, the Art of Winning an Unfair Game. Gillis is the leader of one of hockey's most successful organizations over his tenure, and fans of all teams may be interested in what he said. A transcript follows below, plus a few comments.

ZitatIt's different for different positions. For forwards it's a combination of shots on net, quality of shots on net, location of shots on net versus time on ice. You know, there's a number of stats that go into it, but one of the reasons that Moneyball was intriguing to me, was that—I taught about it at law school and talked about it a lot—was what happens when a team is forced to look at something differently.


And forced to go against the grain and forced to change the rules to their benefit so they can be competitive. And the biggest thing that I got from Moneyball was not statistical analysis but it was that ability to think differently when you're not forced to, when you want to. And when you want to create a different culture and a different environment. And the fact that they were successful that leads me to believe that you can be successful doing it without being forced to do it.

Who takes an issue with this? The Oakland A's were forced to re-think certain things because they didn't have the money to traditionally compete. But it's not like Billy Beane invented on-base percentage to get a leg up. This was a long-time direction of the A's, as they focused on player value and finding market inefficiencies ever since the days of Beane's predecessor Sandy Alderson.

A lot of people misinterpret Moneyball as being solely about the stats, but finding market inefficiencies can mean a number of things. Drafting, for instance. Gillis has always thought things differently even as an agent. On Gillis' first day of free agency as a general manager, he signed David Backes to an offer sheet contrary to the gentleman's rules of the game.

But do the Canucks use statistics? Indeed I bet they do:

ZitatWe do use advanced analytics to some measure. It's more difficult in hockey than in baseball because baseball is a defined event. You've got 100 different things that go into player success. Who they play for, match ups they constantly play against. Their age. Injury history. So you've got lots of things that are determinant factors in hockey that can't be properly analyzed just through analytics.In baseball you can.

What we've done is look at things and try to design success, particularly for younger players, based on where they're starting. And who they're playing with and what situations they're playing with and the number of minutes they play. And I've become convinced that you can really begin to enhance a young player's ability by putting them in situations where they're going to be able to succeed almost all the time and the only way you can do that is if you have the luxury of having a good team. If you don't have, if you're in a rebuilding stage or something that might not have the luxury to design those ice times the way you'd want, but here we're fortunate, we have a good team, we can do what we want.

We do know that Mike Gillis has experimented with boosting a young player's offensive numbers through offensive zone deployment. We also know that the Vancouver Canucks have a zone-start discrepancy that's unprecedented in the NHL.

Pay attention though to the bolded section. Gillis believes that having depth and talent means more lineup flexibility. Falls into the "well, duh" category, but I think this shows that a player like, say, Jay McClement may be less valuable on the Toronto Maple Leafs than a team like the Chicago Blackhawks. Accumulate talent, let the roles fall where they may.

The research also shows that players do better offensively when they start more shifts in the offensive zone.

Here's Gillis on soccer analytics:

ZitatWell oddly enough we have looked at [passing efficiency] in soccer. And we put that in a very different context, we've looked at it relative to fatigue and conditioning and how you're percentage of passing success is relative to your conditioning and the time in the game when you do it and how many minutes you've played. There are studies that we've looked at that indicate that passing percentage in soccer goes dramatically down depending on the time in the game or depending on the conditioning of the player.

That's through practice, that's through defined, you know, not in the spontaneity of the game and so there are things from other sports that we've been trying to utilize as much as we can. The problem in our sport is that when you combine hitting and you combine puck battles, that takes it away from every other sport.


Fatigue seems to be a common theme. Are the Canucks counting passes, or looking at splits from the first and third period?

ZitatWe're trying to define fatigue levels in those circumstances and as you know, a player usually gets hit twice when he gets hit once. He gets hit by the player and then hits the boards. How you can attribute that to success and how you attribute that to fatigue levels is instrumental in finding out when a player in the third period makes a mistake. And something happens and I think that as we've found, in a dynamic, competitive contact sport that fatigue levels are really a lot of the determining factor in success or failure.

Worth noting something from here because I was curious. Since Gillis was hired, the Canucks are the best team in the NHL in third period Pythagorean Expectation, a win-loss estimator based on goals for and against. They're a very close second to Boston in overall score.

But the big improvement for the Canucks in the last four years is in the third period. Pythagorean Expectation predicted 50 wins from the Canucks in the Gillis era per year (actual, 49.8) and 43.2 in the four previous seasons (actual, 43.3). That's an increase of 16%.

But where did the increase come from? They actually lost ground in the second period, their win expectancy dipping by 8% in the middle frame in the Gillis era, but that's propped up by a 23% gain in the first period and a 35% increase in the third period.

The median NHL team won an equivalent of 42.2 games pro-rated to 82 games in the first period over the last four years according to Pythagorean Expectation. In the second period, that dipped to 41.6 and in the third and overtime it dipped to 41.1, so perhaps the average team does get impacted by fatigue. Honestly, I'd never really looked into this but you run into all kinds of fascinating things when you do period splits.

Also, then you have to define mistakes, which is a whole other ballpark. Hockey statisticians are measuring how the team does when a player is on or off the ice, but individual contribution indicators are still in their infancy.

Lastly...

ZitatYou need defencemen who can handle big minutes because they're constantly in today's NHL being challenged, hit, challenged speed-wise in their own zone and then they have to make really good passes, outlet passes, and that's what differentiates those great defencemen from the ones that are really good.

I can't disagree with this. There are four positions on an NHL roster that I'd consider overpaying for: your No. 1 centreman, your No. 2 centreman, your No. 1 defenceman and your No. 2 defenceman. All four of those players should be equally adept at offence and defence. Vancouver are lucky to have a deep enough bottom six forward group that their number one centreman doesn't exactly have to play defence.

Los Angeles had Anze Kopitar, Jeff Carter, Drew Doughty and Willie Mitchell. St. Louis have David Backes, Alexander Steen, Alex Pietrangelo and Barrett Jackman. Boston had Patrice Bergeron, David Krejci, Zdeno Chara and, well, the other half of Zdeno Chara in their Stanley Cup year.

Whatever helps the team find the "great" one as opposed to the "really good" ones. You can make do with really good players up and down the lineup, but there's no substitute for great players.


Falls jemand Interviews oder interessante Artikel zu diesem Thema findet/gefunden hat, nur her damit!
5 Plus Spieldauer - #fancystats für Deutschland

Flames1848

Zitat von: Jake The Rat am 17. Juli 2012, 11:12:50
Was ist Baseball? :confused:  Wer ist Billy Bean? :gruebel:  Der Gründer von Beantown? :grins:

Der Mann der die erweiterte Statistik hoffähig gemacht hat. Google mal Moneyball. Sein System nutzt zB auch Liverpool.
Hövelgriller auf Instagram --> https://www.instagram.com/hoevelgrillerbbq/

Jake The Rat

Was ist Baseball? :confused:  Wer ist Billy Bean? :gruebel:  Der Gründer von Beantown? :grins:
Gedanken sind nicht stets parat,
man schreibt auch, wenn man keine hat.
(Wilhelm Busch)

CETERVM CENSEO COLORADINEM ET VEGAM ESSE DELENDAM

Flames1848

Zitat von: Jake The Rat am 14. Juli 2012, 13:03:27
B1h8er Tobak... :ee: :gruebel: :up:

Dafür das du Baseball nicht magst....

Was Billy Beane auch im Eishockey bewirkt hat....  :zwinker:
Hövelgriller auf Instagram --> https://www.instagram.com/hoevelgrillerbbq/

GermanNuck

Da ich sie vorher weggelassen habe, hier noch:

Fenwick

Fenwick ist Corsi sehr ähnlich mit dem Unterschied, dass bei der Berechnung für die Fenwickwerte Schüsse, die das Tor verfehlen, nicht miteinbezogen werden, da diese die Schuld des Schützen sind und ohnehin keine Chance haben, einen Weg ins Tor zu finden. Somit ist Fenwick eine bessere Aussage über die defensive Qualität eines Spielers. Fenwick wird allerdings hauptsächlich zur Einschätzung von Teams benutzt und gilt als der momentane Goldstandard der Teamstatistiken. Ähnlich wie beim PDO-Wert kann man gut beurteilen, welche Mannschaften wirklich gut sind, oder nur gerade heissgelaufen sind. Meistens ist es schon nach etwa 40 Spielen möglich, durch Betrachtug der Fenwickwerte die Playoffteams vorauszusagen. Hierzu wird Fenwick Tied verwendet, also das Schussverhältnis (Schüsse + geblockte Schüsse für/gegen) bei Gleichstand.
Zusätzlich gibt es noch:

Fenwick Up1 / Up2: Fenwickwerte bei Führung mit 1 / 2 Toren
Fenwick Down1 / Down2: Fenwickwerte bei Rückstand mit 1 / 2 Toren
Fenwick Close: Fenwickwerte bei engem Spielstand (+/- ein Tor), gewichtet mit der jeweiligen Zeit, in der das Team führte, zurücklag, Gleichstand herrschte

Hier erkennt man auch, wieso diese Statistik so aussagekräftig ist. Alle guten Fenwickteams sind gute Eishockeyteams. Denn, wie man aus der PDO-Regression sehen kann: Es gibt keine Teams die (auf Dauer!) besser schiessen, nur solche die es häufiger tun!

Ausserdem kann man andere Dinge, die man beim Gucken der Spiele beobachtet, in Zahlenwerten ausgedrückt sehen:
Vancouver entspannte sich letzte Saison bei einer Führung deutlich stärker, als dies zum Beispiel Detroit tat.

Finden könnt ihr die Daten hier: http://behindthenet.ca/fenwick_2011.php?sort=1&section=close

Natürlich ist eines völlig klar: Diese Zahlen können das Eishockeyspiel weder völlig erklären, noch ersetzen, was man mit dem blossen Auge sehen kann. Sie können allerdings ein paar Sachen klarmachen, die für den gelegentlichen Beobachter nicht offensichtlich sind.  :grins:

Für diejenigen, denen Nashville als extremes Gegenbeispiel ebenfalls sofort ins Auge gefallen ist: http://blogs.thescore.com/nhl/2012/02/25/why-we-arent-predicting-nashvilles-regression-five-theories/
5 Plus Spieldauer - #fancystats für Deutschland

Jake The Rat

Gedanken sind nicht stets parat,
man schreibt auch, wenn man keine hat.
(Wilhelm Busch)

CETERVM CENSEO COLORADINEM ET VEGAM ESSE DELENDAM

GermanNuck

#2
ah, da hat sich ein Fehler eingeschlichen!  :schaem:
Hier der richtige Link zu PDO http://behindthenet.ca/VAN_2011.html

Und wo man all diese wunderbaren Werte findet: http://www.behindthenet.ca/
5 Plus Spieldauer - #fancystats für Deutschland

GermanNuck

Da ich hier sehr selten etwas über advanced stats gelesen habe, selbst aber sehr von deren Nutzen überzeugt bin, hab' ich beschlossen, mal eine kleine Zusammenfassung zu erstellen! Vielleicht sind ja einige Leute daran interessiert!  :grins:

Corsi

Corsi kann als erweiterte Version der +/-Statistik betrachtet werden. +/- zählt lediglich die Tore und Gegentore bei gleicher Spielerzahl, Corsi verwendet allerdings auch einige andere Spielereignisse wie Schüsse, geblockte Schüsse und Schüsse, die das Tor verfehlen (natürlich jeweils für und gegen den jeweiligen Spieler). Häufig wird auf +/- verwiesen, wenn man die defensive Qualität eines Spielers bemessen will (Oder die sogenannte 'Two-Way' ability). Aufgrund der stetig stark variierenden Zahlenwerte, die auch bei guten Spielern vorkommen, ist dies allerdings keine gute Annahme.

Corsi kann relativ gut als Mass für den Puckbesitz eines Spielers verwendet werden, denn wenn jemand viele Schüsse aufs Tor bringt (oder es versucht), kann man relativ sicher annehmen, dass er die Scheibe in der gegnerischen Hälfte führt. Im Gegenzug, wenn während des Spielers Wechsel lediglich Schüss oder Schussversuche aufs eigene Tor kommen, ist es relativ sicher anzunehmen, dass er einen grossen Teil des Wechsels nicht in Scheibenbesitz verbracht hat!

Es gibt folgende Corsiwerte:
Corsi on - Corsi-Ereignisse für (Schüsse, geblockte Schüsse, Schüsse am Tor vorbei) minus Corsi-Ereignisse gegen hochgerechnet auf 60min Eiszeit
Corsi off - Corsi-Ereignisse für minus Corsi-Ereignisse gegen hochgerechnet auf 60min Eiszeit, wenn der Spieler nicht auf dem Eis ist
Corsi rel - Corsi on minus Corsi off

Wer sieht gut aus:
Spieler, von denen man es erwarten würde, dass sie das Spiel in die richtige Richtung treiben / häufig in Puckbesitz sind: Malkin, Datsyuk, Toews, Sedins, Bergeron, Thornton, Zetterberg, Landeskog, Lucic, Brown, Alfredsson, Chara, Lidström, Josi  :grins:

Wer sieht nicht gut aus:
Spieler, die gegen die Stars der Gegner angesetzt werden und natürlich Spieler in schwachen Mannschaften (hat ja einen Grund, warum diese schwach sind :augenzwinkern: )



Quality of Competition / Quality of Teammates

Um Corsi im richtigen Kontext zu verwenden, muss man natürlich auch betrachten mit wem, gegen wen und wann (weiter unten, bei Offensive-Zone Start %) ein bestimmter Spieler zum Einsatz kommt.
Wie der Name schon sagt, bemisst Quality of Competition die Stärke der Gegner, mit denen man (Spieler X) auf dem Eis steht. Hierbei werden die Corsi Werte der Gegner mit der Eiszeit, die sie mit unserem Spieler X teilen, gewichtet. Quality of Teammates berechnet sich entsprechend durch die gewichteten Corsi-Werte der Mitspieler.
Dies gibt uns eine Aussage, wie ein Spieler verwendet wird. Spielt er gegen die Topreihen der Gegner, oder ist der Coach vorsichtig und lässt ihn nur gegen die 4. Reihe des Gegners raus und spielt er mit starken Mitspielern oder darf er mit der 4. Reihe aufs Eis?
Jemand, der sehr gute Corsi-werte hat, diese aber lediglich gegen schwache Gegner schafft ist nicht so wervoll, wie jemand, der auch gegen sehr starke Gegner das Spiel in die richtige Richtung lenkt (siehe Datsyuk, Pavel).

Spieler wie Nicklas Lidström, Duncan Keith, Dan Hamhuis, Jordan Staal,  etc. müssen gegen die stärksten Gegner ran, behaupten sich aber dennoch sehr gut.
Bei dieser Betrachtung wird auch wieder sehr auffällig, wie stark die Central Division dieses Jahr wirklich war. Bei QoC waren die Werte bei Mannschaften der Central Division sehr hoch!




Offensive Zone Start Percentage

Natürlich spielt es auch eine Rolle, wo ein Spieler eingesetzt wird. Dafür kommt die Offensive-Zone Start Percentage ins Spiel (ab jetzt Ozone%).

Starts im gegnerischen Drittel dividiert durch Starts im gegnerischen Drittel+ Starts im eigenen Drittel

Dies sagt aus, ob die Corsi-Werte eines Spielers durch eine 'Bevorteilung' beeinflusst werden. Das beste Beispiel dafür sind die Sedins. Sie starten einen sehr grossen Anteil ihrer Wechsel im gegnerischen Drittel, dies wirkt sich selbstverständlich sehr positiv auf ihre Corsi-Werte aus, da ihnen dadurch das Erarbeiten der Chancen sehr viel einfacher gemacht wird! Dies erklärt ihre exzellenten Corsi-Werte. Im Gegenzug können Manny Malhotras grauenhafte Corsiwerte dadurch entschuldigt werden, dass er es auf 13% Ozone% bringt, also nur einen sehr geringen Anteil seiner Wechsel im gegnerischen Drittel startet.

Andere Beispiele sind: Patrick Kane, Tomas Holmström, Evgeni Malkin, Jonathan Toews, James Neal, etc. Sie bekommen von ihren Trainer sehr häufig die Chance ihre Wechsel in des Gegners Zone zu beginnen (vernünftigerweise).

Beispiele für sehr defensiv eingesetzte Spieler: Gaustad, Prust, Sutter, Hedman

PDO

PDO (der Name war der damalige Username des Erfinders dieser Statistik, Brian King) ist die Summe der Schussquote und der Fangquote einer Mannschaft, wenn Spieler X auf dem Eis ist. Dieser Wert sollte im Normalfall auf 1000 zurückkommen (Regression zur Mitte für die Mathenerds unter euch  :augenzwinkern:) und das tut er auf beeindruckende Art und Weise. Mit dieser Statistik wurde bereits erfolgreich der Abfall der 09/10er Avalanche, 10/11er Stars und 11/12er Wild vorrausgesagt, da diese zu Beginn der Saison alle einen sehr hohen PDO-Wert hatten, es allerdings klar war, dass sich dieser Wert auf Dauer wieder stabilisieren würde. Durch konstant sehr starke oder schwache Torhüter kann man die Effekte dieses Werts für eine Saison überschatten (bzw. die Mitte erhöhen), aber im Normalfall ist die Regression definitiv nicht zu vernachlässigen. PDO ist ein relativ guter Wert, um das Glück einer Mannschaft zu messen. Hier verweise ich aber gerne auf dieses nette Tool, das die Regression soviel besser ausdrückt, als meine Worte:

http://behindthenet.ca/VAN_2011.html[/size]]http://behindthenet.ca/VAN_2011.html

Hier kann man Mannschaft für Mannschaft, Jahr für Jahr durchgehen, die Ergebnisse sind eindeutig!

Welche Spieler hatten besonders viel Glück: Peverley, Kelly, Bertuzzi, Filppula, Whitney, Vrbata, Fisher, McQuaid

Welche Spieler hatten besonders viel Pech: Niederreiter, Streit, Booth, Steckel, Fowler (hier kommen sehr viele Islanders vor, wie gesagt, schlechte Torhüter können die Regression abschwächen


So, wenn ihr's bis hierhin geschafft habt :up:
Ich hoffe einige von euch fanden das etwas informativ und vielleicht sogar interessant :grins:
5 Plus Spieldauer - #fancystats für Deutschland