Bertahun-tahun yang lalu, Tom Tango merancang sistem prediksi untuk memproyeksikan berbagai statistik dalam bisbol. Dia memanggil sistem “Sistem Prediksi Marcel si Monyet,” karena ini adalah salah satu sistem peramalan paling dasar. Namun, mendasar bukan berarti tidak akurat; model canggih belum membuat perbaikan besar dibandingkan analisis bisbol Marcel. Untuk mendemonstrasikan hal ini, Henry Druschel dari Beyond the Box Score SB Nation dibuat tabel berikut untuk mengevaluasi bagaimana kinerja sistem prediksi terkemuka dalam proyeksi MLB 2016 mereka.
Tabel 1. Rata-rata kesalahan absolut sistem perkiraan bisbol untuk musim 2016
Ada sejumlah upaya dalam mengadaptasi proyeksi Marcel untuk hoki. Dengan menggunakan metodologi yang mirip dengan model asli Tango, kita dapat menggunakan Marcels untuk memproyeksikan skor setiap pemain Sayap Merah untuk musim 2017-2018.
Apa itu proyeksi Marcel?
Sederhananya, proyeksi Marcel dibuat dengan prosedur berikut:
- Ambil hasil historis masing-masing pemain dan timbang berdasarkan waktu terkini. Musim terbaru akan diberi bobot paling besar dan musim lama akan diberi bobot lebih sedikit.
- Kembalikan hasil yang diproyeksikan ke rata-rata berdasarkan ukuran sampel yang tersedia untuk masing-masing pemain. Pemain dengan ukuran sampel kecil akan mengalami regresi ke mean yang lebih banyak dibandingkan pemain dengan ukuran sampel lebih besar.
- Sesuaikan proyeksi akhir dengan usia pemain.
Secara sederhana, kami mengambil seberapa baik seorang pemain bermain baru-baru ini, menurunkan proyeksi mereka ke mean untuk memperhitungkan ukuran sampel, dan kemudian menyesuaikan tingkat skor berdasarkan usia mereka untuk membuat proyeksi untuk musim berikutnya.
Metodologi
Saya akan mengawali bagian ini dengan mengatakan bahwa ini adalah pandangan terbatas terhadap proyeksi Marcel karena kurangnya data yang tersedia. Oleh karena itu, prediksi yang Anda lihat di sini kemungkinan besar kurang akurat dibandingkan evaluasi yang lebih komprehensif dengan Marcels. Meskipun demikian, tujuannya di sini adalah untuk menguraikan bagaimana proyeksi Marcel dilakukan.
Kami akan mendasarkan metodologinya pada metodologi Domenic Galamini Artikel 2015 dibahas Proyeksi Marcel untuk skater. Kami akan fokus pada empat statistik utama 5v5 – tembakan individu ke gawang per 60 menit, persentase tembakan individu, assist individu per 60 menit, dan waktu individu di atas es per pertandingan untuk memproyeksikan skor 5-on-5 untuk penyerang Sayap Merah. Mengingat sampel gol yang relatif kecil, kami akan menggunakan tembakan ke gawang per 60 dan persentase tembakan individu untuk memproyeksikan tendangan gawang di masa depan dibandingkan dengan perolehan gol di masa lalu.
Kami akan menggunakan total bantuan per 60 menit, bukan mengelompokkan bantuan primer dan sekunder, untuk memproyeksikan tingkat bantuan di masa depan, mengingat bias penilaian dan keacakan yang terkait dengan bantuan sekunder. Terakhir, kami dapat memproyeksikan jumlah waktu es yang akan diterima setiap pemain berdasarkan waktu es sebelumnya.
Untuk memulai, kami akan mengambil semua penyerang yang memainkan setidaknya 30 pertandingan pada musim 2013-14, 2014-15 dan 2015-16 dan mereka yang memainkan setidaknya 60 pertandingan pada musim 2016-17. Selanjutnya, kita akan menjalankan regresi multivariat menggunakan musim 2013-14, 2014-15, dan 2015-16 untuk menentukan bobot setiap musim. Koefisien dan nilai p untuk setiap musim dan statistik ditunjukkan di bawah ini.
Tabel 2. Analisis regresi
Kami akan menggunakan koefisien untuk memberi bobot pada setiap musim dengan tepat dan nilai p akan membantu kami menentukan musim mana yang signifikan secara statistik saat memprediksi kinerja di masa depan. Untuk evaluasi ini, nilai p <0,05 dianggap signifikan secara statistik. Catatan: Menariknya, musim 2014-2015 dianggap tidak signifikan ketika memprediksi tembakan ke gawang di masa depan, persentase tembakan individu, dan waktu es. Hal ini mungkin disebabkan oleh ukuran sampel yang lebih kecil yang digunakan dalam penelitian ini dibandingkan dengan upaya Galamini sebelumnya.
Ciri khas Marcel adalah kesederhanaannya, sehingga kita dapat mengambil bobotnya dan membulatkannya ke angka yang lebih sederhana. Jadi, untuk tembakan ke gawang per 60 menit, daripada menggunakan 0,568 dan 0,166, kita cukup menggunakan 6 dan 2 untuk bobotnya.
Tabel 3. Bobot berbentuk bulat
Kini setelah kami memiliki bobot dan mengetahui musim mana yang signifikan secara statistik, kami dapat menimbang hasil terkini setiap pemain dengan tepat. Selanjutnya, kita dapat meregresi perkiraan menjadi mean untuk memperhitungkan ukuran sampel. Intinya, semakin lama seorang pemain bermain di level tertentu, semakin yakin kami bahwa mereka akan terus berada di level tersebut, dengan mempertimbangkan variabel kontekstual lainnya, seperti usia, rekan satu tim, dll. Misalnya, Sidney Crosby telah menjadi pemain elit di NHL untuk waktu yang lama, sehingga hasilnya tidak akan mengalami kemunduran seperti seseorang seperti Andreas Athanasiou, yang memiliki ukuran sampel yang jauh lebih kecil.
Cara yang dapat kami lakukan adalah dengan memberi bobot pada sampel setiap pemain yang tersedia menggunakan bobot yang diperoleh dari regresi multivariat kami. Namun, alih-alih menggunakan koefisien untuk membuat “rata-rata tertimbang”, kami malah akan membuat sampel menit total tertimbang seperti yang dibahas oleh Tom Tango.
Contoh:
Pemain X bermain 500 menit pada 2013-14, 1.000 menit pada 2014-15, dan 750 menit pada 2015-16. Untuk memproyeksikan assist masa depan pemain ini per 60 menit, kami akan mengambil bobot 3-2-2 (dari Tabel 3) dan menerapkannya pada menit bermain untuk membuat “sampel time-on-ice tertimbang” untuk membuat statistik. Untuk membuat sampel tertimbang dan bukan rata-rata tertimbang, kita akan mengalikan dengan 1, 0,667, dan 0,667, bukan 3-2-2 untuk mendapatkan sampel tertimbang. Oleh karena itu, Pemain X memiliki sampel TOI tertimbang (500 x 0,667) + (1000 x 0,667) + (750 x 1) = 1750,5 menit.
Kita dapat menghitung sampel TOI tertimbang untuk setiap pemain untuk setiap statistik yang ingin kita proyeksikan. Untuk mengembalikan prediksi ke nilai rata-rata, kita perlu menambahkan sejumlah menit “kinerja rata-rata liga” ke dalam sampel pemain. Jumlah yang kita perlukan untuk melakukan regresi sampel didasarkan pada korelasi (r) kinerja masa lalu dengan kinerja masa depan. Jika kinerja masa lalu tidak berkorelasi baik dengan kinerja masa depan, kita perlu melakukan regresi perkiraan mendekati nilai rata-rata.
Tabel 4. Sampel yang Ditimbang
Terakhir, kita harus menyesuaikan dengan usia. Salah satu metode untuk melakukan hal ini diuraikan oleh Galamini. Metodenya melibatkan merencanakan perbedaan antara nilai yang diproyeksikan dan nilai aktual untuk statistik terhadap usia pemain dan menggambar garis yang paling sesuai. Dengan menggunakan persamaan garis yang paling sesuai, kami kemudian dapat menyesuaikan prediksi kami dengan mempertimbangkan usia pemain. Namun, dalam evaluasi kami yang terbatas, kami tidak memiliki data yang diperlukan untuk mendapatkan garis akurat yang paling sesuai. Sebagai gantinya, kami akan menggunakan metode Tango, yang juga diadopsi oleh EvolvingWild dia melihat di Kurva Penuaan NHL.
Untuk baseball, penyesuaian penuaan Tango adalah sebagai berikut:
Jika pemain berusia di atas 29 tahun, penyesuaian penuaannya adalah: (29 – usia) x 0,003
Jika pemain berusia di bawah 29 tahun, penyesuaian penuaan adalah: (29 – usia) x 0,006
Untuk hoki, EvolvingWild mengusulkan penggunaan usia 25 tahun, bukan 29 tahun, yang didukung oleh pekerjaan sebelumnya yang menunjukkan bahwa skater NHL mencapai puncaknya sekitar usia 25 tahun.
Dengan penyesuaian terakhir itu, kami sekarang siap untuk mengungkapkan proyeksi terbatas kami untuk mencetak gol Marcel untuk penyerang Sayap Merah.
Tabel 5. Proyeksi skor
Seperti yang Anda lihat dari tabel di atas, Gustav Nyquist memproyeksikan memimpin Wings dengan 2,04 5v5 poin per 60 menit. Ia kini disusul oleh Tomas Tatar (1,95), Andreas Athanasiou (1,94) dan Anthony Mantha (1,94). Meskipun Henrik Zetterberg memimpin sayap tahun lalu dengan 2,65 5v5 poin/60 menit, jumlahnya diperkirakan akan menurun karena ia akan berusia 37 tahun memasuki musim ini.
Ada beberapa keterbatasan pada model Marcel, terutama bahwa pemula dianggap “rata-rata liga” sampai mereka mengumpulkan sampel yang signifikan. Selain itu, Marcels memang sengaja tidak memperhitungkan sejumlah faktor yang dianggap penting, seperti kepelatihan, ukuran pemain, dan lainnya. Pandangan kami di sini bahkan lebih terbatas mengingat data yang tersedia – antara tahun 2013-2014 dan saat ini. Evaluasi yang lebih komprehensif, seperti yang dilakukan Galamini, akan mampu menguji beberapa periode tiga tahun.
Namun demikian, tujuan dari artikel ini adalah untuk membahas sistem proyeksi yang populer dan menunjukkan bagaimana hal itu dapat diterapkan pada hoki dan Sayap Merah. Kali ini kita dapat melihat ke belakang pada tahun 2018 untuk melihat bagaimana kinerja kita!