Penggemar Astros, jangan baca ini.
…
Yang lainnya: Proyeksi tim tidak setepat yang kita bayangkan. Tim Anda, meskipun tidak diproyeksikan dalam 101(!) menang seperti Astros saat ini di FanGraphs, masih memiliki peluang bagus untuk menghasilkan proyeksi yang Anda lihat di luar sana. Proyeksi tersebut memberi kita gambaran yang sangat umum tentang apa yang mungkin terjadi di musim mendatang, tetapi setelah Anda menjumlahkan semua kesalahan dalam proyeksi setiap pemain di level tim, Anda akan mendapatkan banyak keributan.
Berapa banyak kebisingan? Saya beralih ke Alex Chamberlain, penulis bisbol fantasi pemenang penghargaan di FanGraphs, untuk mendapatkan gambaran tentang seberapa akurat proyeksi tim.
Untuk keperluan pengujian, kami menggunakan proyeksi tim berbasis PECOTA Baseball Prospectus dari tahun 2008 hingga 2017, dan proyeksi tim berbasis Steamer dan Depth Charts dari FanGraphs dari tahun 2014-2017. Proyeksi empat belas musim tidak menghasilkan ukuran sampel yang besar, tetapi proyeksi tim yang tersedia untuk umum belum tersedia secara luas dalam waktu yang lama.
Ada banyak cara berbeda untuk merepresentasikan kesalahan dalam korelasi semacam ini, namun mari kita coba satu pendekatan. Berikut adalah koefisien korelasi antara hasil yang diproyeksikan tim di tingkat tim dalam kumpulan data kami.
- Berat/berat: 0,547
- RS/RS: 0,565
- RA/RA: 0,527
- Rdif / Rdif: 0,581
- Rdif/W: 0,545
Angka-angka di atas merupakan nilai “r” untuk hubungan antara hasil yang diproyeksikan dengan hasil aktual pada setiap kategori. Secara tradisional, r-squared memberi tahu Anda seberapa banyak data kedua dapat memprediksi data pertama. Dengan kata lain, proyeksi tim tahun ini menjelaskan 30% varian kemenangan aktual yang akan terjadi di lapangan. Tidak bagus, Bob.
Sekali lagi, kita melihat bahwa proyeksi memukul lebih mudah daripada proyeksi pitch: 32% dari varians dalam lari tim yang dicetak tahun ini akan diprediksi oleh proyeksi, sementara ini hanya berlaku untuk 28% dari varians dalam lari tim yang diperbolehkan. Hal ini mungkin terjadi karena pelempar lebih sering mengalami cedera dan cedera lebih lama dibandingkan pelempar, namun bisa juga karena pelempar dapat lebih sering mengubah bakat aslinya dengan penambahan lemparan atau pegangan, atau penyempurnaan dalam pendekatannya.
Ada cara lain untuk melaporkan kesalahan dalam kumpulan data, yang menurut saya lebih mudah dipahami dan meyakinkan. Anda dapat mendeskripsikan rentang kesalahan dengan melihat deviasi standar aktual dikurangi proyeksi kemenangan tim. Untuk sampel kami, deviasi standarnya adalah 9,1 kemenangan.
Kedengarannya teknis, tetapi Anda dapat dengan mudah menerjemahkannya ke dalam bahasa yang masuk akal. Pada musim tertentu, dua pertiga tim cenderung:
- Melebihi atau kurang dari total kemenangan yang diproyeksikan sebesar ~9 kemenangan
- Melebihi atau gagal mencapai angka yang diproyeksikan sebesar ~63 angka
- Melebihi atau gagal menjalankan proyeksi yang diizinkan sebanyak ~73 putaran
Karena 95% hasil yang terdistribusi normal berada dalam dua standar deviasi dari rata-rata, Anda juga dapat mengatakan bahwa kemungkinan besar semua kecuali satu tim akan berada dalam 10 kemenangan dari hasil yang diproyeksikan. Itulah yang terjadi sebaiknya memang terjadi, namun masih terdapat penyimpangan ekstrem yang melampaui apa yang disarankan oleh model, dan hal tersebut tidak masalah; itu masih tidak merusak model.
(Editor: Perhitungan dalam posting ini telah diubah untuk mencerminkan deviasi standar dari perbedaan mentah antara total yang diproyeksikan dan aktual, bukan nilai absolut dari perbedaan tersebut. Meskipun angkanya telah berubah – deviasi standar untuk kemenangan, skor lari per permainan, jumlah lari yang diperbolehkan per permainan, dan perbedaan lari semuanya meningkat, yang semakin menggarisbawahi gangguan yang ada dalam proyeksi tim – hasil dan interpretasi umum belum meningkat.)
Mari kita lihat sejenak outlier tahun lalu di kedua sisi.
Tim | Proyek 17 W | Benar-benar 17 W | Perbedaan |
---|---|---|---|
Raksasa | 87 | 64 | -23 |
harimau | 81 | 64 | -17 |
bertemu | 86 | 70 | -16 |
Pembuat bir | 71 | 86 | 15 |
Dback | 77 | 93 | 16 |
The Giants adalah outlier terbesar dalam sampel tahun lalu. Mereka seharusnya baik; sebaliknya, mereka mencatatkan rekor terburuk dalam bisbol. Itulah salah satu alasan mereka saat ini diproyeksikan meraih 83 kemenangan meski tahun lalu sangat buruk. Bagian lain dari itu adalah offseason aktif mereka, termasuk mengambil dua situasi posisi terburuk dalam bisbol – base ketiga dan lapangan kiri – dan meningkatkannya secara signifikan melalui perdagangan.
Tampaknya Brewers mengacaukan sistem proyeksi, karena mereka telah tampil seperti pesaing di luar musim ini meskipun FanGraphs saat ini memproyeksikan mereka untuk 79 kemenangan. Proyeksi lain yang pernah saya lihat menunjukkan Brewers berada di puncak tahun 80an saat ini. Tentu saja mungkin (dan mungkin saja) bahwa sistem proyeksi tim lebih maju dibandingkan sistem yang tersedia untuk umum, memiliki lebih sedikit kesalahan, dan memberikan hasil yang berbeda dari yang kita lihat. Atau mungkin Milwaukee percaya bahwa membangun tim dengan 79 kemenangan dengan varian tinggi, tim yang menurut definisi masih bisa memenangkan 90 pertandingan, adalah cara yang baik untuk berbisnis.
Macan menjadi tua dengan cepat, dan cedera adalah bagian besar dari penurunan mereka, seperti halnya Mets. Risiko cedera tersebut harus dimasukkan ke dalam proyeksi, namun terkadang Anda justru mendapatkan hasil kesehatan terburuk – bahkan lebih buruk daripada prediksi sistem proyeksi yang dilatih untuk memproyeksikan masalah kesehatan pada sebuah tim.
D-back mencetak setengah run lebih banyak per game dan membiarkan setengah run lebih sedikit dari perkiraan yang mereka perkirakan. Dalam berita terkait, mereka diproyeksikan mengalami kemunduran pada musim mendatang, memenangkan 82 pertandingan, setelah menang 93.
Kami memiliki lima tim di sini, padahal kami seharusnya memiliki dua tim jika modelnya sepenuhnya benar. Ada beberapa faktor perancu.
Pertama, distribusi perbedaan antara total kemenangan yang diproyeksikan dan aktual tidak sepenuhnya normal. Terima kasih kepada Chamberlain:
Ada beberapa lonjakan yang menunjukkan bahwa pernyataan bahwa 95% tim berada di antara plus dan minus sepuluh kemenangan tidaklah benar.
Apa yang bisa menyebabkan gangguan seperti ini?
Grid, misalnya, tidak statis. Sebuah sistem mungkin memproyeksikan sebuah tim sebagai tim yang biasa-biasa saja, mereka mungkin saja berubah menjadi biasa-biasa saja…dan kemudian mereka bisa menjual pemain pada tenggat waktu, menjadi lebih buruk, dan kehilangan lebih banyak pertandingan daripada yang dimiliki pemain aslinya. Tim medioker lainnya mungkin memiliki prospek dekat yang diharapkan lebih baik daripada starter tim di posisi tertentu, namun mungkin memutuskan untuk tidak memanggil pemain tersebut, sehingga menghemat waktu servisnya untuk musim yang lebih kompetitif. Sebuah tim yang diharapkan tampil bagus mungkin akan melewati musim yang sulit dan kemudian memilih untuk melakukan operasi pada pemain bintangnya yang sedang sakit alih-alih membiarkannya melakukan rehabilitasi dan kembali ke susunan pemain, sehingga membuat mereka terlihat lebih buruk lagi. Gerakan tunggal seperti itu tidak akan mempengaruhi hasil keseluruhan tim dengan sendirinya, tetapi secara keseluruhan, Anda dapat melihat bagaimana pengambilan keputusan di musim dapat mengubah perhitungan.
Dinamika seperti itulah yang membuat sulit untuk memproyeksikan tim—lebih sulit untuk memproyeksikan kinerja satu pemain, dan itu cukup sulit. Masukkan semua bola yang memantul ke dalam satu ember, dan Anda akan mengalami banyak kekacauan. Jadi kita tidak boleh terlalu terpaku pada proyeksi tim ketika mencoba mencari tahu mengapa tim seperti Brewers, yang diproyeksikan berada di bawah 0,500, sedang berbelanja pemain.
Di sisi lain, proyeksi tim dapat membantu kita mengelompokkan tim dan memahami tindakan. The Braves, misalnya, tampaknya memiliki prospek bagus yang akan segera hadir. Beberapa penggemar mungkin merasa perlu menambah dengan merekrut pemain seperti Jake Arrieta atau Mike Moustakas. Namun mereka diproyeksikan meraih 72 kemenangan. Bahkan jika mereka mendapatkan kebangkitan bersejarah ke arah positif, mereka akan kesulitan bersaing untuk mendapatkan wild card kedua. Masuk akal bagi mereka untuk menunggu sampai sebagian dari bakat itu muncul terlebih dahulu.
Proyeksi mengandung banyak noise saat dibuat. Kita dapat menggunakannya untuk mengkategorikan tim secara luas, namun sebelum kita membahasnya secara lebih rinci, kita perlu mengingat bahwa terdapat error bar yang besar di sekitar proyeksi total kemenangan ini. Seperti biasa, kebenarannya ada di antara keduanya: Proyeksi tim memang berguna, tetapi proyeksi tersebut tidak boleh dianggap sebagai Injil.
(Foto teratas Astros: Foto Rob Tringali/MLB via Getty Images)